分群效度指標的評估分析與設計 = A Study on the Desi...
國立高雄大學電機工程學系碩士班

 

  • 分群效度指標的評估分析與設計 = A Study on the Design and Comparisons of Clustering Validity Indexes
  • 紀錄類型: 書目-語言資料,印刷品 : 單行本
    並列題名: A Study on the Design and Comparisons of Clustering Validity Indexes
    作者: 陳俐雯,
    其他團體作者: 國立高雄大學
    出版地: [高雄市]
    出版者: 撰者;
    出版年: 2012[民101]
    面頁冊數: 115面圖,表格 : 30公分;
    標題: 集群分析
    標題: clustering analysis
    電子資源: http://handle.ncl.edu.tw/11296/ndltd/46404025701060606893
    附註: 104年10月31日公開
    附註: 參考書目:面103-106
    摘要註: 集群分析(clustering analysis)中最重要的問題之一,是如何決定最適當的分群數,這通常可以透過該領域的專家或是使用分群效度指標(clustering validity index)評估分群結果。本研究以質量中心(centroid)為基礎的分割分群演算法(partitional clustering algorithms)視為研究對象,探討這類分群方式的分群效度指標成效,並發展新的分群效度指標。一般的分群效度指標常考慮兩質量中心或兩資料點間的最小或最大距離作為該分群效度指標的主要成分。但當分群結果中有兩個質量中心相當靠近時,會導致很極端的評估結果,造成分群效度指標在不同群數設定下的行為不穩定。本研究針對此問題提出一個新的分群效度指標,在其中加入了中位數的概念,同時考慮最小距離與平均分群結果做為分群效度指標的主要評估成分,可以改善距離過小所造成的極端與不穩定現象。本論文使用K 平均分群演算法和模糊C 平均分群演算法進行資料分群,測試資料包含9 種人造資料集、3 種UCI 資料集、9 張不同類型的影像。本論文提出2 種分群效度指標,並與18 種已存在的分群效度指標比較,評估K 平均分群演算法和模糊C 平均分群演算法在不同的分群效度指標的表現。實驗結果顯示,本研究所提出的分群效度指標在不同分群演算法和各種類型的資料集中都提供良好表現和穩定性。 An important issue in clustering analysis is to determine the number of clusters, which isusually approved by domain experts or evaluated by clustering validity indexes. In this study,the effectiveness of clustering validity indexes for centroid-based partitional clusteringalgorithms is discussed and a new clustering validity index is designed. General-purposedclustering validity indexes usually take the maximum/minimum distance between twodata/centroids as an important evaluation factor. But when two centroids are allocated closely,such indexes may present instable results. The clustering validity index proposed in this studyis termed as WLI, which considers the median distances and the minimum distances amongdata/centroids. The WLI index has stable performance even when two centroids are allocatedclosely. In this thesis, the k-means (KM) and fuzzy c-means (FCM) clustering algorithms areemployed and evaluated. The performance of WLI and 18 existing clustering validity indexesare evaluated and compared on various data sets, including nine artificial data sets, three UCIdata sets, and nine images. The experimental results show that WLI has accurate and stableperformance than other indexes.
評論
Export
取書館別
 
 
變更密碼
登入