利用樹狀結構探勘完整語意項目集 = Mining Complete Li...
國立高雄大學資訊工程學系碩士班

 

  • 利用樹狀結構探勘完整語意項目集 = Mining Complete Linguistic Itemsets Based on Tree Structures
  • 紀錄類型: 書目-語言資料,印刷品 : 單行本
    並列題名: Mining Complete Linguistic Itemsets Based on Tree Structures
    作者: 林宗慶,
    其他團體作者: 國立高雄大學
    出版地: [高雄市]
    出版者: 撰者;
    出版年: 民100
    面頁冊數: 125葉圖,表格 : 30公分;
    標題: 資料探勘
    標題: data mining
    電子資源: http://handle.ncl.edu.tw/11296/ndltd/34536519581587750767
    附註: 參考書目:葉105-111
    附註: 內容為英文
    摘要註: 隨著資訊科技快速的發展,電腦能夠處理以及儲存的資料量也大幅的提升,如何從大量的資料當中找出隱藏的資訊以利於制定決策,是一個新的挑戰。近年來,資料探勘技術經常被使用於從大型資料庫中發現有用的資訊與知識。在資料探勘的研究領域中,關聯規則探勘是一個相當常見的討論議題。過去已經有許多關於關聯規則探勘的演算法被提出,但是大部分的演算法都只能夠處理二元的資料庫。然而,量化型的交易資料在現實的應用中是較為常見的。因此,許多關聯規則探勘的研究加入模糊理論的概念來有效地處理量化型資料庫以及獲得語意型式的關聯規則。本篇論文中,我們提出了三種演算法用來從量化型資料庫中探勘出完整的模糊頻繁項目集,其分別是多重模糊頻繁樣式樹(MFFP-tree)、壓縮多重模糊頻繁樣式樹(CMFFP-tree)、以及採用上限之多重模糊頻繁樣式樹(UBMFFP-tree)。在這三種演算法中,我們採用多重模糊區域的方式來表示該項目數量,取代過去只利用單一模糊區域表示的方式,因此能夠獲得完整的模糊頻繁項目集。另外本論文的實驗採用多個不同的資料庫來評估所提出的三種演算法的效能。在效能的評估比較中,我們所提出的演算法顯示出在時間與空間的複雜度上可以取得一個好的權衡。最後,我們也提出一種整合式的多重模糊頻繁樣式樹(iMFFP-tree)演算法。此演算法可以將多棵來自不同資料庫的多重模糊頻繁樣式樹整合成一棵完整的多重模糊頻繁樣式樹,以方便決策者可以直接從整合後的樹中獲得全面性的關聯規則。 Information technology (IT) has recently progressed very rapidly, and the capacity to process and store data in databases has substantially grown. Extraction of implicit information from a lot of data to aid decision making has thus become a new challenge. Data mining technology is usually used to discover useful information and knowledge from large databases. In data-mining research areas, finding association rules is considered as one of the most common topics. In the past, many algorithms of mining association rules have been proposed. Most of them focused on processing only binary variables in databases. Transactions with quantitative values are, however, commonly seen in real-world applications. The fuzzy-set theory is then used for efficiently handling them and deriving linguistic association rules. In this thesis, three algorithms for deriving complete fuzzy frequent itemsets from quantitative databases are proposed. They are multiple fuzzy FP-tree (MFFP-tree) algorithm, compressed multiple fuzzy FP-tree (CMFFP-tree) algorithm, and upper-bound multiple fuzzy FP-tree (UBMFFP-tree) algorithm, respectively. In all the three algorithms above, more than one fuzzy region, instead of only one region, are used to represent an item, thus being able to derive complete fuzzy frequent itemsets. Experiments are also made to compare the performance of the three proposed algorithms. The experimental results show that the proposed algorithms can achieve a good trade-off between execution time and tree complexity. In addition, we propose an integrated MFFP (iMFFP) tree algorithm for merging several individual MFFP trees into an integrated one. It can help derive global association rules from distributed databases.
館藏
  • 2 筆 • 頁數 1 •
 
310002131640 博碩士論文區(二樓) 不外借資料 學位論文 TH 008M/0019 464103 4430 2011 一般使用(Normal) 在架 0
310002131657 博碩士論文區(二樓) 不外借資料 學位論文 TH 008M/0019 464103 4430 2011 c.2 一般使用(Normal) 在架 0
  • 2 筆 • 頁數 1 •
評論
Export
取書館別
 
 
變更密碼
登入