在靜態與串流資料中的高效率間接關聯探勘 = Efficient Mini...
國立高雄大學資訊工程學系碩士班

 

  • 在靜態與串流資料中的高效率間接關聯探勘 = Efficient Mining of Indirect Associations from Static Data and Streaming Data
  • 紀錄類型: 書目-語言資料,印刷品 : 單行本
    並列題名: Efficient Mining of Indirect Associations from Static Data and Streaming Data
    作者: 陳憶清,
    其他團體作者: 國立高雄大學
    出版地: [高雄市]
    出版者: 撰者;
    出版年: 民99[2010]
    面頁冊數: 74面圖,表 : 30公分;
    標題: 串流資料探勘
    標題: Data stream mining
    電子資源: http://handle.ncl.edu.tw/11296/ndltd/70528030718627659600
    摘要註: 間接關聯是一種新型態的非高頻率樣式,用來提供一種對於非高頻率樣式的新解釋,並且可以有效的減少哪些我們不感興趣的非高頻率樣式。間接關聯的概念是間接地連結兩個很少一起出現的項目,而這個連結是透過一個叫”中間項” (mediator)的項目來連結。如果適當地運用它,可以幫助我們從資料庫中識別真正有趣的非高頻率項目對(infrequent itempairs)。目前所有的研究都僅限於在靜態資料的環境中探勘間接關聯,還沒有研究是針對在串流資料的環境裡探勘間接關聯。在這篇論文中,我們提出三個有效的方法演算法來探勘間接關聯,包括針對靜態資料的EMIA演算法,以及針對串流資料的MIA-LM及EMIA-LM演算法。我們提出的MIA-LM及EMIA-LM演算方法不僅有效率而且還保證在串流環境中高頻項目的錯誤率不會超過使用者設定的錯誤率。經過使用合成及真實的資料集進行實驗分析,其結果都顯示我們提出的演算法是有效且效率極佳的方法。 Indirect association is a new type of infrequent pattern, which provides a new way for interpreting the value of infrequent patterns and can effectively reduce the number of uninteresting infrequent patterns. The concept of indirect association is to “indirectly” connect two rarely co-occurred items via a frequent itemset called mediator, and if appropriately utilized it can help to identify real interesting “infrequent itempairs” from databases. All of the literature on indirect association mining, to our best knowledge, is confined to the traditional, relatively static database environment; no research work has been conducted on mining indirect associations over data streams. In this thesis, we propose three very efficient approaches, one, namely EMIA (Efficient Mining of Indirect Association), for mining indirect associations on static data, and two, namely MIA-LM and EMIA-LM, for streaming data. We also show that the proposed MIA-LM and EMIA-LM algorithms can not only discover indirect associations over data streams efficiently, but also guarantee the error of derived itemsets not exceeding a user-specified threshold. Experiments on real world streaming datasets are also made to show the effectiveness of the proposed approaches.
館藏
  • 2 筆 • 頁數 1 •
 
310002026733 博碩士論文區(二樓) 不外借資料 學位論文 TH 008M/0019 464103 7593 2010 一般使用(Normal) 在架 0
310002026741 博碩士論文區(二樓) 不外借資料 學位論文 TH 008M/0019 464103 7593 2010 c.2 一般使用(Normal) 在架 0
  • 2 筆 • 頁數 1 •
評論
Export
取書館別
 
 
變更密碼
登入