多重巨量資料處理平台之整合與最佳化技術 = Integration an...
國立高雄大學資訊工程學系碩士班

 

  • 多重巨量資料處理平台之整合與最佳化技術 = Integration and Optimization Technologies for Multiple Big Data Processing Platforms
  • 紀錄類型: 書目-語言資料,印刷品 : 單行本
    並列題名: Integration and Optimization Technologies for Multiple Big Data Processing Platforms
    作者: 蔡允哲,
    其他團體作者: 國立高雄大學
    出版地: [高雄市]
    出版者: 撰者;
    出版年: 2014[民103]
    面頁冊數: 63葉部分彩圖,表 : 30公分;
    標題: 分散式記憶體儲存
    標題: distributed memory storage
    電子資源: https://hdl.handle.net/11296/5ydc5c
    附註: 108年10月31日公開
    附註: 參考書目:葉53-54
    摘要註: 本研究的目的在基於雲端計算架構上的建置一套具有高效能、高可用性、高擴展性的多重巨量資料處理平台,透過整合Apache Hive、Cloudera Impala及BDAS Shark使平台在巨量資料的環境下支援SQL命令快速檢索能力。首先,透過本研究所設計的最佳化程式,可以讓使用者透過單一的存取介面後,由程式自動選擇執行效能最佳的巨量資料倉儲平台進行運算。再者,利用Memcached分散式記憶體儲存系統和Apache Hadoop中的HDFS分散式檔案系統對已查詢結果進行快取,此後若是輸入相同的SQL查詢命令則會透過此高效能的快取系統直接取得檢索結果,避免巨量資料倉儲平台重複執行相同命令所導致的冗長檢索時間。透過上述兩項機制可使整體效能有顯著性的提升,尤其對於多人使用環境下執行重複性高的SQL命令,更能大幅縮短檢索所需的時間。 The objective of this study is to realize a multiple big data processing platform with high performance and high availability. The integration of Apache Hive, Cloudera Impala, and BDAS Shark make the platform support SQL query in big data environment. In addition, users can access a single interface and select the best performance of big data warehouse platform automatically by the optimizer proposed in this research. Distributed memory storage system Memcached along with distributed file system Apache Hadoop HDFS is employed for caching query results. Thereafter, if user gives the same SQL query command, user is able to get the same result rapidly from the high-performance cache system so as to avoid a longer retrieval time when suffering the repeated searches in big data warehouse platform. The proposed approach definitely improves the overall performance significantly, and especially the application of the high repeatable SQL commands with multi-user mode makes it possible to reduce the time for query/response dramatically.
館藏
  • 2 筆 • 頁數 1 •
 
310002877895 博碩士論文區(二樓) 不外借資料 學位論文 TH 008M/0019 464103 4425 2014 一般使用(Normal) 在架 0
310002877903 博碩士論文區(二樓) 不外借資料 學位論文 TH 008M/0019 464103 4425 2014 c.2 一般使用(Normal) 在架 0
  • 2 筆 • 頁數 1 •
多媒體
評論
Export
取書館別
 
 
變更密碼
登入