CORC  > 厦门大学  > 信息技术-学位论文
题名PipelineJoin:一种新的基于MapReduce的多表连接算法; PipelineJoin:A New MapReduce-based Multi-table Join Algorithm
作者李雨倩
答辩日期2016-12-23 ; 2016-05-19
导师林子雨
关键词多表连接 MapReduce PipelineJoin multi-table join MapReduce PipelineJoin
英文摘要MapReduce是一种并行分布式计算模型,用于大规模数据集的并行运算。它具有良好的可扩展性、容错性、可用性,现在,无论在工业界还是在学术界都得到了广泛的应用。MapReduce比较热门的一个应用领域是处理大型表的连接操作,其中连接操作广泛应用于日志分析、数据分析处理以及联机分析处理等方面。应用MapReduce模型来处理连接操作,可以大幅度提高连接操作的速度,进而提高了数据分析效率和用户满意度。 现有的基于MapReduce的连接算法,按连接表的数量可以分为两表连接和多表连接两种。目前,针对两表连接的研究优化已经相当成熟,而针对多表连接的算法及其优化仍有很大的改进空间。特别是在处理链式多表...; MapReduce, a parallel and distributed computing model, has been used to process parallel computing for large-scale data sets. It has a good scalability, fault tolerance and availability. Now it has been widely used in industry and academia. And processing join operations for large tables is one of the most popular aspects in MapReduce applications. Join operations are widely used in log analysis, ...; 学位:工学硕士; 院系专业:信息科学与技术学院_计算机科学与技术; 学号:23020131153164
语种zh_CN
出处http://210.34.4.13:8080/lunwen/detail.asp?serial=55138
内容类型学位论文
源URL[http://dspace.xmu.edu.cn/handle/2288/134724]  
专题信息技术-学位论文
推荐引用方式
GB/T 7714
李雨倩. PipelineJoin:一种新的基于MapReduce的多表连接算法, PipelineJoin:A New MapReduce-based Multi-table Join Algorithm[D]. 2016, 2016.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace