CORC  > 厦门大学  > 信息技术-学位论文
题名基于Spark的机器学习平台设计与实现; Desgin and Implementation of Machine Learning Platform based on Spark
作者唐振坤
答辩日期2014 ; 2014
导师林琛
关键词Spark 机器学习 海量数据挖掘 Spark Machine Learning Massive Data Mining
英文摘要随着云计算与分布式集群技术的发展,大数据概念在容量、价值等方面都有了更广的扩展和延伸,机器学习技术近年来也得到了前所未有的重视。本文主要针对传统数据挖掘算法无法处理海量数据,近年来比较流行的MapReduce对机器学习算法不能有效并行化运行等问题,提出基于Spark来构建一个用于大规模机器学习的平台,该平台不仅能够兼容Hadoop集群利用现有计算资源灵活高效地处理海量数据,而且还具有良好的可扩展性,能够满足各类机器学习任务场景的需求。 本文完成了如下几个方面的工作: 论文主要针对机器学习任务中的常见场景,基于Spark平台设计和实现了其中经典的算法,包括并行化的线性回归、支持向量机、KMe...; Accompanied by the development of technologies of cloud computing and distributed cluster, the concept of big data was extended widely and deeply in volume and value, and machine learning that plays an essential role in exploring big data was attracted unprecedented attention in recent years. Traditional data mining algorithms is incapable to deal with massive dataset. MapReduce has been successfu...; 学位:工程硕士; 院系专业:信息科学与技术学院_计算机技术; 学号:23020111153089
语种zh_CN
出处http://210.34.4.13:8080/lunwen/detail.asp?serial=44369
内容类型学位论文
源URL[http://dspace.xmu.edu.cn/handle/2288/84346]  
专题信息技术-学位论文
推荐引用方式
GB/T 7714
唐振坤. 基于Spark的机器学习平台设计与实现, Desgin and Implementation of Machine Learning Platform based on Spark[D]. 2014, 2014.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace