CORC  > 兰州理工大学  > 兰州理工大学
题名基于R+Hadoop中药材大数据的分析及预测
作者王莎莎
答辩日期2016
导师朱昶胜
关键词中药材 Hadoop R语言 Hive 决策树 随机森林
学位名称硕士
英文摘要甘肃惠森药业数据中心累计收集和存储数据近70GB,随着业务的深入,其数据量更是呈现出爆炸式的增长趋势。面对如此巨大的数据压力,Hadoop框架虽然对海量中药材数据的处理具有独特的优势,但缺乏数据建模和数据可视化的能力。因此,本文结合Hadoop框架和R语言的优势,根据中药材行情大数据的特点,针对中药材市场品种需求变化难以掌握、价格波动很大等现状,设计并完成基于Hadoop+R语言中药材行情大数据的分析及预测,以达到对中药材行情大数据可靠处理的目的,对加快甘肃中药材产业发展,抵御交易市场的风险有重要意义。本文主要研究内容如下:(1)部署了Hadoop集群环境、R环境和Hive集成云开发环境,提出了一种基于R语言+Hadoop解决中药材行情大数据分析及预测的方法,研究了基于R语言+Hadoop+Hive环境的数据分析及可视化过程。(2)对Hadoop框架的基本原理及内部架构进行了深入的研究,从软件编写入手,通过改进Map Reduce编程模型固有的读写方式、分片划分以及输入输出格式,提高编程模型的计算性能。(3)为完成中药材行情大数据和天气数据两种不同格式数据源的连接,提出了一种基于Had... 更多
语种中文
页码66
URL标识查看原文
内容类型学位论文
源URL[http://ir.lut.edu.cn/handle/2XXMBERH/91920]  
专题兰州理工大学
作者单位兰州理工大学
推荐引用方式
GB/T 7714
王莎莎. 基于R+Hadoop中药材大数据的分析及预测[D]. 2016.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace