CORC  > 北京大学  > 信息科学技术学院
云环境中一种面向海量稀疏数据存储的缺失值处理方法
Chen Yuxin ; Cheng Xu ; Zhao Peng ; Meng Biping ; Li Hongyan ; Wang Tengjiao ; 陈郁馨 ; 程序 ; 赵鹏 ; 孟必平 ; 李红燕 ; 王腾蛟
2012
关键词海量稀疏数据 缺失值处理 算法优化 性能测试
英文摘要如何处理缺失值一直是数据库领域中一个值得关注的问题,缺失值问题的研究对于提高运算效率和保证系统健壮性具有重要意义。云环境中海量数据的稀疏性使缺失值问题变的更加突出,现有的处理方法要么语义表达能力有限,要么未考虑到云环境对其的影响。针对这些问题,提出了一种面向海量稀疏数据存储的缺失值处理方法:首先结合现实的云环境应用,把缺失值归纳为未知值和不存在值两类;其次基于该语义定义了算术运算及比较运算;然后利用规约的方法降低四值逻辑的复杂性,以定义其逻辑运算。最后在真实的大规模稀疏数据集上进行了多组实验,证明了所提出的缺失值语义具有较好的语义表达能力和存储性能。; 0
语种中文
内容类型其他
源URL[http://ir.pku.edu.cn/handle/20.500.11897/272518]  
专题信息科学技术学院
软件与微电子学院
推荐引用方式
GB/T 7714
Chen Yuxin,Cheng Xu,Zhao Peng,等. 云环境中一种面向海量稀疏数据存储的缺失值处理方法. 2012-01-01.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace