CORC  > 新疆天文台  > 研究单元未命名  > 计算机技术室
海量数据的网格启发信息密度聚类算法
张海龙; 王仁彪; 聂俊; 刘进忠
刊名吉林大学学报(工学版)
2011-09
卷号41期号:S2页码:254-258
关键词计算机应用 聚类 网格密度 平方误差密度
ISSN号1671-5497
通讯作者wrbiao@jlu.edu.cn
中文摘要提出了一种基于网格密度的混合聚类算法。该算法使用平方误差密度函数作为密度评估标准,避免了传统密度算法由于Eps和MinPts设置不当给聚类效果带来的不稳定因素。提出了动态邻域半径策略,解决了传统密度算法采用全局静态邻域半径造成的聚类偏差问题。对空间区域内的所有结点设置网格密度启发信息。在进行数据结构构造和邻域半径计算时,只需计算对应网格区域内结点,从而降低了计算成本;在进行区域查询时,只选择符合条件的代表对象进行扩展,从而减少了查询次数,节省了程序运行时间。对Pendigits数据集和SE-QUOIA 2000数据库进行测试,结果表明:提出的基于网格密度的混合快速聚类算法在海量数据聚类精度、聚类时间以及聚类稳定性上要优于传统的聚类算法。
学科主题天文仪器、天文技术与数据
收录类别EI ; CSCD
资助信息国家自然科学基金面上项目(10973026);“西部之光”博士资助项目(XBBS201023、XBBS2011022);“新视野”国家正确认识天文台和美国邓普顿基金联合项目(100020101);新疆自治区科学基金面上项目(2011211A104)
原文出处http://xuebao.jlu.edu.cn/gxb/CN/volumn/home.shtml
语种中文
公开日期2014-12-12
内容类型期刊论文
源URL[http://ir.xao.ac.cn/handle/45760611-7/436]  
专题新疆天文台_计算机技术室
新疆天文台_光学天文与技术应用研究室
科技计划处
推荐引用方式
GB/T 7714
张海龙,王仁彪,聂俊,等. 海量数据的网格启发信息密度聚类算法[J]. 吉林大学学报(工学版),2011,41(S2):254-258.
APA 张海龙,王仁彪,聂俊,&刘进忠.(2011).海量数据的网格启发信息密度聚类算法.吉林大学学报(工学版),41(S2),254-258.
MLA 张海龙,et al."海量数据的网格启发信息密度聚类算法".吉林大学学报(工学版) 41.S2(2011):254-258.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace