CORC  > 清华大学
基于样本空间分布密度的初始聚类中心优化K-均值算法
谢娟英 ; 郭文娟 ; 谢维信 ; 高新波
刊名http://epub.edu.cnki.net/grid2008/brief/detailj.aspx?filename=JSYJ201203025&dbname=CJFQTEMP
2012-04-27 ; 2012-04-27
关键词聚类 K-均值聚类 初始中心 邻域 样本分布密度
中文摘要针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类。UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能。基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法。
语种中文
其他责任者陕西师范大学计算机科学学院 ; 西安电子科技大学电子工程学院 ; 深圳大学信息工程学院ATR国家重点实验室
内容类型期刊论文
源URL[http://ir.calis.edu.cn/hdl/244041/643]  
专题清华大学
推荐引用方式
GB/T 7714
谢娟英,郭文娟,谢维信,等. 基于样本空间分布密度的初始聚类中心优化K-均值算法[J]. http://epub.edu.cnki.net/grid2008/brief/detailj.aspx?filename=JSYJ201203025&dbname=CJFQTEMP,2012, 2012.
APA 谢娟英,郭文娟,谢维信,&高新波.(2012).基于样本空间分布密度的初始聚类中心优化K-均值算法.http://epub.edu.cnki.net/grid2008/brief/detailj.aspx?filename=JSYJ201203025&dbname=CJFQTEMP.
MLA 谢娟英,et al."基于样本空间分布密度的初始聚类中心优化K-均值算法".http://epub.edu.cnki.net/grid2008/brief/detailj.aspx?filename=JSYJ201203025&dbname=CJFQTEMP (2012).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace