基于样本空间分布密度的初始聚类中心优化K-均值算法

CORC > 清华大学

	基于样本空间分布密度的初始聚类中心优化K-均值算法
	谢娟英 ; 郭文娟 ; 谢维信 ; 高新波
刊名	http://epub.edu.cnki.net/grid2008/brief/detailj.aspx?filename=JSYJ201203025&dbname=CJFQTEMP
	2012-04-27 ; 2012-04-27
关键词	聚类 K-均值聚类初始中心邻域样本分布密度
中文摘要	针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类。UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能。基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法。
语种	中文
其他责任者	陕西师范大学计算机科学学院 ; 西安电子科技大学电子工程学院 ; 深圳大学信息工程学院ATR国家重点实验室
内容类型	期刊论文
源URL	[http://ir.calis.edu.cn/hdl/244041/643]
专题	清华大学
推荐引用方式 GB/T 7714	谢娟英,郭文娟,谢维信,等. 基于样本空间分布密度的初始聚类中心优化K-均值算法[J]. http://epub.edu.cnki.net/grid2008/brief/detailj.aspx?filename=JSYJ201203025&dbname=CJFQTEMP,2012, 2012.
APA	谢娟英,郭文娟,谢维信,&高新波.(2012).基于样本空间分布密度的初始聚类中心优化K-均值算法.http://epub.edu.cnki.net/grid2008/brief/detailj.aspx?filename=JSYJ201203025&dbname=CJFQTEMP.
MLA	谢娟英,et al."基于样本空间分布密度的初始聚类中心优化K-均值算法".http://epub.edu.cnki.net/grid2008/brief/detailj.aspx?filename=JSYJ201203025&dbname=CJFQTEMP (2012).