CORC  > 北京大学  > 信息科学技术学院
数据立方体切片的核心聚类分析方法
姜力争 ; 杨冬青 ; 唐世渭 ; 马秀莉 ; 张德辉
2006
关键词数据挖掘 聚类 数据立方体 切片
英文摘要对立方体数据的分析挖掘由于具有广泛的现实应用而日益得到人们的重视.基于对立方体切片数据的分析应用问题,提出了一种新的核心聚类分析方法.核心聚类分析主要针对传统聚类模型得到的结果类簇不够紧密和需要预先定义类簇的数目等不足之处,而点对敏感聚类模型(pair-wise cluster)算法复杂度是NP难的问题而设计.核心聚类模型将数据集合中的点划分为若干不相交的核心点集和边界点集,同一核心点集内任意点对的相似度大于阈值σ,而不同核心点集的点对相似度小于阈值σ.核心聚类模型挖掘出的核心点集是紧密类簇,并且具备良好的分类性质.由于采用了局部优化算法,核心聚类模型的算法复杂度为O(n2),较点对敏感的最大相关成员簇聚类模型大大降低.同时,可以通过核心点集和边界点集构造最大相关成员簇的上界,这就在一定程度上保证了核心聚类模型结果的完备性.实验和分析对比说明核心聚类模型具有较高的算法效率,可扩展性强,结果表示合理,能够很好地解决现实应用问题.; 0
语种中文
内容类型其他
源URL[http://ir.pku.edu.cn/handle/20.500.11897/217244]  
专题信息科学技术学院
推荐引用方式
GB/T 7714
姜力争,杨冬青,唐世渭,等. 数据立方体切片的核心聚类分析方法. 2006-01-01.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace