面向高维数据的低冗余Top-k异常点发现方法 | |
陈冠华 ; 马秀莉 ; 杨冬青 ; 唐世渭 ; 帅猛 | |
2009 | |
关键词 | 高维数据 异常度量 异常点发现法 冗余问题 |
英文摘要 | 异常发现是数据挖掘领域的一类重要任务,一直以来受到研究人员的广泛关注。针对高维对象的异常度量问题和异常点集合的冗余问题,本文提出了一种新的面向高维数据的异常点发现方法。该方法通过采用高维数据的二部图表示,以高维对象的压缩能力作为其异常程度的度量,能够有效支持包含多种不同属性的高维数据。为了解决top-k异常点集合中的冗余问题,我们提出了低冗余top-k异常点的概念。由于精确计算低冗余的top-k异常点是NP-hard问题,我们设计了计算近似低冗余的top-k异常点的启发式方法j-AnomaliesHD算法。从在真实和人工数据集上的实验结果可以看出,该方法不仅具有较好的扩展性,而且与不考虑冗余的异常点发现方法相比较,能够更有效地概括数据中的异常模式。; 0 |
语种 | 中文 |
内容类型 | 其他 |
源URL | [http://ir.pku.edu.cn/handle/20.500.11897/230076] ![]() |
专题 | 信息科学技术学院 |
推荐引用方式 GB/T 7714 | 陈冠华,马秀莉,杨冬青,等. 面向高维数据的低冗余Top-k异常点发现方法. 2009-01-01. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论