基于主动数据选取的半监督聚类算法 | |
文平; 冷明伟; 陈晓云 | |
刊名 | 计算机应用研究 |
2012-08-15 | |
期号 | 8页码:2841-2844 |
关键词 | 数据挖掘 半监督聚类 主动学习 标签数据 数据选取 最小生成树 多密度数据集 不平衡数据集 |
中文摘要 | 利用少量标签数据获得较高聚类精度的半监督聚类技术是近年来数据挖掘和机器学习领域的研究热点。但是现有的半监督聚类算法在处理极少量标签数据和多密度不平衡数据集时的聚类精度比较低。基于主动学习技术研究标签数据选取,提出了一个新的半监督聚类算法。该算法结合最小生成树聚类和主动学习思想,选取包含信息较多的数据点作为标签数据,使用类KNN思想对类标签进行传播。通过在UCI标准数据集和模拟数据集上的测试,结果表明提出的算法比其他算法在处理多密度、不平衡数据集时有更高精度且稳定的聚类结果。 |
语种 | 中文 |
内容类型 | 期刊论文 |
源URL | [http://ir.lzu.edu.cn/handle/262010/128086] |
专题 | 信息科学与工程学院_期刊论文 |
推荐引用方式 GB/T 7714 | 文平,冷明伟,陈晓云. 基于主动数据选取的半监督聚类算法[J]. 计算机应用研究,2012(8):2841-2844. |
APA | 文平,冷明伟,&陈晓云.(2012).基于主动数据选取的半监督聚类算法.计算机应用研究(8),2841-2844. |
MLA | 文平,et al."基于主动数据选取的半监督聚类算法".计算机应用研究 .8(2012):2841-2844. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论