CORC  > 厦门大学  > 信息技术-学位论文
题名高维数据的聚类方法研究与应用; Research on Clustering Methods for High Dimensional Data and Their Applications
作者陈黎飞
答辩日期2009 ; 2008
导师姜青山
关键词高维数据 子空间聚类 聚类有效性 信息安全 High dimensional data Subspace clustering Cluster validity Information security
英文摘要聚类分析是数据挖掘中重要的研究课题,在信息过滤、资料自动分类、生物信息学等领域得到广泛应用。随着技术进步,聚类分析许多应用领域的数据具有很高的维度,例如,各种类型的文档数据、基因表达数据等其维度(属性)可以达到成百上千维,甚至更高。由于高维数据存在的普遍性,高维数据的聚类分析具有非常重要的意义。 数据在高维空间中的表现相对于低维空间有很大的差异。在高维空间的许多情况下,由于数据分布的内在稀疏性,低维数据聚类常用的Lp距离等相似度度量有效性大大降低;高维空间中簇类往往只存在于某些低维子空间中,而不同的簇类其所处的子空间也可能存在差异。受“维度效应”的影响,许多在低维数据上表现良好的聚类方法运用...; Clustering analysis is an important research in data mining, and has been widely used in many fields, such as message filtering, document categorization, bioinformatics, etc. In those fields, the data are always of high dimensions. For examples, the document data and gene microarray data are generated in several hundreds or even a thousand attributes (or dimensions). The universality of these data...; 学位:理学博士; 院系专业:信息科学与技术学院计算机科学系_基础数学; 学号:20051403200
语种zh_CN
出处http://210.34.4.13:8080/lunwen/detail.asp?serial=18463
内容类型学位论文
源URL[http://dspace.xmu.edu.cn/handle/2288/51327]  
专题信息技术-学位论文
推荐引用方式
GB/T 7714
陈黎飞. 高维数据的聚类方法研究与应用, Research on Clustering Methods for High Dimensional Data and Their Applications[D]. 2009, 2008.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace