题名 | 高维数据的聚类方法研究与应用; Research on Clustering Methods for High Dimensional Data and Their Applications |
作者 | 陈黎飞 |
答辩日期 | 2009 ; 2008 |
导师 | 姜青山 |
关键词 | 高维数据 子空间聚类 聚类有效性 信息安全 High dimensional data Subspace clustering Cluster validity Information security |
英文摘要 | 聚类分析是数据挖掘中重要的研究课题,在信息过滤、资料自动分类、生物信息学等领域得到广泛应用。随着技术进步,聚类分析许多应用领域的数据具有很高的维度,例如,各种类型的文档数据、基因表达数据等其维度(属性)可以达到成百上千维,甚至更高。由于高维数据存在的普遍性,高维数据的聚类分析具有非常重要的意义。 数据在高维空间中的表现相对于低维空间有很大的差异。在高维空间的许多情况下,由于数据分布的内在稀疏性,低维数据聚类常用的Lp距离等相似度度量有效性大大降低;高维空间中簇类往往只存在于某些低维子空间中,而不同的簇类其所处的子空间也可能存在差异。受“维度效应”的影响,许多在低维数据上表现良好的聚类方法运用...; Clustering analysis is an important research in data mining, and has been widely used in many fields, such as message filtering, document categorization, bioinformatics, etc. In those fields, the data are always of high dimensions. For examples, the document data and gene microarray data are generated in several hundreds or even a thousand attributes (or dimensions). The universality of these data...; 学位:理学博士; 院系专业:信息科学与技术学院计算机科学系_基础数学; 学号:20051403200 |
语种 | zh_CN |
出处 | http://210.34.4.13:8080/lunwen/detail.asp?serial=18463 |
内容类型 | 学位论文 |
源URL | [http://dspace.xmu.edu.cn/handle/2288/51327] |
专题 | 信息技术-学位论文 |
推荐引用方式 GB/T 7714 | 陈黎飞. 高维数据的聚类方法研究与应用, Research on Clustering Methods for High Dimensional Data and Their Applications[D]. 2009, 2008. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论