题名 | 基于VSM模型及N-KMEANS算法的文本聚类; Text clustering Based on VSM model and N-KMEANS Algorithm |
作者 | 黄文颖 |
答辩日期 | 2016-12-23 ; 2016-05-19 |
导师 | 张东站 |
关键词 | VSM模型 N-KMEANS聚类 文本聚类 Vector Space Model N-KMEANS Clustering Text Clustering |
英文摘要 | 文本聚类技术是一门很热门且有前景的技术,由于具有无监督学习的特性,在文本挖掘领域文本聚类的核心思想相对来说比较简单易懂。文本聚类可分为三个大部分:文本预处理、文本表示模型以及聚类算法设计,其中文本表示模型和聚类算法设计这两大部分在现今是很热门的研究方向。文本表示模型影响着将自然语言表示的文本转化成计算机可识别可计算的数学模型的准确性,而聚类算法的设计影响着文本聚类最终结果的质量,国内外很多学者主要从这两方面对文本聚类进行研究和改进。在常用的聚类算法中,K-means算法的运用相对较广泛,然而传统的K-means算法没有稳定的运行结果,且对文本型的数据要求更高,因此,对K-means算法的研究和...; Among all the related advanced technologies, text clustering, a popular and promising one, is relatively easier to handled for its characteristic of self-learning. There are three parts of text clustering: the pretreatment of text, the text expression model and the design of clustering algorithm. Nowaday, text expression models and designs of clustering algorithm are very popular research interest...; 学位:工程硕士; 院系专业:信息科学与技术学院_工程硕士(计算机技术); 学号:23020131153185 |
语种 | zh_CN |
出处 | http://210.34.4.13:8080/lunwen/detail.asp?serial=55324 |
内容类型 | 学位论文 |
源URL | [http://dspace.xmu.edu.cn/handle/2288/135013] ![]() |
专题 | 信息技术-学位论文 |
推荐引用方式 GB/T 7714 | 黄文颖. 基于VSM模型及N-KMEANS算法的文本聚类, Text clustering Based on VSM model and N-KMEANS Algorithm[D]. 2016, 2016. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论