基于VSM模型及N-KMEANS算法的文本聚类

CORC > 厦门大学 > 信息技术－学位论文

题名	基于VSM模型及N-KMEANS算法的文本聚类; Text clustering Based on VSM model and N-KMEANS Algorithm
作者	黄文颖
答辩日期	2016-12-23 ; 2016-05-19
导师	张东站
关键词	VSM模型 N-KMEANS聚类文本聚类 Vector Space Model N-KMEANS Clustering Text Clustering
英文摘要	文本聚类技术是一门很热门且有前景的技术，由于具有无监督学习的特性，在文本挖掘领域文本聚类的核心思想相对来说比较简单易懂。文本聚类可分为三个大部分：文本预处理、文本表示模型以及聚类算法设计，其中文本表示模型和聚类算法设计这两大部分在现今是很热门的研究方向。文本表示模型影响着将自然语言表示的文本转化成计算机可识别可计算的数学模型的准确性，而聚类算法的设计影响着文本聚类最终结果的质量，国内外很多学者主要从这两方面对文本聚类进行研究和改进。在常用的聚类算法中，K-means算法的运用相对较广泛，然而传统的K-means算法没有稳定的运行结果，且对文本型的数据要求更高，因此，对K-means算法的研究和...; Among all the related advanced technologies, text clustering, a popular and promising one, is relatively easier to handled for its characteristic of self-learning. There are three parts of text clustering: the pretreatment of text, the text expression model and the design of clustering algorithm. Nowaday, text expression models and designs of clustering algorithm are very popular research interest...; 学位：工程硕士; 院系专业：信息科学与技术学院_工程硕士(计算机技术); 学号：23020131153185
语种	zh_CN
出处	http://210.34.4.13:8080/lunwen/detail.asp?serial=55324
内容类型	学位论文
源URL	[http://dspace.xmu.edu.cn/handle/2288/135013]
专题	信息技术－学位论文
推荐引用方式 GB/T 7714	黄文颖. 基于VSM模型及N-KMEANS算法的文本聚类, Text clustering Based on VSM model and N-KMEANS Algorithm[D]. 2016, 2016.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们