CORC  > 厦门大学  > 信息技术-学位论文
题名基于中文Web文本的分类研究与系统实现; The Research and System Implementation of Classification Based on Chinese Web Text
作者义天鹏
答辩日期2014 ; 2013
导师陈启安
关键词网络文本 文本分类 支持向量机 Web Text Text Classification Support Vector Machine
英文摘要随着计算机网络技术的发展,网络信息变得越来越海量,同时也越来越复杂,人们在浏览网页新闻时能否快速找到自己感兴趣的类别是判别该网站优劣的一个重要标准,传统的是靠人工方法对网页文本进行分类,面对如今的海量信息依靠人工分类的方案变得不可行,因此文本自动分类技术应运而生。又由于中文文本相对于英文文本的特殊性,一些传统的分类算法并不完全适用于中文文本,中文文本分类之前还要进行必要的预处理。因此很有必要对中文Web文本分类进行理论与实验应用研究。 本文首先介绍了文本分类的背景、意义以及国内外研究现状,接着介绍中文文本分类的关键技术,包括Web文本预处理、中文分词以及停用词处理;文本表示的几种模型以及文本...; With the development of computer network technology, network information has become more and more mass, but also more and more complex, people can whether find interesting News when they are browsing site is an important criterion of the merits of the discrimination the site, traditional is to rely on artificial means for web text classification, facing the huge amounts of information rely on manu...; 学位:工学硕士; 院系专业:信息科学与技术学院_计算机软件与理论; 学号:23020101153043
语种zh_CN
出处http://210.34.4.13:8080/lunwen/detail.asp?serial=41327
内容类型学位论文
源URL[http://dspace.xmu.edu.cn/handle/2288/79222]  
专题信息技术-学位论文
推荐引用方式
GB/T 7714
义天鹏. 基于中文Web文本的分类研究与系统实现, The Research and System Implementation of Classification Based on Chinese Web Text[D]. 2014, 2013.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace