CORC  > 清华大学
基于词平台汉字编码的自动标引研究
焦慧 ; 刘迁 ; 贾惠波 ; JIAO Hui ; LIU Qian ; JIA Hui-bo
2010-06-08 ; 2010-06-08
关键词自动标引 词平台 汉字编码 自动分词 auto-indexing words platform Chinese characters coding automatic segmentation TP391.1
其他题名Auto-indexing based on Chinese characters coding on words platform
中文摘要自动标引是基于内容检索的关键技术之一。目前国内的汉语自动标引研究主要集中于汉语自动分词这个前期处理问题上。提出了一种基于词平台的汉字编码方法,建立了一种新的中文计算机文档表达格式,使词成为最小的信息单位,汉语分析无需再进行自动分词,可直接进行自动标引,从而提高自动标引的效率和质量。; Auto-indexing is one of the key techniques of information retrieval based on contents.At present the research on Chinese auto-indexing mainly focuses on automatic segmentation which is a predisposal problem.This paper presents a kind of Chinese characters coding method on words platform,and establishes a new Chinese text format in computer which makes words the smallest information unit.Based on this method,auto-indexing does not rely on segmentation as before.Thereby the efficiency and quality of auto-indexing would be improved.
语种中文 ; 中文
内容类型期刊论文
源URL[http://hdl.handle.net/123456789/49271]  
专题清华大学
推荐引用方式
GB/T 7714
焦慧,刘迁,贾惠波,等. 基于词平台汉字编码的自动标引研究[J],2010, 2010.
APA 焦慧,刘迁,贾惠波,JIAO Hui,LIU Qian,&JIA Hui-bo.(2010).基于词平台汉字编码的自动标引研究..
MLA 焦慧,et al."基于词平台汉字编码的自动标引研究".(2010).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace