基于词平台汉字编码的自动标引研究 | |
焦慧 ; 刘迁 ; 贾惠波 ; JIAO Hui ; LIU Qian ; JIA Hui-bo | |
2010-06-08 ; 2010-06-08 | |
关键词 | 自动标引 词平台 汉字编码 自动分词 auto-indexing words platform Chinese characters coding automatic segmentation TP391.1 |
其他题名 | Auto-indexing based on Chinese characters coding on words platform |
中文摘要 | 自动标引是基于内容检索的关键技术之一。目前国内的汉语自动标引研究主要集中于汉语自动分词这个前期处理问题上。提出了一种基于词平台的汉字编码方法,建立了一种新的中文计算机文档表达格式,使词成为最小的信息单位,汉语分析无需再进行自动分词,可直接进行自动标引,从而提高自动标引的效率和质量。; Auto-indexing is one of the key techniques of information retrieval based on contents.At present the research on Chinese auto-indexing mainly focuses on automatic segmentation which is a predisposal problem.This paper presents a kind of Chinese characters coding method on words platform,and establishes a new Chinese text format in computer which makes words the smallest information unit.Based on this method,auto-indexing does not rely on segmentation as before.Thereby the efficiency and quality of auto-indexing would be improved. |
语种 | 中文 ; 中文 |
内容类型 | 期刊论文 |
源URL | [http://hdl.handle.net/123456789/49271] |
专题 | 清华大学 |
推荐引用方式 GB/T 7714 | 焦慧,刘迁,贾惠波,等. 基于词平台汉字编码的自动标引研究[J],2010, 2010. |
APA | 焦慧,刘迁,贾惠波,JIAO Hui,LIU Qian,&JIA Hui-bo.(2010).基于词平台汉字编码的自动标引研究.. |
MLA | 焦慧,et al."基于词平台汉字编码的自动标引研究".(2010). |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论