词性标注对信息检索系统性能的影响; Effects of POS Tagging on Performance of IR Systems | |
苏祺 ; 昝红英 ; 胡景贺 ; 项锟 | |
刊名 | 中文信息学报 |
2005 | |
关键词 | 人工智能 自然语言处理 信息检索 向量空间模型 词性标注 SMART |
DOI | 10.3969/j.issn.1003-0077.2005.02.009 |
英文摘要 | 在信息检索中引入NLP技术是信息检索发展的主要趋势,本文将NLP中较为成熟的词性标注技术加入信息检索,采用大规模TREC数据集,试图发现词性标注对检索系统性能的影响.笔者在SMART检索系统上使用不同标注集、不同索引项权重进行了检索实验.实验表明,在信息检索中加入词性标注信息可能会对某些特定Topic和Document的检索效果有所改进,但词性标注的影响能力弱于索引项权重选择的影响能力.词性标注对检索性能的影响涉及到Topic和Document中的具体用词,普遍规律有待进一步研究.; 国家高技术研究发展计划(863计划); 国家自然科学基金; 中文核心期刊要目总览(PKU); 中国科学引文数据库(CSCD); 0; 2; 58-65; 19 |
语种 | 中文 |
内容类型 | 期刊论文 |
源URL | [http://ir.pku.edu.cn/handle/20.500.11897/175876] |
专题 | 信息科学技术学院 |
推荐引用方式 GB/T 7714 | 苏祺,昝红英,胡景贺,等. 词性标注对信息检索系统性能的影响, Effects of POS Tagging on Performance of IR Systems[J]. 中文信息学报,2005. |
APA | 苏祺,昝红英,胡景贺,&项锟.(2005).词性标注对信息检索系统性能的影响.中文信息学报. |
MLA | 苏祺,et al."词性标注对信息检索系统性能的影响".中文信息学报 (2005). |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论