CORC  > 北京大学  > 信息科学技术学院
一种词汇共现算法及共现词对检索系统排序的影响; A term co-occurrence algorithm and the effect of co-occurrence terms on result ranking for information retrieval
陈翀 ; 彭波 ; 闫宏飞 ; 王继民
刊名清华大学学报自然科学版
2005
关键词共现词汇 排序 相关性 信息检索
DOI10.3321/j.issn:1000-0054.2005.09.029
英文摘要为了探讨共现词对检索系统排序相关性的影响,提出一种新的共现词汇算法--FDC.算法中考虑了词汇在文档中的共现频度、相对距离和共文档率.从天网搜索引擎查询日志中选取部分查询词,用本算法和潜在语义索引(LSI)方法分别求其共现词汇,并以相同的评分策略改变原始排序结果.Discounted cumulative gain(DCG)评估结果表明,本算法获得的共现词在99%的置信度下对原始排序的相关性有改进;而LSI方法获得的共现词对排序相关性也表现出同样显著的改进效果.结果显示共现词汇能改进检索系统结果排序的相关性,并且不依赖于特定算法.; 国家自然科学基金; 高等学校博士学科点专项科研项目; 中文核心期刊要目总览(PKU); 中国科学引文数据库(CSCD); 0; 9; 1857-1860; 45
语种中文
内容类型期刊论文
源URL[http://ir.pku.edu.cn/handle/20.500.11897/236618]  
专题信息科学技术学院
推荐引用方式
GB/T 7714
陈翀,彭波,闫宏飞,等. 一种词汇共现算法及共现词对检索系统排序的影响, A term co-occurrence algorithm and the effect of co-occurrence terms on result ranking for information retrieval[J]. 清华大学学报自然科学版,2005.
APA 陈翀,彭波,闫宏飞,&王继民.(2005).一种词汇共现算法及共现词对检索系统排序的影响.清华大学学报自然科学版.
MLA 陈翀,et al."一种词汇共现算法及共现词对检索系统排序的影响".清华大学学报自然科学版 (2005).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace