CORC  > 北京大学  > 信息科学技术学院
词典匹配和串频统计相结合在自动主题分析中的应用
李素建 ; 李芸 ; 纪鹭宁 ; 徐睿峰
0
关键词串频统计 词典匹配 主题分析 关键词 自动标引
英文摘要当前主题分析主要采用基于词表的自动抽词技术,这种方法的局限性在于无法处理知识库中未登录的关键词.因此本文提出了在专家知识库的词典匹配基础上,结合词的串频统计技术,进行自动主题分析,获取文档的关键词候选项.实验证明,该方法可以获得94%以上的召回率,并且获取结果中合理串的比例达到96%,从而保证了自动标引的进一步处理.; 0
语种中文
内容类型其他
源URL[http://ir.pku.edu.cn/handle/20.500.11897/274987]  
专题信息科学技术学院
推荐引用方式
GB/T 7714
李素建,李芸,纪鹭宁,等. 词典匹配和串频统计相结合在自动主题分析中的应用. 0.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace