CORC  > 清华大学
基于相邻词的中文关键词自动抽取
王灿辉 ; 张敏 ; 马少平 ; 黄宇 ; WANG Can-hui ; ZHANG Min ; MA Shao-ping ; HUANG Yu
2010-06-09 ; 2010-06-09
关键词相邻词 关键词抽取 信息检索 neighbour words keyword extraction information retrieval TP391.1
其他题名Chinese Keyword Extraction Algorithm Based on Neighbour Words
中文摘要文档关键词概括了文档的主题和内容,在信息检索、文本分类、文本聚类等领域有着重要应用。在总结前人研究成果的基础上,提出了一种基于相邻词的中文关键词自动抽取算法。在对50篇学术论文自动抽取关键词的实验中,采用精确匹配的评价获得了38.9%的精度和34.9%的召回率,采用近似匹配的评价获得了70.7%的精度和68.8%的召回率,能够为进一步的研究提供帮助。; Document Keywords,which make a general description of document topic and content,are used in information retrieval,document classification and clustering.A neighbour word based Chinese keyword extraction algorithm is proposed,based on previous research.Experiments are performed on a set of 50 academic paper.Evaluation results achieve a precision of 38.9% and a recall of 34.9% in exact match,and a precision of 70.7% and a recall of 68.8% in near match.The algorithm introduced here can be helpful in further research.; 国家“973”计划基金资助项目(2004CB318108); 国家自然科学基金资助项目(60223004,60321002,60303005,60503064); 教育部科学技术研究重点项目(104236)
语种中文 ; 中文
内容类型期刊论文
源URL[http://hdl.handle.net/123456789/53396]  
专题清华大学
推荐引用方式
GB/T 7714
王灿辉,张敏,马少平,等. 基于相邻词的中文关键词自动抽取[J],2010, 2010.
APA 王灿辉.,张敏.,马少平.,黄宇.,WANG Can-hui.,...&HUANG Yu.(2010).基于相邻词的中文关键词自动抽取..
MLA 王灿辉,et al."基于相邻词的中文关键词自动抽取".(2010).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace