基于相邻词的中文关键词自动抽取 | |
王灿辉 ; 张敏 ; 马少平 ; 黄宇 ; WANG Can-hui ; ZHANG Min ; MA Shao-ping ; HUANG Yu | |
2010-06-09 ; 2010-06-09 | |
关键词 | 相邻词 关键词抽取 信息检索 neighbour words keyword extraction information retrieval TP391.1 |
其他题名 | Chinese Keyword Extraction Algorithm Based on Neighbour Words |
中文摘要 | 文档关键词概括了文档的主题和内容,在信息检索、文本分类、文本聚类等领域有着重要应用。在总结前人研究成果的基础上,提出了一种基于相邻词的中文关键词自动抽取算法。在对50篇学术论文自动抽取关键词的实验中,采用精确匹配的评价获得了38.9%的精度和34.9%的召回率,采用近似匹配的评价获得了70.7%的精度和68.8%的召回率,能够为进一步的研究提供帮助。; Document Keywords,which make a general description of document topic and content,are used in information retrieval,document classification and clustering.A neighbour word based Chinese keyword extraction algorithm is proposed,based on previous research.Experiments are performed on a set of 50 academic paper.Evaluation results achieve a precision of 38.9% and a recall of 34.9% in exact match,and a precision of 70.7% and a recall of 68.8% in near match.The algorithm introduced here can be helpful in further research.; 国家“973”计划基金资助项目(2004CB318108); 国家自然科学基金资助项目(60223004,60321002,60303005,60503064); 教育部科学技术研究重点项目(104236) |
语种 | 中文 ; 中文 |
内容类型 | 期刊论文 |
源URL | [http://hdl.handle.net/123456789/53396] ![]() |
专题 | 清华大学 |
推荐引用方式 GB/T 7714 | 王灿辉,张敏,马少平,等. 基于相邻词的中文关键词自动抽取[J],2010, 2010. |
APA | 王灿辉.,张敏.,马少平.,黄宇.,WANG Can-hui.,...&HUANG Yu.(2010).基于相邻词的中文关键词自动抽取.. |
MLA | 王灿辉,et al."基于相邻词的中文关键词自动抽取".(2010). |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论