CORC  > 北京大学  > 信息科学技术学院
基于中文维基百科的词语语义相关度计算; Computing Lexical Semantic Relatedness with Chinese Wikipedia
万富强 ; 吴云芳
刊名中文信息学报
2013
关键词语义相关度 显性语义分析 中文维基百科 先验概率 概念向量 semantic relatedness explicit semantic analysis Chinese Wikipedia priori probability concept vectors
DOI10.3969/j.issn.1003-0077.2013.06.005
英文摘要语义相关度计算在信息检索、词义消歧、自动文摘、拼写校正等自然语言处理中均扮演着重要的角色.该文采用基于维基百科的显性语义分析方法计算汉语词语之间的语义相关度.基于中文维基百科,将词表示为带权重的概念向量,进而将词之间相关度的计算转化为相应的概念向量的比较.进一步,引入页面的先验概率,利用维基百科页面之间的链接信息对概念向量各分量的值进行修正.实验结果表明,使用该方法计算汉语语义相关度,与人工标注标准的斯皮尔曼等级相关系数可以达到0.52,显著改善了相关度计算的结果.; 国家自然科学基金资助项目; 教育部人文社会科学研究规划基金资助项目; 国家社科基金资助项目; 中文核心期刊要目总览(PKU); 中国科技核心期刊(ISTIC); 中国科学引文数据库(CSCD); 0; 6; 31-37,109; 27
语种中文
内容类型期刊论文
源URL[http://ir.pku.edu.cn/handle/20.500.11897/235677]  
专题信息科学技术学院
推荐引用方式
GB/T 7714
万富强,吴云芳. 基于中文维基百科的词语语义相关度计算, Computing Lexical Semantic Relatedness with Chinese Wikipedia[J]. 中文信息学报,2013.
APA 万富强,&吴云芳.(2013).基于中文维基百科的词语语义相关度计算.中文信息学报.
MLA 万富强,et al."基于中文维基百科的词语语义相关度计算".中文信息学报 (2013).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace