相似词获取的集成方法

CORC > 北京大学 > 信息科学技术学院

	相似词获取的集成方法
	石静 ; 邱立坤 ; 王菲 ; 吴云芳
	2011
关键词	语义相似度相似词集成方法分布相似性
英文摘要	语义相似度计算是自然语言处理领域的关键问题之一,在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用。本文将集成方法应用于基于大规模语料库的汉语语义相似度计算上,提出并实现了不同语域的集成方案。分别使用新闻语料和互联网语料,选取窗口大小为2或3的上下文词语特征、以上下文与目标词之间的互信息作为权值构建特征向量,计算向量之间的cosine夹角作为词语相似度,得到了三种语义相似度序列。对这三个相似度序列进行集成,使用了平均排名、调和平均排名和平均分数三种集成方法。对四种组合方式的集成结果进行了评测,实验结果表明,集成方法获取的语义相似度相对于单一方法准确率...; 0
语种	中文
内容类型	其他
源URL	[http://ir.pku.edu.cn/handle/20.500.11897/176846]
专题	信息科学技术学院
推荐引用方式 GB/T 7714	石静,邱立坤,王菲,等. 相似词获取的集成方法. 2011-01-01.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

暂无评论

评注功能仅针对注册用户开放，请您登录

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接