CORC  > 北京大学  > 信息科学技术学院
基于编辑距离的中文组织机构名简称-全称匹配算法; A Chinese organization′s full name and matching abbreviation algorithm based on edit-distance
黄林晟 ; 邓志鸿 ; 唐世渭 ; 王文清 ; 陈凌
刊名山东大学学报理学版
2012
关键词文本挖掘 机器学习 编辑距离 组织机构名 简称-全称匹配 text mining machine learning edit distance organization name abbreviation-full name match
英文摘要在面对中文语言环境下组织机构名简称-全称匹配这一具体问题时,经典的基于编辑距离进行字符串相似匹配方法的实用性有所下降。基于编辑距离的思想,提出了一种改进匹配算法:首先对简称和全称进行分词,以切合中文的语法结构特点;之后结合重定义的词汇语义相似度度量方法,修改编辑操作权重,并通过自适应学习的方式进一步修正;最后选择与简称编辑距离最小的全称作为匹配结果。实验结果表明,该算法匹配准确率比原始方法有较大提升。; 国家“八六三”高技术研究发展计划基金资助项目; 国家自然科学基金资助项目; 国家教育部“211工程”中国高等教育文献保障系统(CALIS)三期建设项目; 中文核心期刊要目总览(PKU); 中国科技核心期刊(ISTIC); 中国科学引文数据库(CSCD); 0; 5; 43-48; 47
语种中文
内容类型期刊论文
源URL[http://ir.pku.edu.cn/handle/20.500.11897/256959]  
专题信息科学技术学院
推荐引用方式
GB/T 7714
黄林晟,邓志鸿,唐世渭,等. 基于编辑距离的中文组织机构名简称-全称匹配算法, A Chinese organization′s full name and matching abbreviation algorithm based on edit-distance[J]. 山东大学学报理学版,2012.
APA 黄林晟,邓志鸿,唐世渭,王文清,&陈凌.(2012).基于编辑距离的中文组织机构名简称-全称匹配算法.山东大学学报理学版.
MLA 黄林晟,et al."基于编辑距离的中文组织机构名简称-全称匹配算法".山东大学学报理学版 (2012).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace