维汉机器翻译未登录词识别研究

CORC > 新疆理化技术研究所 > 中国科学院新疆理化技术研究所 > 多语种信息技术研究室

	维汉机器翻译未登录词识别研究
	米成刚 ; 王磊 ; 杨雅婷 ; 陈科海
刊名	计算机应用研究
	2013
卷号	30 期号:4 页码:239-241
关键词	维汉机器翻译短语表字符串相似度算法未登录词词切分编辑距离
ISSN号	1001-3695
英文摘要	针对维汉统计机器翻译中未登录词较多的现象和维吾尔语语言资源匮乏这一现状,结合维吾尔语构词特征以及相应的字符串相似度算法,提出了一种基于字符串相似度的维汉机器翻译未登录词识别模型。该模型借助短语表和外部词典,与未翻译的维语词求相似度,取相似度最大短语对应的汉语翻译作为此未登录词的最终翻译。实验证明,与基于词干切分的未登录词识别方法相比,此模型较好地保留了维吾尔语词信息,提高了译文的质量。
CSCD记录号	CSCD:4802617
公开日期	2013-05-24
内容类型	期刊论文
源URL	[http://ir.xjipc.cas.cn/handle/365002/2449]
专题	新疆理化技术研究所_多语种信息技术研究室
作者单位	1.中国科学院大学 2.中国科学院新疆理化技术研究所
推荐引用方式 GB/T 7714	米成刚,王磊,杨雅婷,等. 维汉机器翻译未登录词识别研究[J]. 计算机应用研究,2013,30(4):239-241.
APA	米成刚,王磊,杨雅婷,&陈科海.(2013).维汉机器翻译未登录词识别研究.计算机应用研究,30(4),239-241.
MLA	米成刚,et al."维汉机器翻译未登录词识别研究".计算机应用研究 30.4(2013):239-241.