面向维汉机器翻译的语料筛选技术研究
孔金英;  杨雅婷;  王磊;  李晓; 王磊; 李晓
刊名计算机应用研究
2016
卷号33期号:12页码:3654-3657
关键词维汉机器翻译 语料筛选 语言模型
中文摘要统计机器翻译是近十年来的主流机器翻译技术,其在维汉机器翻译中良好的性能已经得到了广泛的认可。维汉统计机器翻译的最终翻译性能同样是受这几方面的影响:翻译模型、语言模型、语料质量和规模等。旨在通过对维汉双语训练语料的筛选来提高最终的机器翻译性能。在相关学者的研究基础上,提出了改进的IBM1模型评价句对齐质量、双语语言模型困惑度进行语料筛选和多种筛选指标综合求交集的方法。这些方法没有语言特性的依赖,支持维汉双语语料的筛选。通过实验可证明,使用这些方法筛选而来的语料训练出的维汉翻译模型的性能更优。
内容类型期刊论文
源URL[http://ir.xjipc.cas.cn/handle/365002/4500]  
专题新疆理化技术研究所_多语种信息技术研究室
作者单位中国科学院新疆理化技术研究所;新疆民族语音语言信息处理重点实验室;中国科学院大学
推荐引用方式
GB/T 7714
孔金英;杨雅婷;王磊;李晓;,王磊,李晓. 面向维汉机器翻译的语料筛选技术研究[J]. 计算机应用研究,2016,33(12):3654-3657.
APA 孔金英;杨雅婷;王磊;李晓;,王磊,&李晓.(2016).面向维汉机器翻译的语料筛选技术研究.计算机应用研究,33(12),3654-3657.
MLA 孔金英;杨雅婷;王磊;李晓;,et al."面向维汉机器翻译的语料筛选技术研究".计算机应用研究 33.12(2016):3654-3657.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace