基于单语语料和词向量对齐的蒙汉神经机器翻译研究
曹宜超1; 高翊2; 李淼1; 冯韬1; 王儒敬1; 付莎2
刊名中文信息学报
2020
卷号34
关键词Mongolian-Chinese neural machine translation monolingual corpora word embedding alignment 蒙汉神经机器翻译 单语语料 词向量对齐
ISSN号1003-0077
英文摘要近年来,随着人工智能和深度学习的发展,神经机器翻译在某些高资源语言对上取得了接近人类水平的效果。然而对于低资源语言对如汉语和蒙古语,神经机器翻译的效果并不尽如人意。为了提高蒙汉神经机器翻译的性能,该文基于编码器—解码器神经机器翻译架构,提出一种改善蒙汉神经机器翻译结果的方法。首先将蒙古语和汉语的词向量空间进行对齐并用它来初始化模型的词嵌入层,然后应用联合训练的方式同时训练蒙古语到汉语的翻译和汉语到蒙古语的翻译。并且在翻译的过程中,最后使用蒙古语和汉语的单语语料对模型进行去噪自编码的训练,增强编码器的编码能力和解码器的解码能力。实验结果表明该文所提出方法的效果明显高于基线模型,证明该方法可以提高蒙汉神经机器翻译的性能。
语种中文
CSCD记录号CSCD:6725814
内容类型期刊论文
源URL[http://ir.hfcas.ac.cn:8080/handle/334002/51386]  
专题中国科学院合肥物质科学研究院
作者单位1.中国科学院合肥智能机械研究所
2.云南省少数民族语文指导工作委员会办公室
3.中国科学院合肥智能机械研究所
4.中国科学院合肥智能机械研究所
5.中国科学院合肥智能机械研究所
6.云南省少数民族语文指导工作委员会办公室
推荐引用方式
GB/T 7714
曹宜超,高翊,李淼,等. 基于单语语料和词向量对齐的蒙汉神经机器翻译研究[J]. 中文信息学报,2020,34.
APA 曹宜超,高翊,李淼,冯韬,王儒敬,&付莎.(2020).基于单语语料和词向量对齐的蒙汉神经机器翻译研究.中文信息学报,34.
MLA 曹宜超,et al."基于单语语料和词向量对齐的蒙汉神经机器翻译研究".中文信息学报 34(2020).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace