一种拼音和汉字相结合的汉外口语自动翻译方法
周玉; 宗成庆
2009-12-30
专利国别CN
专利号CN200910244513.6
专利类型发明
中文摘要一种拼音和汉字相结合的汉外口语自动翻译方法:首先将原始汉外双语语料的汉语部分进行字音转化和单字分割,得到基于拼音和基于汉字的汉外双语语料;分别利用基于拼音和汉字的汉外训练语料进行词对齐的训练,得到基于拼音和汉字的词对齐并对这两个词对齐进行融合得到融合后的词对齐文件;在此基础上抽取并学习翻译知识,得到基于拼音和基于汉字的翻译模型;结合外文语料的语言模型和翻译模型在开发集上进行最小错误训练,得到各个特征的特征权重及相关参数;最后进行融合解码生成最终翻译。该方法大大改善了翻译性能和系统的鲁棒性,与目前通用的基于字的翻译系统相比,系统性能利用机器翻译通用评测标准BLEU打分能够提高约10%。
公开日期2010-07-28
内容类型专利
源URL[http://ir.ia.ac.cn/handle/173211/8431]  
专题自动化研究所_模式识别国家重点实验室_自然语言处理团队
作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
周玉,宗成庆. 一种拼音和汉字相结合的汉外口语自动翻译方法. CN200910244513.6. 2009-12-30.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace