汉维统计机器翻译中的形态学处理
董兴华; 陈丽娟; 周喜; 周俊林; 吐尔洪·吾司曼
刊名计算机工程
2011
卷号37期号:12页码:150-152
关键词汉维 统计机器翻译 词素 调序
ISSN号1000-3428
其他题名morphology processing in chinese-uyghur statistical machine translation
中文摘要针对汉语和维吾尔语语序差别(前者是主-谓-宾结构,后者是主-宾-谓结构)及形态差别较大的问题,通过编写调序规则将汉语调整为主-宾-谓结构,将维吾尔语单词切分为词干、词缀等更小的词素单元来训练统计模型,同时测试词素的切分粒度对翻译性能的影响。实验结果表明,对汉语句法结构的调整及以词干、词缀等更小的词素形式参与训练可以有效提高翻译质量。
英文摘要For the large differences of syntactic structure between Chinese and Uyghur,it composes rules to reorder the structure of Chinese sentences to that of Uyghur.For the large morphological differences between Chinese and Uyghur,it splits Uyghur words into stems and affixes,that is,morphemes,to train the statistical model.Meanwhile,it tests the effects of splitting granularities on translation performance.Experimental results show Chinese sentence reordering and splitting Uyghur words into morphemes can effectively improve the performance of translation system.
公开日期2012-11-29
内容类型期刊论文
源URL[http://ir.xjipc.cas.cn/handle/365002/1561]  
专题新疆理化技术研究所_多语种信息技术研究室
作者单位中国科学院新疆理化技术研究所;中国科学院新疆分院
推荐引用方式
GB/T 7714
董兴华,陈丽娟,周喜,等. 汉维统计机器翻译中的形态学处理[J]. 计算机工程,2011,37(12):150-152.
APA 董兴华,陈丽娟,周喜,周俊林,&吐尔洪·吾司曼.(2011).汉维统计机器翻译中的形态学处理.计算机工程,37(12),150-152.
MLA 董兴华,et al."汉维统计机器翻译中的形态学处理".计算机工程 37.12(2011):150-152.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace