题名 | 英汉机器翻译系统中的复杂长句研究; Study of Complex Long Sentence in English-Chinese Machine Translation System |
作者 | 曹冬林 |
答辩日期 | 2003 ; 2003 |
导师 | 李堂秋 |
关键词 | 切分 子句 窗口 缺口 segmentation clause window gap |
英文摘要 | 目前的英汉机器翻译系统对简单句的分析已经到达了相当高的水平,但由于复杂长句的分析难度远高于简单句,对复杂长句的分析结果依然难以令人满意,其分析处理成为制约当前机器翻译系统的瓶颈。 本文采用传统的切分方法,借鉴语言学家对英语复杂长句的逻辑层次分析法,综合基于规则与基于统计的自然语言处理方法对复杂长句的分析处理进行了研究。本文的研究主要分成三个部分:切分规则、切分算法和拼合算法。 在切分规则上,本文从PennTreebank中获取规则。切分规则从基于单词的构建方式提升为基于语块的构建方式,提高了规则的抽象性,减少了规则的冗余。同时,将PennTreebank的基本标注集与chunk标注集进行映...; Modern English-Chinese machine translation systems have already reached a quite high level in parsing a simple sentence, but they still have not given out gratifying results in parsing a complex long sentence for its complexity. In fact, effectively parsing a complex long sentence has become a strong restriction in machine translation systems. In order to solve the problem of parsing a complex ...; 学位:工学硕士; 院系专业:计算机与信息工程学院计算机科学系_计算机应用技术; 学号:200028013 |
语种 | zh_CN |
出处 | http://210.34.4.13:8080/lunwen/detail.asp?serial=2540 |
内容类型 | 学位论文 |
源URL | [http://dspace.xmu.edu.cn/handle/2288/52008] |
专题 | 信息技术-学位论文 |
推荐引用方式 GB/T 7714 | 曹冬林. 英汉机器翻译系统中的复杂长句研究, Study of Complex Long Sentence in English-Chinese Machine Translation System[D]. 2003, 2003. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论