题名维吾尔语语音自动评测分析及应用研究
作者王磊
学位类别博士
答辩日期2013-05-24
授予单位中国科学院大学
授予地点北京
导师李晓
关键词语音评测 发音置信度 语调特征 韵律特征 语料库 声学特征 维吾尔语发音质量
学位专业计算机应用
中文摘要国家及自治区高度重视新疆少数民族语言信息处理,从早期的文字处理技术,到目前语音处理技术以及汉语与少数民族语言的自然语言理解处理技术等,所有工作都 是围绕“缩小民族间数字鸿沟”,加强民族间文化、经济交流,推动地方经济社会发展和维护国家安全开展。自然语言的机器自动评分是计算机辅助语言学习和客观 评测系统的最重要实际应用之一,语音自动评测技术已广泛应用于汉语、英语等的语言学习评测中。目前,针对新疆地区维吾尔语的语音评测技术尚属起步阶段,主 要原因包括: 相应语音语料库的积累和建设比较少,同时针对维吾尔语文字的信息处理技术同语音评测相关技术结合进行系统地研究起步较晚等。本文主要针对维吾尔语的语音自 动评测技术开展研究,研究建立维吾尔语发音质量评估系统,一方面,开展相应维吾尔语音语料库基础积累建设及语音评测关键技术研究,提升维吾尔语语音评测相 关技术研究水平,另一方面,开展语音自动评测技术在新疆双语教育学习中的应用。 本文围绕我们的维语发音质量评估系统,进行了以技术为主的详细论述。该系统基于隐马尔可夫(HMM)语音识别框架,并且同时使用了有限状态机、基频共振峰 分析、非线性分类等技术,从短时发音准确性、长时发音准确性、发音易混淆性、语音语调合理性等多个角度,对维语的发音质量进行评估,在评估算法的设计上尽 可能地体现综合性、客观性。 本文首先从整体上描述了我们的系统,较详细地介绍了系统每个模块的功能和原理,并重点描述了四个关键的技术点,之后展示了实验结果和应用模板,最后给出了 结论。 本文的主要创新点包括: 1. 实现了基于双层词法分析和最小描述长度的维语子词的机器切分器,针对维语的语言特性,把维语单词自动切分成一个个子词,有利于后续步骤的评分。 2. 引入了了音素解码器计算后验概率的分母,使在子词级别直接计算置信度成为可能,从而得到长时评分特征,提高了评分的全面性和准确性。 3. 采用了对大词表语音识别的结果词图和混淆网络进行分析的评分方法,解决了强制对齐方法对某些特定错误难以检出的问题。 4. 设计了基于基频共振峰的语调韵律的评分方法,研究了使用混合高斯模型对基频共振峰建模并计算语调韵律发音良好度的方法。
英文摘要The state and autonomous region government attaches great importance to the Xinjiang minority language information processing, from the earlier text processing technology to the current voice processing technology, all of these works are focus on “narrow the digital divide between the nationals”, strengthen the exchanges of inter-ethnic cultural and economic, promoting local economic and social development and the protection of national security. Natural language machine automatically score is the most important practical applications of computer-assisted language learning and objective evaluation system, the voice automatic evaluation technology has been widely used in Chinese, English and other language learning evaluation.
公开日期2013-05-31
内容类型学位论文
源URL[http://ir.xjipc.cas.cn/handle/365002/2477]  
专题新疆理化技术研究所_多语种信息技术研究室
作者单位中国科学院新疆理化技术研究所
推荐引用方式
GB/T 7714
王磊. 维吾尔语语音自动评测分析及应用研究[D]. 北京. 中国科学院大学. 2013.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace