CORC  > 电子学研究所  > 电子所博硕士学位论文  > 学位论文
题名电话语音语种确认系统算法研究
作者刘长娥
学位类别博士
答辩日期2007-12-24
授予单位中国科学院电子学研究所
授予地点电子学研究所
导师夏善红
关键词语种确认 语言模型 开集测试
其他题名Study of algorithm of language verification system on telephone speech
中文摘要语种识别技术作为信息处理系统的前端和多语种交流领域的接口,可以辨识语音的语种信息,为后续技术处理和交流者提供必要的条件,有着巨大的应用需求和价值。本文重点研究语种确认系统算法,主要围绕PPRLM(并行音素识别器接语言模型系统)语种确认基线系统中的三个问题进行:语种辨识系统中的语言模型改善、系统分类器融合策略、开集测试中系统性能。 语种确认系统的语言模型是其核心之一,为了提高语言模型的精度,本文采用段长作为置信度,提出了“基于段长的语言模型修正算法”,该算法结合段长置信度信息对语言模型进行估值,并与无段长置信度语言模型一起给出“修正因子”,用于修正语言模型估值,以此改善语言模型精度,提高系统性能。 本文研究了分类器的加权平均线性融合策略,利用“MCE权重优化训练算法”(Minimum Classification Error, MCE)估计分类器权重。研究了训练中各关键参数的影响,并分析了该训练算法存在的问题,提出改进措施,改善了融合系统性能。 针对开集测试,本文构建了“跳跃式”语言模型,得到多个时间层次上的模型,然后提出“多层语言模型融合算法”,提高了系统在开集测试的精度。在多层语言模型融合的基础上,本文提出了“基于背景模型的两阶段语种确认算法”。算法在不同阶段采用鉴别能力不同的背景模型,第一阶段采用“有限背景模型”,第二阶段采用“通用背景模型”,两阶段算法最终有效地降低了系统在开集测试中的错误率。 最后论文采用2005年国际NIST(American National Institute of Standard and Technology)语种技术评测数据库对采用本文算法的系统进行整体测试,分别对30s、10s语音进行闭集和开集测试,采用本文算法的系统均获得了等错率的降低,从而验证了算法的有效性。
语种中文
公开日期2011-07-19
页码134
内容类型学位论文
源URL[http://159.226.65.12/handle/80137/8133]  
专题电子学研究所_电子所博硕士学位论文_电子所博硕士学位论文_学位论文
推荐引用方式
GB/T 7714
刘长娥. 电话语音语种确认系统算法研究[D]. 电子学研究所. 中国科学院电子学研究所. 2007.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace