电话语音语种确认系统算法研究

题名	电话语音语种确认系统算法研究
作者	刘长娥
学位类别	博士
答辩日期	2007-12-24
授予单位	中国科学院电子学研究所
授予地点	电子学研究所
导师	夏善红
关键词	语种确认语言模型开集测试
其他题名	Study of algorithm of language verification system on telephone speech
中文摘要	语种识别技术作为信息处理系统的前端和多语种交流领域的接口，可以辨识语音的语种信息，为后续技术处理和交流者提供必要的条件，有着巨大的应用需求和价值。本文重点研究语种确认系统算法，主要围绕PPRLM（并行音素识别器接语言模型系统）语种确认基线系统中的三个问题进行：语种辨识系统中的语言模型改善、系统分类器融合策略、开集测试中系统性能。语种确认系统的语言模型是其核心之一，为了提高语言模型的精度，本文采用段长作为置信度，提出了“基于段长的语言模型修正算法”，该算法结合段长置信度信息对语言模型进行估值，并与无段长置信度语言模型一起给出“修正因子”，用于修正语言模型估值，以此改善语言模型精度，提高系统性能。本文研究了分类器的加权平均线性融合策略，利用“MCE权重优化训练算法”（Minimum Classification Error, MCE）估计分类器权重。研究了训练中各关键参数的影响，并分析了该训练算法存在的问题，提出改进措施，改善了融合系统性能。针对开集测试，本文构建了“跳跃式”语言模型，得到多个时间层次上的模型，然后提出“多层语言模型融合算法”，提高了系统在开集测试的精度。在多层语言模型融合的基础上，本文提出了“基于背景模型的两阶段语种确认算法”。算法在不同阶段采用鉴别能力不同的背景模型，第一阶段采用“有限背景模型”，第二阶段采用“通用背景模型”，两阶段算法最终有效地降低了系统在开集测试中的错误率。最后论文采用2005年国际NIST（American National Institute of Standard and Technology）语种技术评测数据库对采用本文算法的系统进行整体测试，分别对30s、10s语音进行闭集和开集测试，采用本文算法的系统均获得了等错率的降低，从而验证了算法的有效性。
语种	中文
公开日期	2011-07-19
页码	134
内容类型	学位论文
源URL	[http://159.226.65.12/handle/80137/8133]
专题	电子学研究所_电子所博硕士学位论文_电子所博硕士学位论文_学位论文
推荐引用方式 GB/T 7714	刘长娥. 电话语音语种确认系统算法研究[D]. 电子学研究所. 中国科学院电子学研究所. 2007.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们