题名 | 电话通信中说话人确认方法研究 |
作者 | 刘倓倓 |
学位类别 | 博士 |
答辩日期 | 2007-06-01 |
授予单位 | 中国科学院声学研究所 |
授予地点 | 声学研究所 |
关键词 | 说话人确认 高斯混合模型 支持向量机 电话语音 信道失配 |
其他题名 | Speaker Verification for Telephone Speech |
学位专业 | 信号与信息处理 |
中文摘要 | 本论文主要研究电话语音中的说话人确认方法及具体实现。该任务的目的是检测指定电话语音是否属于目标说话人。说话人确认系统,首先提取电话语音信号的语音特征,建立目标说话人模型;在确认阶段用目标说话人模型对指定电话语音的特征序列打分,用以确认该电话语音的说话人身份。 说话人确认技术可应用在很多种场合,如证券交易、银行交易、公安取证、个人电脑声控锁、汽车声控锁、身份证、信用卡等。随着电话通信网络的迅速发展,电话已成为当今人们交流的最主要的通信方式,因此面向电话的说话人确认技术有着极为广泛的应用前景。说话人确认过程可分为如下几个阶段:特征提取、说话人建模,测试语音判决。说话人确认的主要难点在于如何提取能够有效反映说话人发声特征的参数和选择描述说话人发声特性的说话人模型。电话语音下的说话人确认还面临着测试语音与训练语音信道环境的失配问题。 本论文研究了基于高斯混合模型的说话人确认方法和基于支持向量机的说话人确认方法。在分析了GMM的建模优势和SVM的分类优势后,尝试了将高斯混合模型与支持向量机相结合的确认方法。针对训练与测试环境失配问题,从特征和后处理两个角度研究了消除信道影响的方法,如倒谱均值归一化,特征弯曲,特征映射,NAP,零规整,测试规整等方法。 本论文实现了多种说话人确认系统,并在NIST 2006SRE测试集上对其性能进行了分析比较。其中,最优系统的等错率为7.0%。 |
语种 | 中文 |
公开日期 | 2011-05-07 |
页码 | 59 |
内容类型 | 学位论文 |
源URL | [http://ir.ioa.ac.cn/handle/311008/249] |
专题 | 声学研究所_声学所博硕士学位论文_1981-2009博硕士学位论文 |
推荐引用方式 GB/T 7714 | 刘倓倓. 电话通信中说话人确认方法研究[D]. 声学研究所. 中国科学院声学研究所. 2007. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论