CORC  > 清华大学
基于分数规整的发音方式鲁棒的说话人识别研究
王琳琳 ; 张利鹏 ; 徐明星 ; Linlin Wang ; Lipeng Zhang ; Mingxing Xu
2010-07-15 ; 2010-07-15
会议名称第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集 ; Abstract Book of the 10~(th) National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing ; 第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会 ; The 10~(th) the National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing ; 中国甘肃兰州 ; CNKI ; 中国中文信息学会语音信息专业委员会、中国声学学会语言、听觉和音乐声学分会、中国语言学会语音学分会
关键词说话人识别 鲁棒性 发音方式 分数规整 speaker recognition robustness speaking-style score normalization TP391.41
其他题名Study on score normalization-based speaking-style variation robust speaker recognition
中文摘要实际环境下,一个说话人识别系统的性能受到很多因素的影响,说话人自身发音方式的变化所引起的训练与识别语音的不匹配是其中很重要的一个方面。本文以一个含有多种发音方式变化的数据库为基础,对于不限定发音方式变化类型的情形,在分数域提出了一系列发音方式分数规整(S-Norm)的解决方法。实验结果表明,SZ-Norm、ST-Norm及SZT-Norm的做法均使系统的整体性能在基线基础上有了明显提高,尤其是在SZT-Norm的情况下等错误率下降约为26%,这说明基于分数规整的方法是有效的。; Performance degradation of an actual speaker recognition system is due to many factors. Mismatches in speaking- style of a same speaker between training and testing data are an importance one. This paper bases itself on a database with multiple speaking-style variations and comes up with a series of speaking-style-related score normalization solutions (that is, S-Norms) for situations without speaking-style restrictions. Experimental results show that, with these normalization methods (that is, SZ-Norm, ST-Norm and SZT-Norm), the integral performance improves significantly, compared with the baseline system. The equal error rate (EER) drops by 26%, which indicates that score normalization-based methods are efficient.; 诺基亚(中国)研究院的赞助和支持
会议录出版者清华大学
语种中文 ; 中文
内容类型会议论文
源URL[http://hdl.handle.net/123456789/69979]  
专题清华大学
推荐引用方式
GB/T 7714
王琳琳,张利鹏,徐明星,等. 基于分数规整的发音方式鲁棒的说话人识别研究[C]. 见:第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集, Abstract Book of the 10~(th) National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing, 第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会, The 10~(th) the National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing, 中国甘肃兰州, CNKI, 中国中文信息学会语音信息专业委员会、中国声学学会语言、听觉和音乐声学分会、中国语言学会语音学分会.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace