CORC  > 清华大学
MLLR特征的SVM语种识别算法
钟山 ; 刘加 ; ZHONG Shan ; LIU Jia
2010-07-15 ; 2010-07-15
会议名称第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集 ; Abstract Book of the 10~(th) National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing ; 第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会 ; The 10~(th) the National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing ; 中国甘肃兰州 ; CNKI ; 中国中文信息学会语音信息专业委员会、中国声学学会语言、听觉和音乐声学分会、中国语言学会语音学分会
关键词语种识别 最大似然线性回归 支持向量机 language identification maximum likelihood linear regression (MLLR) support vector machine (SVM) TN912.34
其他题名MLLR based SVM language identification algorithm
中文摘要为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对每个语种训练Gauss混合模型(Gaussian mixture model,GMM),然后对每个语音段在所有语种的GMM上计算MLLR矩阵。将得到的多类MLLR矩阵经归一化后拼接形成超矢量作为特征输入支持向量机(support vector machine,SVM)分类器进行训练和识别。本文比较了均值方差和排序两种归一化方法,并将本文提出的多类MLLR-SVM算法与传统GMM语种识别算法进行对比。实验表明,排序归一化算法优于传统的均值方差归一化;建立在GMM模型基础上的MLLR-SVM系统性能有9.7%的提升,并与GMM分类器有很强的互补性。; This paper proposes a noval language identification algorithm based on maximum likelihood linear regression (MLLR). The algorithm fisrt trains language dependent Gaussian mixture models (GMMs), calculates MLLR transforms for every speech segment from the GMMs, and then combines MLLRs to form supervectors for support vector machine (SVM) classifier training and testing after normalization. We also compare mean/variance normalization with rank normalization, and MLLR-SVM system with GMM classifier. Experimental results show that rank normalization outper-forms traditional mean/variance one. MLLR-SVM system is 9.7% better than GMM classifier, and complementary with GMM classifier.; 国家自然科学基金资助项目(60776800); 国家“八六三”高技术项目(2006AA010101,2007AA04Z223,2008AA02Z414)
会议录出版者清华大学
语种中文 ; 中文
内容类型会议论文
源URL[http://hdl.handle.net/123456789/69784]  
专题清华大学
推荐引用方式
GB/T 7714
钟山,刘加,ZHONG Shan,等. MLLR特征的SVM语种识别算法[C]. 见:第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集, Abstract Book of the 10~(th) National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing, 第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会, The 10~(th) the National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing, 中国甘肃兰州, CNKI, 中国中文信息学会语音信息专业委员会、中国声学学会语言、听觉和音乐声学分会、中国语言学会语音学分会.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace