CORC  > 清华大学
MLLR特征的SVM语种识别算法
钟山 ; 刘加 ; ZHONG Shan ; LIU Jia
2010-06-09 ; 2010-06-09
关键词语种识别 语音段 最大似然线性回归(MLLR) 支持向量机(SVM) language identification speech segment maximum likelihood linear regression (MLLR) support vector machine(SVM) TP391.42
其他题名MLLR based SVM language identification algorithm
中文摘要为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对每个语种训练Gauss混合模型(Gaussian mixture model,GMM),然后对每个语音段在所有语种的GMM上计算MLLR矩阵。将得到的多类MLLR矩阵经归一化后拼接形成超矢量作为特征输入支持向量机(support vector machine,SVM)分类器进行训练和识别。比较了均值方差和排序两种归一化方法,并将多类MLLR-SVM算法与传统GMM语种识别算法进行对比。实验表明:排序归一化算法优于传统的均值方差归一化;建立在GMM模型基础上的MLLR-SVM系统性能有9.7%的提升,并与GMM分类器有很强的互补性。; This paper presents a language identification algorithm based on maximum likelihood linear regression(MLLR).The algorithm first trains the language dependent Gaussian mixture models(GMMs),calculates the MLLR transforms for every speech segment from the GMMs,and then combines the MLLRs to form supervectors for support vector machine(SVM) classifier training and testing after normalization.Tests comparing mean/variance normalization with rank normalization and the current MLLR-SVM system with the GMM classifier show that rank normalization outperforms the traditional mean/variance normalization With the MLLR-SVM system 9.7% better than the GMM classifier,but can complement the GMM classifier results.; 国家自然科学基金资助项目(60776800); 国家“八六三”高技术项目(2006AA010101,2007AA04Z223,2008AA02Z414)
语种中文 ; 中文
内容类型期刊论文
源URL[http://hdl.handle.net/123456789/54404]  
专题清华大学
推荐引用方式
GB/T 7714
钟山,刘加,ZHONG Shan,等. MLLR特征的SVM语种识别算法[J],2010, 2010.
APA 钟山,刘加,ZHONG Shan,&LIU Jia.(2010).MLLR特征的SVM语种识别算法..
MLA 钟山,et al."MLLR特征的SVM语种识别算法".(2010).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace