CORC  > 清华大学
电话语音的多说话人分割聚类研究
张薇 ; 刘加 ; ZHANG Wei ; LIU Jia
2010-05-12 ; 2010-05-12
关键词语音信号处理 电话语音 分割聚类 交叉似然比 进化隐Markov模型 speech signal processing telephone speech segmentation and clustering cross likelihood ratio(CLR) evolutionary hidden Markov model(EHMM) TN912.3
其他题名Multi-speaker segmentation and clustering of telephone speech
中文摘要为了提高电话多人语音中提取的单人语音纯度,即多说话人分割聚类处理的性能,该文在传统的分步分割聚类算法机制上增加了重分割处理,提出逐级算法增强处理机制:在分割部分,该文提出了一种基于Bayesian信息准则的分割算法,融合基于不同距离测度检测得出的分割点提高了分割点检测率;在聚类部分提出了基于BIC和交叉似然比准则(CLR)的分层聚类算法;在重分割部分引入和改进了进化隐Markov模型算法精化分割结果。该文在美国国家标准技术局(NIST)1998年度多说话人识别数据库上进行实验,聚类后性能"类纯度"比传统算法提高了10%。; Multi-speaker segmentation and clustering of telephone speech was used to improve the quality of extracted single speaker speech.A segmentation-clustering-resegmentation scheme was developed to improve the performance of each step.The segmentation algorithms compares different distance metrics with a refinery scheme based on the Bayesian information criteria algorithm to fuse the segmentation-point results.The clustering uses a hierarchical clustering algorithm which combines BIC and cross likelihood ratio(CLR) metrics the resegmentation step uses an evolutionary hidden Markov model to refine the segmentation result.Tests on the national institute of standards and technology(NIST) 1998 multi-speaker corpus give an overall enhancement as indicated by the cluster purity system performance indicator of 10%.
语种中文 ; 中文
内容类型期刊论文
源URL[http://hdl.handle.net/123456789/28173]  
专题清华大学
推荐引用方式
GB/T 7714
张薇,刘加,ZHANG Wei,等. 电话语音的多说话人分割聚类研究[J],2010, 2010.
APA 张薇,刘加,ZHANG Wei,&LIU Jia.(2010).电话语音的多说话人分割聚类研究..
MLA 张薇,et al."电话语音的多说话人分割聚类研究".(2010).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace