基于注意力LSTM和多任务学习的远场语音识别

	基于注意力LSTM和多任务学习的远场语音识别
	张宇; 张鹏远; 颜永红
	2017
会议日期	2017-10-11
会议地点	中国江苏连云港
关键词	远场语音识别长短时记忆声学模型注意力机制多任务学习
英文摘要	由于背景噪声,混响以及人声干扰等因素,远场语音识别任务一直充满挑战性。本文针对远场语音识别任务提出基于注意力机制和多任务学习框架的长短时记忆递归神经网络声学模型。模型中嵌入的注意力机制使其自动学习调整对扩展上下文特征输入的关注度,显著提升了模型对远场语音的建模能力。为进一步提高模型的鲁棒性,我们引入多任务学习框架,使其联合预测声学状态和干净特征。AMI数据集上的实验结果表明,与基线模型相比,引入注意力机制和多任务学习框架的ＬＳＴＭ模型获得了绝对１５％的词错误率下降。
内容类型	会议论文
源URL	[http://ir.xjipc.cas.cn/handle/365002/5367]
专题	新疆理化技术研究所_多语种信息技术研究室
作者单位	中国科学院声学研究所语言声学与内容理解重点实验室；中国科学院大学；中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
推荐引用方式 GB/T 7714	张宇；张鹏远；颜永红. 基于注意力LSTM和多任务学习的远场语音识别[C]. 见:. 中国江苏连云港. 2017-10-11.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

暂无评论

评注功能仅针对注册用户开放，请您登录

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接