基于递归神经网络的语音识别快速解码算法
张舸;  张鹏远;  潘接林;  颜永红
刊名电子与信息学报
2017
卷号39期号:4页码:930-937
关键词语音识别 递归神经网络 解码器 跳帧计算
中文摘要递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model,HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。
内容类型期刊论文
源URL[http://ir.xjipc.cas.cn/handle/365002/4754]  
专题新疆理化技术研究所_多语种信息技术研究室
作者单位中国科学院声学研究所语言声学与内容理解重点实验室;中国科学院大学;中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
推荐引用方式
GB/T 7714
张舸;张鹏远;潘接林;颜永红. 基于递归神经网络的语音识别快速解码算法[J]. 电子与信息学报,2017,39(4):930-937.
APA 张舸;张鹏远;潘接林;颜永红.(2017).基于递归神经网络的语音识别快速解码算法.电子与信息学报,39(4),930-937.
MLA 张舸;张鹏远;潘接林;颜永红."基于递归神经网络的语音识别快速解码算法".电子与信息学报 39.4(2017):930-937.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace