普通话语音识别中的神经网络语言模型的比较研究
马浩鑫2,3; 白烨2,3; 易江燕3; 陶建华1,2,3
2019-09
会议日期2019-8
会议地点青海西宁
英文摘要

语言模型是语音识别的重要组成部分,在具体实现时,模型参数设置会影响识别效果。本文对基于神经网络的语 言模型展开研究,在 AISHELL-1 中文数据集上进行解码实验,以识别结果的词错率以及语言模型的大小和困惑度为评价指标, 在前馈神经网络语言模型和循环神经网络语言模型这两种模型上广泛而详细地比较了不同网络参数对于识别效果的影响,如:激活函数、N 元语法窗口长度、循环结构等。此外,实验还比较了有无共享 Embedding 结构对语言模型的影响,证明了该结构确实 可以在大大减少模型参数的基础上对提升语言模型性能。

语种中文
内容类型会议论文
源URL[http://ir.ia.ac.cn/handle/173211/48842]  
专题模式识别国家重点实验室_智能交互
作者单位1.中国科学院自动化研究所 中国科学院脑科学与智能技术研究中心,北京
2.中国科学院大学 人工智能技术学院,北京
3.中国科学院自动化研究所 模式识别国家重点实验室,北京
推荐引用方式
GB/T 7714
马浩鑫,白烨,易江燕,等. 普通话语音识别中的神经网络语言模型的比较研究[C]. 见:. 青海西宁. 2019-8.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace