题名 | 汉语非特定人连续语音识别系统的研究与实现 |
作者 | 高强 |
学位类别 | 工学硕士 |
答辩日期 | 1996-07-01 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 黄泰翼 |
学位专业 | 模式识别与智能系统 |
中文摘要 | 随着计算机技术的发展,人们对计算机人机接口的智能化程度 要求越来越高.语音识别作为一种最自然的人机对话手段正越来越 受到人们的关注非特定人,大词汇量,连续语音和自然的说话方式 是目前语音识别的研究重点和发展方向,也是语音识别走向实用化 的关键国外已经在实验室研制成功了以听写机为应用背景的2万 词书面语连续语音识别系统和以民航信息查询为应用背景的口语 识别系统。 针对汉语语音识别,国内一些单位也已做了有益的工 作。 本文则介绍了我们实现的一个1004词汉语非特定人连续语音识 别系统。 它针对北京市旅游信息咨询这一任务领域, 采用 HMM/VQ, 有限状态文法和Viterbi Beam搜索为核心技术, 以语音组 建立的60男+60女语音数据库作为非特定人的训练数据。系统采用细 化的声韵母作为最基本的声学建模单元, 针对汉语中韵母比声母 容易识别的特点, 将Viterbi Beam搜索的方向取成时间上的逆序, 即 从一句话的结束处向开始处搜索。 由于汉语音节总是声母在前, 韵 母在后的结构, 逆序的搜索方向使得搜索总是从容易识别的韵母 而不是从难识别的声母开始, 从而降低了Viterbi Beam搜索开始时剪 裁掉最优解的风险。 在搜索的剪裁策略等方面我们也做了各种比 较,获得了有益的结果。通过将句子的语义信息嵌入在搜索的语法 网络中, 本系统对识别的句子具有理解功能。 作为中国科学院“八五”重大科研项目“汉语全部单音节的识 别和合成及非特定人语音识别”课题的一部分, 本系统在国内率 先将非特定人,连续语音和大词汇量(1000词以上)综合考虑进行了 研究。经项目鉴定委员会的评审,在语言模型Perplexity为20的情况, 词识别率达到95%(数据库和现场口呼形式测试),认为处于国内领 先,达到国际先进水平。为以后汉语非特定人连续语音识别的进一 步研究打下了一个良好的基础。 |
语种 | 中文 |
其他标识符 | 393 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/7164] |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 高强. 汉语非特定人连续语音识别系统的研究与实现[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 1996. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论