汉语非特定人连续语音识别系统的研究与实现

CORC > 自动化研究所 > 中国科学院自动化研究所 > 毕业生 > 硕士学位论文

题名	汉语非特定人连续语音识别系统的研究与实现
作者	高强
学位类别	工学硕士
答辩日期	1996-07-01
授予单位	中国科学院自动化研究所
授予地点	中国科学院自动化研究所
导师	黄泰翼
学位专业	模式识别与智能系统
中文摘要	随着计算机技术的发展，人们对计算机人机接口的智能化程度要求越来越高．语音识别作为一种最自然的人机对话手段正越来越受到人们的关注非特定人，大词汇量，连续语音和自然的说话方式是目前语音识别的研究重点和发展方向，也是语音识别走向实用化的关键国外已经在实验室研制成功了以听写机为应用背景的2万词书面语连续语音识别系统和以民航信息查询为应用背景的口语识别系统。针对汉语语音识别，国内一些单位也已做了有益的工作。本文则介绍了我们实现的一个1004词汉语非特定人连续语音识别系统。它针对北京市旅游信息咨询这一任务领域，采用 HMM／VQ，有限状态文法和Viterbi Beam搜索为核心技术，以语音组建立的60男+60女语音数据库作为非特定人的训练数据。系统采用细化的声韵母作为最基本的声学建模单元，针对汉语中韵母比声母容易识别的特点，将Viterbi Beam搜索的方向取成时间上的逆序，即从一句话的结束处向开始处搜索。由于汉语音节总是声母在前，韵母在后的结构，逆序的搜索方向使得搜索总是从容易识别的韵母而不是从难识别的声母开始，从而降低了Viterbi Beam搜索开始时剪裁掉最优解的风险。在搜索的剪裁策略等方面我们也做了各种比较，获得了有益的结果。通过将句子的语义信息嵌入在搜索的语法网络中，本系统对识别的句子具有理解功能。作为中国科学院“八五”重大科研项目“汉语全部单音节的识别和合成及非特定人语音识别”课题的一部分，本系统在国内率先将非特定人，连续语音和大词汇量(1000词以上)综合考虑进行了研究。经项目鉴定委员会的评审，在语言模型Perplexity为20的情况，词识别率达到95％(数据库和现场口呼形式测试)，认为处于国内领先，达到国际先进水平。为以后汉语非特定人连续语音识别的进一步研究打下了一个良好的基础。
语种	中文
其他标识符	393
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/7164]
专题	毕业生_硕士学位论文
推荐引用方式 GB/T 7714	高强. 汉语非特定人连续语音识别系统的研究与实现[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 1996.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们