题名广播新闻音频的结构化分析
作者王炜
学位类别博士
答辩日期2007-06-01
授予单位中国科学院声学研究所
授予地点声学研究所
关键词结构化分析 音频信息 说话人日志 新闻主题
学位专业信号与信息处理
中文摘要现实生活中存在大量的广播新闻类音频,而手工分析整理这些广播新闻则面临着成本高、劳动强度大、标准难以统一、可信度受到局限等缺陷。广播新闻的研究近年来已成为音频处理、音频信息检索以及音频内容研究领域的重要课题之一。 音频流是一种线性平面的流式结构,它缺乏明确的结构信息和按语义表示的组织和索引,这使得音频的检索和浏览都非常困难。本文结合广播新闻的特点,构建了一个广播新闻音频结构化分析系统,主要从三个方面对广播新闻进行研究讨论:音频信息、说话人信息以及新闻主题信息。在音频信息分析中,系统通过音频匹配搜索确定广播新闻中的节目信息结构,通过音频分割、聚类和分类技术分析音频类别信息。在说话人信息分析中,系统通过说话人分割、说话人聚类和说话人身份判别来完成说话人日志的任务。在新闻主题分析中,系统通过新闻主题分类和新闻主题词提取对新闻内容进行分析。除了上述三方面的研究外,本文还对特征参数提取、距离测度度量、分割聚类方法的选择上进行了讨论,结合实验结果进行了分析讨论。 本文研究工作的主要创新点有: 1、针对广播新闻环境中音频信号较复杂的特点,提出一种变长音频匹配算法。相比传统的固定长音频匹配算法,该算法能够更好的检测出广播节目的提示音频。通过对CCTV1频道的700段节目提示音频的匹配实验,该算法与传统音频匹配算法相比,等错率相对下降了8%。 2、在说话人聚类研究中,对传统层次聚类中的误差平方和准则进行了改进。在分析和讨论离线层次聚类法和在线聚类方法的缺陷后,提出了一种基于决策树的在线说话人聚类算法。在线聚类过程中,通过决策树来保留可能聚类的结果,从而达到一个软判决的效果。实验结果表明,该算法相比层次聚类法速度提高了44%,同时错误率相对降低了4.5%;相比在线聚类法,该算法的错误率相对降低了57%。 3、传统的新闻信息分析方法,需要事先建立一个大规模的平衡语料库。本论文提出了一种基于搜索引擎结果的快速类别训练方法。该方法利用新闻搜索引擎返回的检索结果,训练各个新闻类别的权重,简便高效的实现了新闻分类任务。
语种中文
公开日期2011-05-07
页码111
内容类型学位论文
源URL[http://ir.ioa.ac.cn/handle/311008/207]  
专题声学研究所_声学所博硕士学位论文_1981-2009博硕士学位论文
推荐引用方式
GB/T 7714
王炜. 广播新闻音频的结构化分析[D]. 声学研究所. 中国科学院声学研究所. 2007.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace