电视体育比赛音频内容的自动结构化研究

CORC > 声学研究所 > 中国科学院声学所 > 声学所博硕士学位论文 > 1981-2009博硕士学位论文

题名	电视体育比赛音频内容的自动结构化研究
作者	王磊
学位类别	博士
答辩日期	2006-05-31
授予单位	中国科学院声学研究所
授予地点	声学研究所
关键词	音频处理基于内容的音频归类音频分段事件检测体育比赛足球 MPEG-7低层音频描述
学位专业	信号与信息处理
中文摘要	随着计算机技术的快速发展和网络的蓬勃兴起，人们生活中能够接触到的数字多媒体内容也越来越多。相应地，人们迫切需要新的技术来实现对海量的数字多媒体资源进行有效的管理和检索。音频是多媒体内容的一个重要组成部分，通过对音频的分析可以有效地提取出多媒体内容的语义信息。同视频相比，音频上的处理还具有计算量小的优点。因此，近年以来，基于内容的音频的分段、归类和提取成为了研究热点。本文主要探讨音频内容提取和管理的一个重要的研究方向：电视体育比赛的音频内容的结构化，即从音频的角度对电视体育比赛的内容结构进行分析。本文的主要工作和研究包括方面： 1. 用于电视体育比赛内容分析的音频特征提取：本文提取了MPEG-7标准中的低级音频描述作为特征集，并应用在了电视体育比赛的内容分析中。另外，我们还提取了传统上得到广泛应用的MFCC特征，并通过实验对比了MFCC和MPEG-7特征集在音频内容分析中的性能。 2. 电视体育比赛的归类和分段算法的研究：在对电视体育比赛进行按内容归类和分段时，本文利用了SVM算法和图像处理中经常使用的AdaBoost算法。在构造AdaBoost分类器时，本文中提出了一种利用K-L变换和GMM模型构建弱分类器组的方法，并应用在了我们的工作中，收到了良好的效果。 3. 电视体育比赛中的事件检测：本文主要分析了欢呼声、哨声和解说员的激动语音这三种体育比赛中常见的音频事件的频谱特征和检测方法，并提出了一种类似于检测基音的哨声的检测方法。 4. 基于音频的体育比赛内容分析系统的可移植性的初步研究：由于体育比赛的内容分析中不可避免地应用了相应比赛项目的域知识（高层规则），因此，对于不同的体育项目来说，其内容分析系统是不能通用的。本文中为了增强内容分析系统对不同体育项目的兼容性，就高层规则的规范化输入的形式进行了初步研究。 5. 相关领域的研究工作：介绍了作者在相关的领域的研究工作，包括两个项目的工作：音乐的按情绪分类和基于音频的电视新闻节目的主题提取和聚类。
语种	中文
公开日期	2011-05-07
页码	151
内容类型	学位论文
源URL	[http://159.226.59.140/handle/311008/68]
专题	声学研究所_声学所博硕士学位论文_1981-2009博硕士学位论文
推荐引用方式 GB/T 7714	王磊. 电视体育比赛音频内容的自动结构化研究[D]. 声学研究所. 中国科学院声学研究所. 2006.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们