CORC  > 兰州理工大学  > 兰州理工大学
题名压缩域视频检索与挖掘关键技术研究
作者李向伟
答辩日期2010
导师李战明
关键词镜头检测 关键帧 Rough Sets 视频摘要 视频描述子
学位名称博士
英文摘要80年代后期发展起来的多媒体技术,已成为世界性技术研究和产品开发的热点,而其中的视频检索与挖掘有着广阔的应用领域和发展前景。数字视频己列为国家重点发展的信息产业领域,随着宽带网络和数字电视的迅速发展,视频点播、监控录像、交互电视、视频网站等应用需求将越来越广泛,这些应用将最终导致大量数字视频快速增加。但时,由于数字视频数据的非结构化、数据量大及冗余数据多等特点,使得现有以及将来产生的大量的数字视频在现有条件下无法利用或利用率很低,大量有价值的数据只能成为毫无意义的积累,因此研究如何从大量视频数据中快速发现我们所需要的视频,如何从大量视频数据中挖掘出有意义的信息为我们的决策服务成为新时期我们急待解决的重要问题之一。视频检索与挖掘正是在这一背景下诞生的。其综合了数字图像处理、数字视频处理、多媒体技术、数据库技术、人工智能技术、模式识别技术、概率统计、模糊数学等多学科领域,使用视频图像底层的、本质的图像与视频特征作为检索与分析的依据,克服了传统的基于属性或文本检索方式的不足,极大地提高了视频检索与挖掘的客观性与自动化。论文针对视频检索与挖掘的关键技术展开讨论,在压缩域深该而详细地分析与研究了基于I帧的视频镜头检测技术、基于RS理论的关键帧提取技术、自动分层视频摘要提取技术及有效视频颜色描述子提取技术等一系列重要问题,取得了以下方面的研究成果。1.在视频镜头检测方面,提出了一种高效的基于I帧的压缩域镜头检测算法,此算法在深入分析MPEG-2视频国际标准的基础上得出视频在压缩域体现为I帧、P帧及B帧三种类型的帧,而I帧为压缩域视频的主要信息携带者,而且在压缩域体现为采用DCT变换得到的DCT系数,利用其进行视频镜头检测一方面大大压缩了视频处理的数据量,另一方面,克服了传统的解压过程中的一些复杂的运算,从而大大提高了镜头检测的效率。2.在关键帧提取方面,提出了一种新的基于RS理论的压缩域关键帧提取算法,算法首先在压缩域提取I帧及其组成成分DCT和DC系数,由其DC系数建立信息系统模型,依据RS的属性约简理论得到精简的I帧集,精简的I帧集为不可以约简的I帧的集合,即包含了视频镜头中的所有信息且消除了部分冗余信息。一方面,算法将RS理论引入到关键帧提取,科学、高效地得到镜头的关键帧,克服了传统的关键帧数目不科学的不足,另一方面,算法直接在压缩域进行,避免了大量的解压运算,从而提高了关键帧提取算法的效率。3.在视频摘要提取方面,提出了一种压缩域分层视频摘要提取技术。对于一个镜头或场景而言,一段重要的主题一般要用几帧变化很小的帧来表现,也就是说,内容越重要,需要重复的帧数一定越多,内容越不重要,需要的帧越少,根据这一基本原理,算法首先依据RS的属性约简理论对I帧构建的信息系统进行约简,然后依约简掉的I帧数目对其进行排序,约简掉的I帧越多,视频要表现的内容越重要,在视频摘要产生时应优先展示,因为它代表了本段视频最重要的信息,依次类推,用户可根据自己的实际需求和条件来浏览不同层次的视频摘要。4.在视频描述子提取方面,提出了一种时空颜色描述子提取算法,算法根据MPEG国际压缩标准,首先从压缩域中提取DCT系数和DC系数,然后,依得到的DC系数建立视频流信息系统,最后根据RS的属性约简理论得到信息系统的核,核是不可以约简的视频帧,然后融合核可得到有效的视频描述子。因为此描述子用帧的先后次序反映了视频的时间特征,又用DC系数的空间分布反映了视频的空间信息,因此视频信息系统的核可认为是一种有效的时空颜色描述子。
语种中文
页码94
URL标识查看原文
内容类型学位论文
源URL[http://ir.lut.edu.cn/handle/2XXMBERH/89665]  
专题兰州理工大学
作者单位兰州理工大学
推荐引用方式
GB/T 7714
李向伟. 压缩域视频检索与挖掘关键技术研究[D]. 2010.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace