题名基于时空上下文的人体动作识别方法研究
作者胡琼
答辩日期2011-05-29
文献子类硕士
授予单位中国科学院研究生院
授予地点北京
导师黄庆明教授
关键词动作识别 时空局部特征 特征点轨迹 时空上下文 Tf-idf
学位专业其它专业
英文摘要人体动作识别是计算机视觉领域的关键问题,在多个领域有着广阔的应用前景。由于存在背景复杂、摄像机运动、遮挡和物体变化等因素,使得如何提取“好”的特征以及获取鲁棒的特征表达,对动作识别至关重要。时空局部特征和“视觉词袋”(BoWs)的表示方法在人体动作识别领域得到了广泛的应用,但是这个框架通常忽略了视频单词之间的时空关系,导致在动作识别过程中的模糊性,尤其是对真实自然场景下拍摄的动作视频,这种性能上的退化尤为明显。 为了解决上述问题,本文的研究从对人体动作模式的建模和特征的表述入手,在人体动作识别中引入时空上下文信息,寻求人体动作鲁棒、有效的表达方式,在特征构造中融入时空局部特征之间潜藏的结构信息及时空约束,以提高动作识别的准确率。在此技术路线的指导下,本文对动作局部特征描述子时空上下文的建模方法进行了分析与研究。本文的主要研究内容与贡献总结如下: (1)在特征构造上,从时空兴趣点形成的视频单词在三维时空中的几何关系出发,考虑他们之间的时空邻近性以及共生性,将一个视频单词时空邻域范围内其他视频单词的分布信息作为该单词的时空上下文(context),并通过统计和信息检索里常见的TF-IDF(Term Frequency-Inverse Document Frequency)加权机制,得到了两种紧凑的动作描述方式——代表性时空视频词组(ST-DVPs)和代表性时空视频单词团体(ST-DVCs),在一定程度上融入了动作中的时空结构信息。 (2)在特征构造上,为了克服时空局部特征时间信息缺失的问题,采用KLT跟踪器对时空局部特征进行跟踪,将得到的时空特征跟踪轨迹作为基本的处理、描述单元。与ST-DVPs和ST-DVCs相比,它能在更长的时间尺度上对运动进行描述,进而更好地捕获运动的动态变化与转变过程。至于轨迹之间关系的建模,因不同动作在特征分布上存在一些比较稳定的模式,表现在特征点的位置和速度等之间存在一定关系,因而提出轨迹相对位置、相对速度关系元来捕获这类时空关系。 (3)在动作识别上,采用向量量化技术和BoWs的表示方法,将(1) 与(2)中构造的不同特征与传统的动作描述方式置于统一的处理流程下,并通过直方图级联、多通道核函数学习等方式实现不同特征之间的融合,在本领域较具挑战性的公共测试数据库上, 如:KTH人体动作数据库、YouTube动作数据库以及UT-Interaction交互动作数据库等,均取得了较好的结果,动作识别准确率得到不同程度的提高。 (4)开发、实现了一个基于时空上下文建模,面向视频监控智能分析技术研究与开发的动作分类演示系统,该系统界面友好、易于操作,在人体动作数据库和非人体动作数据库(比如,Mouse数据库)上均取得了较满意的结果。
语种中文
学科主题计算机图象处理
公开日期2011-07-04
内容类型学位论文
源URL[http://ictir.ict.ac.cn/handle/311040/1182]  
专题中国科学院计算技术研究所学位论文_2011硕士
推荐引用方式
GB/T 7714
胡琼. 基于时空上下文的人体动作识别方法研究[D]. 北京. 中国科学院研究生院. 2011.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace