基于时空上下文的人体动作识别方法研究

CORC > 计算技术研究所 > 中国科学院计算技术研究所 > 中国科学院计算技术研究所学位论文 > 2011硕士

题名	基于时空上下文的人体动作识别方法研究
作者	胡琼
答辩日期	2011-05-29
文献子类	硕士
授予单位	中国科学院研究生院
授予地点	北京
导师	黄庆明教授
关键词	动作识别时空局部特征特征点轨迹时空上下文 Tf-idf
学位专业	其它专业
英文摘要	人体动作识别是计算机视觉领域的关键问题，在多个领域有着广阔的应用前景。由于存在背景复杂、摄像机运动、遮挡和物体变化等因素，使得如何提取“好”的特征以及获取鲁棒的特征表达，对动作识别至关重要。时空局部特征和“视觉词袋”（BoWs）的表示方法在人体动作识别领域得到了广泛的应用，但是这个框架通常忽略了视频单词之间的时空关系，导致在动作识别过程中的模糊性，尤其是对真实自然场景下拍摄的动作视频，这种性能上的退化尤为明显。为了解决上述问题，本文的研究从对人体动作模式的建模和特征的表述入手，在人体动作识别中引入时空上下文信息，寻求人体动作鲁棒、有效的表达方式，在特征构造中融入时空局部特征之间潜藏的结构信息及时空约束，以提高动作识别的准确率。在此技术路线的指导下，本文对动作局部特征描述子时空上下文的建模方法进行了分析与研究。本文的主要研究内容与贡献总结如下： (1)在特征构造上，从时空兴趣点形成的视频单词在三维时空中的几何关系出发，考虑他们之间的时空邻近性以及共生性，将一个视频单词时空邻域范围内其他视频单词的分布信息作为该单词的时空上下文（context），并通过统计和信息检索里常见的TF-IDF（Term Frequency-Inverse Document Frequency）加权机制，得到了两种紧凑的动作描述方式——代表性时空视频词组（ST-DVPs）和代表性时空视频单词团体（ST-DVCs），在一定程度上融入了动作中的时空结构信息。 (2)在特征构造上，为了克服时空局部特征时间信息缺失的问题，采用KLT跟踪器对时空局部特征进行跟踪，将得到的时空特征跟踪轨迹作为基本的处理、描述单元。与ST-DVPs和ST-DVCs相比，它能在更长的时间尺度上对运动进行描述，进而更好地捕获运动的动态变化与转变过程。至于轨迹之间关系的建模，因不同动作在特征分布上存在一些比较稳定的模式，表现在特征点的位置和速度等之间存在一定关系，因而提出轨迹相对位置、相对速度关系元来捕获这类时空关系。 (3)在动作识别上，采用向量量化技术和BoWs的表示方法，将(1) 与(2)中构造的不同特征与传统的动作描述方式置于统一的处理流程下，并通过直方图级联、多通道核函数学习等方式实现不同特征之间的融合，在本领域较具挑战性的公共测试数据库上，如：KTH人体动作数据库、YouTube动作数据库以及UT-Interaction交互动作数据库等，均取得了较好的结果，动作识别准确率得到不同程度的提高。 (4)开发、实现了一个基于时空上下文建模，面向视频监控智能分析技术研究与开发的动作分类演示系统，该系统界面友好、易于操作，在人体动作数据库和非人体动作数据库（比如，Mouse数据库）上均取得了较满意的结果。
语种	中文
学科主题	计算机图象处理
公开日期	2011-07-04
内容类型	学位论文
源URL	[http://ictir.ict.ac.cn/handle/311040/1182]
专题	中国科学院计算技术研究所学位论文_2011硕士
推荐引用方式 GB/T 7714	胡琼. 基于时空上下文的人体动作识别方法研究[D]. 北京. 中国科学院研究生院. 2011.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们