基于空间关系的图像场景理解方法研究

题名	基于空间关系的图像场景理解方法研究
作者	金标
学位类别	博士
答辩日期	2012-05-31
授予单位	中国科学院研究生院
授予地点	北京
导师	王宏琦 ; 胡文龙
关键词	空间关系图像场景分类概率隐含语义分析模型（pLSA）空间语义交互行为识别随机文法系统（SCFG）
学位专业	信号与信息处理
中文摘要	图像场景理解是指通过计算机实现图像的语义分类和解释，空间关系是图像场景的重要特征，然而现有的图像场景理解方法对空间关系的挖掘和利用远远不够。因此，本文主要研究图像空间关系模型，进而挖掘空间关系在图像场景理解中的作用。本文围绕图像空间关系特征的提取与表达，以及空间关系特征在图像场景理解中的应用开展了下述研究工作：1．提出一种定量化的、组合表达的图像空间关系直方图模型，用于提取和表达图像的空间关系特征。已有的空间关系模型（拓扑关系、方向关系以及度量关系）基本上是相对孤立的、定性的形式化描述（度量关系除外），这些模型在现有的图像场景理解方法中得不到很好的利用。本文提出的空间关系直方图模型可以组合表达拓扑关系、方向关系、以及度量关系，并可以定量化地分类（概率表征）空间关系类型：上、下、左、右、包含、不包含、远、近等。针对目标内部是否有空洞的情况，本文给出两种计算空间关系直方图的方法：基于目标边界点的计算方法，以及基于目标区域点的计算方法。在图像场景理解过程中，空间关系直方图可以有效地表征图像的空间关系特征。2．将空间关系直方图应用到概率隐含语义分析模型（pLSA）中，提出一种基于SR-pLSA的图像场景分类方法，在分类过程中充分利用了图像的空间关系特征。针对现有的图像场景分类方法对空间关系特征利用不足的问题，本文通过计算图像场景中目标之间的空间关系直方图，并计算其空间关系统计特性，提出一种融合了主题之间空间关系特性的概率隐含语义分析模型（SR-pLSA），实现了图像空间关系特征的有效利用。采用SR-pLSA建立图像语义模型，将所得的语义向量作为支持向量机（SVM）的输入实现图像场景分类。实验结果表明本文方法取得了较好的图像场景分类性能。3．将空间关系直方图应用到动态视频场景理解中，提出一种基于空间语义的视频交互行为识别方法，挖掘了隐含在空间关系和运动方向中的空间语义信息。对于某种交互行为类别，目标之间的空间关系（拓扑关系、方向关系）以及其运动方向是逐渐变化的，本文通过分析并挖掘了五种空间语义信息（前面、后面、背对背、面对面、左右），空间语义信息的变化规律可以有效地表征交互行为类别。因此，不同于传统方法，本文通过提取运动目标之间的空间语义信息建立随机文法系统，实现交互行为类别的自动识别。本文有效地挖掘并利用了运动目标之间的空间语义信息，提出一种有效的交互行为识别思路，并取得了较好的识别性能。
公开日期	2012-06-07
内容类型	学位论文
源URL	[http://159.226.65.12/handle/80137/9724]
专题	电子学研究所_电子所博硕士学位论文_电子所博硕士学位论文_学位论文
推荐引用方式 GB/T 7714	金标. 基于空间关系的图像场景理解方法研究[D]. 北京. 中国科学院研究生院. 2012.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们