CORC  > 电子学研究所  > 电子所博硕士学位论文  > 学位论文
题名基于空间关系的图像场景理解方法研究
作者金标
学位类别博士
答辩日期2012-05-31
授予单位中国科学院研究生院
授予地点北京
导师王宏琦 ; 胡文龙
关键词空间关系 图像场景分类 概率隐含语义分析模型(pLSA) 空间语义 交互行为识别 随机文法系统(SCFG)
学位专业信号与信息处理
中文摘要图像场景理解是指通过计算机实现图像的语义分类和解释,空间关系是图像场景的重要特征,然而现有的图像场景理解方法对空间关系的挖掘和利用远远不够。因此,本文主要研究图像空间关系模型,进而挖掘空间关系在图像场景理解中的作用。本文围绕图像空间关系特征的提取与表达,以及空间关系特征在图像场景理解中的应用开展了下述研究工作:1.提出一种定量化的、组合表达的图像空间关系直方图模型,用于提取和表达图像的空间关系特征。已有的空间关系模型(拓扑关系、方向关系以及度量关系)基本上是相对孤立的、定性的形式化描述(度量关系除外),这些模型在现有的图像场景理解方法中得不到很好的利用。本文提出的空间关系直方图模型可以组合表达拓扑关系、方向关系、以及度量关系,并可以定量化地分类(概率表征)空间关系类型:上、下、左、右、包含、不包含、远、近等。针对目标内部是否有空洞的情况,本文给出两种计算空间关系直方图的方法:基于目标边界点的计算方法,以及基于目标区域点的计算方法。在图像场景理解过程中,空间关系直方图可以有效地表征图像的空间关系特征。2.将空间关系直方图应用到概率隐含语义分析模型(pLSA)中,提出一种基于SR-pLSA的图像场景分类方法,在分类过程中充分利用了图像的空间关系特征。针对现有的图像场景分类方法对空间关系特征利用不足的问题,本文通过计算图像场景中目标之间的空间关系直方图,并计算其空间关系统计特性,提出一种融合了主题之间空间关系特性的概率隐含语义分析模型(SR-pLSA),实现了图像空间关系特征的有效利用。采用SR-pLSA建立图像语义模型,将所得的语义向量作为支持向量机(SVM)的输入实现图像场景分类。实验结果表明本文方法取得了较好的图像场景分类性能。3.将空间关系直方图应用到动态视频场景理解中,提出一种基于空间语义的视频交互行为识别方法,挖掘了隐含在空间关系和运动方向中的空间语义信息。对于某种交互行为类别,目标之间的空间关系(拓扑关系、方向关系)以及其运动方向是逐渐变化的,本文通过分析并挖掘了五种空间语义信息(前面、后面、背对背、面对面、左右),空间语义信息的变化规律可以有效地表征交互行为类别。因此,不同于传统方法,本文通过提取运动目标之间的空间语义信息建立随机文法系统,实现交互行为类别的自动识别。本文有效地挖掘并利用了运动目标之间的空间语义信息,提出一种有效的交互行为识别思路,并取得了较好的识别性能。
公开日期2012-06-07
内容类型学位论文
源URL[http://159.226.65.12/handle/80137/9724]  
专题电子学研究所_电子所博硕士学位论文_电子所博硕士学位论文_学位论文
推荐引用方式
GB/T 7714
金标. 基于空间关系的图像场景理解方法研究[D]. 北京. 中国科学院研究生院. 2012.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace