CORC  > 电子学研究所  > 电子所博硕士学位论文  > 学位论文
题名基于复杂对象统计学习的图像理解方法研究
作者孙显
学位类别博士
答辩日期2009-05-20
授予单位中国科学院电子学研究所
授予地点电子学研究所
导师王宏琦
关键词图像理解 目标识别 场景分类 基于对象 多尺度分割 产生式学习 判别式学习
其他题名Complicated Object-based Statistical Learning Methods for Image Understanding
中文摘要图像理解的基本任务是通过计算机解译图像场景并认知场景中的目标。作为当前计算机视觉领域的研究热点,以及遥感图像应用的关键技术,图像理解具有重要的理论意义和广阔的应用前景。 本文以基于对象的思想和统计学习理论为依据,从图像理解的数据表达和信息归纳入手,研究复杂对象的多尺度构建和特征语义表征,以及判别式和产生式方法的建模、求解和优化。同时,研究将若干算法模型置于一个联合框架下,使它们取长补短,组合成新的复杂方法,综合利用中低层视觉特征和高层语义信息,解决了复杂图像中目标识别和场景分类的若干问题。 本文的主要创新点为: 1.提出一种基于区域对象的概率标记方法,用于特定类别目标的提取。该方法在图割算法的基础上,采用Pyramid-cut构建对象网络,能自动选择尺度层次,并实现整体最优划分,提高了多尺度分割的速度。同时提出一种结合上下文的概率标记,设计空间相关函数定量分析对象间的相互关系,平滑标记后消除了大部分背景噪声的影响。实验结果表明该方法具有较高的目标提取效率和抗干扰能力。 2.提出一种基于泛化对象的级联学习方法,用于多类目标的识别和定位。该方法将边界、区域和特征点组合成泛化对象,通过尺度、角度、目标质心距等变换,较好地摆脱了缩放、旋转等制约。方法中提出对象配对组合的级联式训练,并动态构建对象字典,得到的判别式分类器能较好区分同一类别目标中的不同示例和新出现的目标类别。实验结果表明该方法有效改善了基于对象处理方法的推广能力。 3.提出一种基于对象语义树的匹配学习方法,用于多类目标的识别和提取。该方法以隐含语义对象为树结点,通过自上而下的匹配学习抽取共有最大子树,并递归组合为对象语义树,能更为全面地表达目标整体结构,并降低了对样本标注和数量的要求。方法在训练中还提出一种一致性对象对,改进结点权重的计算方式,提高了学习过程中的匹配精度。实验结果表明该方法具有较高的鲁棒性和适用性。 4.提出一种基于空间对象语义向量的混合学习方法,用于复杂图像的场景分类。该方法在金字塔匹配核的基础上,提出一种对象空间金字塔匹配模型,构建包含图像数据和层次信息的中间向量,弥补了语义鸿沟的缺陷。同时结合判别式方法进行训练,减少了学习中的计算复杂度,提高了场景分类器的可信性。在自然和遥感场景图像上的实验结果表明该方法具备较高的学习性能和分类精度。 5.提出一种基于分等级对象语义图的混合学习方法,用于复杂图像的目标识别。该方法提出一种置信对象网络,利用局部分类器统计对象特性,利用消息机制传递对象间的相互影响,提高了空间信息的利用率。在此基础上构建的分等级对象语义图,增强了目标与背景间、目标部件间的语义约束。同时,方法中采用产生式和判别式交叉的螺旋式递进学习,在训练误差、内存消耗和识别效率上均有所改进。在自然和遥感目标图像上的实验结果表明该方法能实现对复杂目标结构的语义解释,提高了目标识别的准确度。
语种中文
公开日期2011-07-19
页码156
内容类型学位论文
源URL[http://159.226.65.12/handle/80137/8793]  
专题电子学研究所_电子所博硕士学位论文_电子所博硕士学位论文_学位论文
推荐引用方式
GB/T 7714
孙显. 基于复杂对象统计学习的图像理解方法研究[D]. 电子学研究所. 中国科学院电子学研究所. 2009.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace