题名 | 复杂背景下的实例级与类别级物体识别技术研究 |
作者 | 王双 |
答辩日期 | 2014-05-29 |
文献子类 | 硕士 |
授予单位 | 中国科学院研究生院 |
授予地点 | 北京 |
导师 | 蒋树强 |
关键词 | 物体识别 部分重复图像检索 近邻投票 手持物体识别 区域生长 空间金字塔匹配核 |
学位专业 | 其它专业 |
英文摘要 | 物体识别是人类视觉系统最重要的功能,使计算机实现自动物体识别在人类生活与工业生产中都具有十分广阔的应用前景,这也是计算机视觉领域内最重要的研究目标之一。 根据人类对物体的感知层次,可以将物体识别分为实例级与类别级两大类。实例级是指同一个具体物体(例如埃菲尔铁塔),类别级是指实例对应的基本概念(例如建筑)。不同层次的识别,需要更具针对性的方法。 对于实例级物体识别,主要的两种思路分别是基于特征匹配与基于分类模型。前者的缺陷在于特征匹配的计算复杂度高,无法满足实时性需求。相关工作的改进都面向图像检索领域,鲜有涉及物体识别问题。后者的缺陷在于全局特征受复杂背景噪声的影响过大,同时分类模型不适用于大规模多物体识别。 对于类别级物体识别,二维图像特征难以准确地刻画复杂背景下的类内相似与类间差异,使用三维图像能够适当缓解,但是复杂背景下的预分割与基于点云的形状特征,仍然存在很大的改进空间。 为了解决上述问题,本文的研究针对实例级与类别级物体识别,分别从算法、数据集、系统三方面做出如下工作与贡献: (1) 对于实例级物体识别,本文提出一种基于部分重复图像检索技术与局部约束近邻投票方法的识别框架。首先利用视觉词典树加速局部特征到视觉单词的量化计算,并通过倒排索引与空间验证完成大规模、精准、快速的特征匹配。基于输入图像与模板图的相似度,本文提出一种局部约束近邻投票方法,结合了类别无关与相关约束,实现更有效的类别置信度计算。该算法能够在复杂背景下进行鲁棒地多物体识别。本文提出实例级物体数据集INSTRE,并在该数据集上,验证了识别框架的有效性。 (2) 对于类别级物体识别,本文提出手持物体识别概念。使用人体骨骼数据计算物体候选位置,通过区域生长的方法进行物体分割。该方法充分利用了人体骨骼空间结构,能够处理手部定位失准的情况,具有稳定的容错能力与计算效率。针对物体点云数据,本文提出空间金字塔点对特征,通过三维空间金字塔匹配核将点对的空间结构信息嵌入特征中,还实现了不同尺度下的点对采样。面向人、物交互应用,该算法能够在复杂背景下进行稳定有效的物体分割与识别。本文提出手持物体数据集HOD,并在该数据集上验证了方法的有效性。 (3) 基于前文提出的算法,开发了实例级多物识别系统ObjectSense与手持物体识别演示系统。作为应用,分别开发了图像检索与智能服务系统ISIA与机器人“机器博士”的视觉交互功能,通过真实的系统环境验证了所提算法在复杂背景下的识别能力。 |
语种 | 中文 |
学科主题 | 计算机应用其他学科 |
公开日期 | 2014-06-25 |
内容类型 | 学位论文 |
源URL | [http://ictir.ict.ac.cn/handle/311040/1907] ![]() |
专题 | 中国科学院计算技术研究所学位论文_2014硕士 |
推荐引用方式 GB/T 7714 | 王双. 复杂背景下的实例级与类别级物体识别技术研究[D]. 北京. 中国科学院研究生院. 2014. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论