CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 博士学位论文
题名目标检测中的人工神经网络结构设计及算法研究
作者彭君然
答辩日期2020-12-06
文献子类博士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师谭铁牛
关键词目标检测,低功耗,神经网络搜索,长尾数据分布,多标签识别
学位专业模式识别与智能系统
英文摘要

目标检测一直是计算机视觉里最基本和最活跃的领域之一。该任务的核心目标是在给定图像及所关注类别的情况下,在图中准确锁定给定类别的每个目标实例的位置,以图框来表示其位置及边界,并返回各个实例的类别。它可以视为是图像分类任务的延伸,也构成了各种高层视觉任务的基础,如目标实例分 割、目标跟踪、人脸识别、行人识别、行为识别等等。目标检测也是在工业界应用最广泛的计算机视觉技术之一,为大量下游业务提供核心支持,包括人机交互、自动驾驶、智能监控、图像检索等等。目标检测从不同的角度出发有多种分类方式。根据提取特征的方式,目标检测可以被分为传统手工特征方法和深度学习特征方法两种。根据检测的目标类别,目标检测又可以被分为针对特定类别的检测和通用目标检测。前者包含人脸检测、车辆检测和行人检测等,检测方法可以针对特定类别的形状分布等先验信息进行定制化;后者往往要求检测器同时检测出各种类别的目标实例。

目标检测在工业中应用十分广泛,因此对于该技术的需求与期待与其实用性密不可分。从实用性出发,对这项技术提出的需求可归纳为以下三类:减小目标检测计算功耗,提高目标检测精度,完成特定或极端数据分布下的目标检测。针对这些需求,本文分别进行了深入的探讨与研究。

本文的研究内容和贡献可归纳如下:

1. 本文提出了一种在空间维度稀疏计算的网络结构,并设计了棋盘式采样卷积,大幅降低了神经网络的计算量。实验表明该算法在分类任务和检测任务上均可以做到在精度改变不大的情况下,显著地减小功耗。

2. 针对提高检测精度的需求,本文提出了一种基于统计学习的网络结构设计方法,通过分析物体尺度与网络有效感受野之间的关系,发现了卷积的膨胀系数能显著地改变网络的有效感受野,设计了一套自适应地设计与调整网络感受野的方法,实验表明该算法可以与各种检测算法结合,在保持功耗不改变的情况 下有效提升目标检测任务精度。

3. 在第二个创新点的基础上,本文进而提出了一种面向目标检测任务的神经网络搜索算法,设计了一套更加适合检测任务的搜索空间,可以同时搜索运算单元的种类与运算单元的通道数。实验结果表明,该算法得到的网络结构能够在 功耗不变的情况下,有效地提升检测任务的准确率,同时可以显著地增大网络的有效感受野。

4. 最后,本文提出了一种超大规模数据条件下的目标检测算法,设计了特定的损失函数以应对多标签条件下不同正标签互相压制的问题,提出了混合采样方式并结合相应的混合训练策略,改善了长尾分布问题,实验验证了该方法的显著效果。

语种中文
页码108
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/41620]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
彭君然. 目标检测中的人工神经网络结构设计及算法研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2020.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace