CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名基于注意力机制的图像语义边缘检测方法研究
作者陈宇航
答辩日期2022-05-25
文献子类硕士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师孟高峰
关键词语义边缘检测 注意力机制 水线检测 特征融合
学位专业模式识别与智能系统
英文摘要

语义边缘检测是计算机视觉领域的经典研究任务之一,其旨在识别并定位
图像中目标物体的边缘像素。在早期的研究过程中,研究人员主要依据图像的颜
色、梯度和纹理信息来检测边缘,如手工设计的Sobel 算子。这类方法虽然计算
复杂度低,但是易受环境因素影响,且鲁棒性差,难以满足复杂场景的检测精度
需求。此外,高度依赖人工设计的特征提取器也限制了这类方法性能的提升。
近年来,随着深度学习技术的高速发展,卷积神经网络大规模应用于计算机
视觉领域,语义边缘检测算法的性能有了质的提升。传统方法抗噪声能力弱且缺
乏对特定边缘的选择能力,所以只适用于低精度的边缘提取,而基于深度学习的
语义边缘检测算法不仅鲁棒性强且能够针对感兴趣的边缘进行学习,因而受到研
究人员的重点关注。以CASENet 为代表的全卷积网络是语义边缘检测的常用方
法,这类方法通常采用编码器-解码器结构。编码器在卷积过程中不断下采样,从
而能够提取不同尺度的特征。解码器将融合之后的特征图恢复至原始的分辨率。
这类方法主要有两点缺陷:一是高度下采样使得大量图像边缘细节信息丢失;二
是CNN 结构难以对远距离的上下文信息进行建模,导致大量的边缘检测错误。
针对上述问题,本文在现有网络的研究基础上,引入注意力机制并设计了新的语
义边缘检测模型。实验表明,注意力机制的引入能够有效增强图像像素之间长距
离依赖的建模能力,从而提升语义边缘检测任务的精度。本文的主要贡献如下:
(1)提出了一种基于注意力机制的语义边缘检测网络——SEDTR。该网络
在传统编码器-解码器的基础上引入双歧路分支,两分支采用Transformer 结构
来分别提取低层边缘信息和高层语义信息,特征在输入解码器前利用跨分支的注
意力机制进行融合。实验表明,SEDTR 的检测精度达到了当前的SOTA(State
Of The Art) 水平。
(2)提出了一种基于注意力机制的轻量化船舶水线检测网络——WLNet。该
网络将语义分割作为辅助任务纳入水线检测网络框架,并基于注意力机制设计
了特征提取和特征融合模块,增强模型对水线边缘像素的感知能力。此外,还利
用水线的连续性特征以及双任务的对偶性质,构建了用于水线检测的新的损失
函数,提升了水线检测的精度。实验表明,在包含1000 幅从黄骅港实际采集的
水尺图像数据集上,与现有方法相比,本文方法能够大幅提升水线检测精度。

语种中文
页码63
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/48746]  
专题毕业生_硕士学位论文
通讯作者陈宇航
推荐引用方式
GB/T 7714
陈宇航. 基于注意力机制的图像语义边缘检测方法研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace