基于注意力机制的图像语义边缘检测方法研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 毕业生 > 硕士学位论文

题名	基于注意力机制的图像语义边缘检测方法研究
作者	陈宇航
答辩日期	2022-05-25
文献子类	硕士
授予单位	中国科学院自动化研究所
授予地点	中国科学院自动化研究所
导师	孟高峰
关键词	语义边缘检测注意力机制水线检测特征融合
学位专业	模式识别与智能系统
英文摘要	语义边缘检测是计算机视觉领域的经典研究任务之一，其旨在识别并定位图像中目标物体的边缘像素。在早期的研究过程中，研究人员主要依据图像的颜色、梯度和纹理信息来检测边缘，如手工设计的Sobel 算子。这类方法虽然计算复杂度低，但是易受环境因素影响，且鲁棒性差，难以满足复杂场景的检测精度需求。此外，高度依赖人工设计的特征提取器也限制了这类方法性能的提升。近年来，随着深度学习技术的高速发展，卷积神经网络大规模应用于计算机视觉领域，语义边缘检测算法的性能有了质的提升。传统方法抗噪声能力弱且缺乏对特定边缘的选择能力，所以只适用于低精度的边缘提取，而基于深度学习的语义边缘检测算法不仅鲁棒性强且能够针对感兴趣的边缘进行学习，因而受到研究人员的重点关注。以CASENet 为代表的全卷积网络是语义边缘检测的常用方法，这类方法通常采用编码器-解码器结构。编码器在卷积过程中不断下采样，从而能够提取不同尺度的特征。解码器将融合之后的特征图恢复至原始的分辨率。这类方法主要有两点缺陷：一是高度下采样使得大量图像边缘细节信息丢失；二是CNN 结构难以对远距离的上下文信息进行建模，导致大量的边缘检测错误。针对上述问题，本文在现有网络的研究基础上，引入注意力机制并设计了新的语义边缘检测模型。实验表明，注意力机制的引入能够有效增强图像像素之间长距离依赖的建模能力，从而提升语义边缘检测任务的精度。本文的主要贡献如下：（1）提出了一种基于注意力机制的语义边缘检测网络——SEDTR。该网络在传统编码器-解码器的基础上引入双歧路分支，两分支采用Transformer 结构来分别提取低层边缘信息和高层语义信息，特征在输入解码器前利用跨分支的注意力机制进行融合。实验表明，SEDTR 的检测精度达到了当前的SOTA(State Of The Art) 水平。（2）提出了一种基于注意力机制的轻量化船舶水线检测网络——WLNet。该网络将语义分割作为辅助任务纳入水线检测网络框架，并基于注意力机制设计了特征提取和特征融合模块，增强模型对水线边缘像素的感知能力。此外，还利用水线的连续性特征以及双任务的对偶性质，构建了用于水线检测的新的损失函数，提升了水线检测的精度。实验表明，在包含1000 幅从黄骅港实际采集的水尺图像数据集上，与现有方法相比，本文方法能够大幅提升水线检测精度。
语种	中文
页码	63
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/48746]
专题	毕业生_硕士学位论文
通讯作者	陈宇航
推荐引用方式 GB/T 7714	陈宇航. 基于注意力机制的图像语义边缘检测方法研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们