室内场景图像的语义分割方法研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 毕业生 > 硕士学位论文

题名	室内场景图像的语义分割方法研究
作者	陈新泽
答辩日期	2017-05-10
授予单位	中国科学院研究生院
授予地点	北京
导师	董秋雷
关键词	图像语义分割深度学习卷积神经网络条件随机场生成式对抗网络
英文摘要	图像语义分割是计算机视觉领域中一个重要的研究主题，其旨在将图像自动分割成若干个含有一定语义信息的区域。准确的图像语义分割是实现诸多计算机视觉任务（如场景理解与分析）的基础。近年来，随着深度神经网络被引入到图像语义分割研究中来，该项研究得到了快速的发展，在智能服务机器人、无人驾驶汽车、医学图像分析等领域中均展现出巨大的应用潜力。然而，对于环境复杂的室内场景，目前文献中基于深度神经网络的图像语义分割方法仍无法得到较为理想的分割结果。本文针对基于深度神经网络的室内场景图像语义分割中存在的一些问题展开探索和研究，主要工作包括： 1. 提出了一种新的基于残差网络的图像语义分割方法。该方法主要由三个模块组成：（i）数据预处理模块：针对目前国际公开数据集中室内场景标注数据不足的问题，在该模块中设计了一种在线的数据扩充方式；（ii）改进的深度残差网络模块：设计了一种融合膨胀卷积（Dilated Convolution）和长短时记忆（Long Short-Term Memory， LSTM）的深度残差网络，以提高该网络对物体边界的定位精度；（iii）难区分像素在线选择模块：设计了一种针对难区分像素的目标损失函数，以加快网络的收敛速度并进一步提高网络的分割精度。 2. 提出了一种融合场景深度信息的图像语义分割方法。该方法首先利用深度神经网络进行图像的粗分割，然后利用全连接条件随机场将图像粗分割结果与场景深度信息进行有效融合，通过求解该全连接条件随机场实现图像的精确分割。 3. 提出了一种基于生成式对抗网络的图像语义分割方法。该方法引入了一种超参数自适应调节机制，对于不同的判别信息和不同的对抗损失函数，都可以较为有效地处理生成式对抗网络训练过程中可能出现的判别器反传梯度过大问题，并进一步提高了图像分割精度。
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/14700]
专题	毕业生_硕士学位论文
作者单位	中国科学院自动化研究所
推荐引用方式 GB/T 7714	陈新泽. 室内场景图像的语义分割方法研究[D]. 北京. 中国科学院研究生院. 2017.