基于多域学习的视觉场景解析研究

题名	基于多域学习的视觉场景解析研究
作者	王玉玺
答辩日期	2021-12
文献子类	博士
授予单位	中科院自动化所
授予地点	中科院自动化所
导师	张兆翔
关键词	多域学习视觉场景解析无监督域自适应语义分割图像分类
学位专业	模式识别与智能系统
英文摘要	随着信息化社会的快速发展和智能终端设备的普及，全球范围内的数据呈现爆炸式增长，我们迎来了大数据时代。在大数据时代，数据呈现显著的多模态特性，比如几乎所有的互联网新闻报道都包含图像、文字描述以及视频等多种模态，这些模态一定程度上都可以表征这条新闻。此外，由于成像设备的多样性和拍摄视角的多样性，图像和视频数据又呈现显著的多视角特性，比如同一对象可以拥有不同视角下的图像。我们将同一对象在不同模态、不同视角下的表达泛化的称为多域数据，其不同域包含了相同数据或者相似数据的不同表达形式。视觉场景解析是指对图像的识别与理解，包括计算机视觉任务中的图像分类、目标检测、语义分割、行人重识别、机器人控制以及图像风格变换等。本文针对视觉场景解析中的图像识别、语义分割以及图像翻译等问题，从多域学习的领域自适应角度出发，研究了单源域到单目标域、无源域数据以及多源域到多目标域的自适应学习方法，致力于最终实现在开放环境下的基于多域学习的视觉场景解析范式。本文取得的主要研究成果如下。 1. 基于不确定性伪标签校正的跨域语义分割。图像语义分割是指为每一个像素预测类别，它需要像素级的标签信息，而在自然场景中，像素级别的语义标注需要耗费大量的人力物力。由于合成数据可以近乎零成本地获得语义标注信息，本文利用合成数据的监督信息和无标注的真实数据，学习在真实数据上的语义分割模型。首先，本文设计了一种软重采样方式解决分割样本中的类别不平衡问题。其次，针对目标域的预测不确定性类别，提出了基于不确定性的校正算法，渐进式的提高域自适应性能。最后，基于不确定度，提出了一种自适应的伪标签生成算法，有效地减少了标签噪声。在多个标准跨域语义分割数据库上的结果证明了所提出方法的有效性，并且取得了当前最好的水平。 2. 基于无源域数据的领域自适应语义分割。虽然本文提出的方法在跨域语义分割问题上取得了不错的性能，但是现有的域自适应语义分割方法都假设源域数据和目标域数据是可获取的。由于数据隐私和数据保护，某些特定情况下源域数据不可获取。在缺乏源数据的情况下，传统的基于分布对齐的域自适应方法或者基于图像翻译的域自适应方法不再适用。针对上述问题，本文提出了一种针对源域数据不可用的跨域自适应语义分割框架，主要包括隐式特征对齐、双向伪标签学习以及信息传播等模块。大量的实验和消融研究被用来验证所提出方法的有效性。在标准的域自适应任务上，实现了当前最好的结果，并对比有源域数据的情况，也取得了相当的性能。更进一步，本文提出的方法在源域模型不可见的黑盒情况下也取得了令人满意的效果。 3. 基于注意力机制的多源域到多目标域的域自适应图像分类。现有的域自适应学习算法大多关注于单源域到单目标域或者多源域到单目标域的情况，而在实际场景中，由于数据的多域性，从多源域到多目标域的情况更为常见。因此，本文在现有的单源域到单目标域工作的基础上，提出了针对多源域到多目标域的域自适应问题的解决方案。首先，本文构建了一种基于对抗学习的多域对齐算法，用于学习域不变信息和类判别信息。为了进一步提升跨域迁移的效果，本文基于注意力机制构建了领域内注意力模块和领域间注意力模块，在域内和域间学习域不变信息。在多个标准跨域图像分类数据集上证实了所提出方法的有效性。 4. 基于多域知识共享机制的多域图像翻译。图像翻译试图学习一个优质的映射函数，该映射函数需要把来自不同分布（领域）之间的风格信息相互转换并保持原图像的内容信息不变。针对更具挑战性的自然场景的多域图像翻译任务，本文通过构建多域之间知识共享模块来建模不同域之间共有的翻译模式，进而增强每个域的翻译性能。此外，为进一步增强翻译图像的细节学习，本文提出一种对称的绝对一致性约束，使得翻译得到的图像细节更加真实。在多个多域图像翻译任务上的实验结果都证明了所提出方法的有效性。总的来说，本文对多域学习的理论和方法进行了系统而深入的研究，并针对现实的视觉场景解析问题，针对性地提出了四种多域学习算法，并将其应用在多域图像翻译、多域图像分类和多域图像语义分割等视觉场景解析问题中，取得了不错的应用效果。
语种	中文
页码	138
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/46598]
专题	自动化研究所_类脑智能研究中心
推荐引用方式 GB/T 7714	王玉玺. 基于多域学习的视觉场景解析研究[D]. 中科院自动化所. 中科院自动化所. 2021.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们