题名 | 人脸三维结构恢复和层次化解析 |
作者 | 于畅 |
答辩日期 | 2024-05-17 |
文献子类 | 博士 |
关键词 | 人脸层次化解析 三维人脸表征 胶囊网络 可解释表征 |
英文摘要 | 物体三维重建和层次化结构解析是人类视觉感知的重要能力,也是计算机视觉的重要研究内容。前者旨在基于单目图像恢复在成像过程中丢失的三维深度信息,对诸多计算机视觉任务(如检测、分类、识别等)有着重要的作用,有利于提升模型的精度和鲁棒性。后者旨在缓解现有深度模型大多缺乏可解释性的窘境。对于人类而言,即使从未见过的物体,只需对其观察就可以很容易地将其分解为一组部件级别的组件并构建其层次结构,通过部件与部件之间的关系实现对物体的识别。因此,研究无监督的物体层次化结构解析方法有助于实现类人感知能力,提升模型的可解释性。 本论文以单目三维重建和层次化结构解析为研究内容。特别的,针对人脸这一对象,开展人脸三维重建和无监督层次化结构解析研究。提出一种精细化三维人脸重建方法,可应用于诸如人脸识别、人脸编辑、表情分析、人脸动画等场景。以胶囊网络为基础,提出了层次解析胶囊网络和逆图形胶囊网络,突破了从简单数字到复杂物体(人脸)的无监督层次化结构表示,提升了深度网络的可解释性。进一步研究了基于图形胶囊探针的人脸表征探究方法,探究了深度网络的视觉感知过程,有效呈现并分析了网络各层的编码内容。本论文的主要贡献点阐述如下:
提出一种层次解析胶囊网络,实现从大量无标注的图像中学习得到人脸的二维层次化表示。通过设计基于可见性激活函数的子部件发现模块和基于Transformer解析模块的层次构建模块,实现了子部件-部件-人脸的层次化描述,成功将胶囊网络的建模能力从手写数字扩展到人脸,并在无监督人脸分割等任务上验证了其有效性。 提出一种逆图形胶囊网络,用于从大量无标注的人脸图像中学习层次化的三维人脸表征。其基本组成是一种基于计算机图形学定义的新型胶囊,由可解释的图形学参数(深度、反照率和姿态)构成。以图像深度和反照率为线索,逆图形胶囊网络能够将物体解析为一系列部件级的图形胶囊,组合部件级胶囊得到物体级胶囊构建物体层次关系。所得到的层次化三维描述可用于无监督人脸部件分割任务和可解释人脸分析,在相关数据集上验证了其有效性。 提出一种基于图形胶囊探针的网络架构,可用于深度神经网络的视觉感知研究。通过在深度神经网络的各层中插入图形胶囊探针,可以将每层神经元中的信息通过翻译模块进行可视化呈现。实验结果显示,随着网络程度的加深,人脸表征逐步从视角相关变为视角无关,逐层构建了2D-2.5D-3D表征。 综上所述,本文主要对人脸三维重建和基于胶囊网络的无监督层次化结构解析进行了研究,所取得的成果可应用于人脸相关的分析识别任务,提升相关任务的可解释性,为更好地理解深度网络的内在机理提供了一点思路。 |
语种 | 中文 |
页码 | 142 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/58511] ![]() |
专题 | 毕业生_博士学位论文 |
推荐引用方式 GB/T 7714 | 于畅. 人脸三维结构恢复和层次化解析[D]. 2024. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论