CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名基于透视投影的三维人脸重建及姿态估计
作者徐淼
答辩日期2024
文献子类硕士
关键词人脸重建,姿态估计,深度学习,神经网络,六自由度
英文摘要

随着深度学习的发展,虚拟穿戴、虚拟换妆、视频编辑、动画制作以及疲劳识别等技术不断得到改进和完善,许多手机和计算机的应用需求也跟着不断增加,人脸重建以及人脸的六自由度姿态估计最近也在计算机视觉和计算机图形领域引起了广泛地关注。

目前,国内外研究人员提出了众多从单张RGB图像重建出三维人脸模型的方法。这些重建方法大都采用正交投影来近似代替真实的透视投影,忽略了人脸在相机坐标系下近大远小的特点,当人脸的大小与到相机的距离很小时,效果很好。然而随着自拍、虚拟眼镜试戴和化妆等技术的流行,面部捕捉的场景变得更加复杂,通过正交投影重建出的人脸会出现明显的失真现象,因此估计透视投影变得十分重要。估计人脸姿态也常常作为子任务出现在这些方法中,但是这些方法得到的姿态仅仅是人脸的朝向,缺少了人脸相对于相机的偏移量,这也进一步限制了其应用的能力和便捷性。本文主要研究基于透视投影的人脸重建以及人脸的六自由度位姿估计,解决以往重建方法存在的失真情况,同时准确估计人脸姿态使其可以灵活应用于复杂场景。

本文的主要贡献和成果归纳如下:
    针对基于正交变换重建出的人脸出现明显失真以及以往人脸位姿估计仅关注旋转角的问题,本文引入了人脸六自由度位姿的重建方案,探索了利用单张RGB图像进行透视投影下的三维人脸重建,仅通过一个网络在重建出世界坐标系下的三维人脸同时估计人脸的六自由度位姿,提高了人脸重建精度的同时优化位姿估计的精度。
    针对以往人脸位姿估计精度不高,限制了其应用的能力的问题,本文设计了一个多级像素级对应学习网络,通过自注意力机制鲁棒地学习输入图像中的2D像素与世界坐标系中3D人脸的3D点之间的对应关系,以进行更精确的六自由度人脸位姿估计。
    本文在多个数据集上进行了对比实验以及分析实验,实验结果表明了本文方法重建得到的三维人脸很好的解决了失真问题,同时估计得到的位姿也很精确,对于虚拟现实等应用有很大帮助。

语种中文
页码68
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/58542]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
徐淼. 基于透视投影的三维人脸重建及姿态估计[D]. 2024.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace