题名 | 基于卷积神经网络的猴类动物行为识别 |
作者 | 孙峥 |
答辩日期 | 2022-05-21 |
文献子类 | 硕士 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 马喜波 |
关键词 | 行为识别 姿态估计 卷积神经网络 猴类动物 临床前药物安全评价 |
学位名称 | 工程硕士 |
学位专业 | 计算机技术 |
英文摘要 | 在临床前药物安全评价中,猴类动物是必不可少的实验动物,然而长时间的人为观察在成本和随机性方面都有不可忽视的缺陷。因此,需要研发可行的人工智能方法对猴类动物表现出来的与药物安全评价相关的行为进行实时和定量分析。分析猴类动物行为的一个重要技术路径就是利用其姿态信息,特别是基于动物身体关键点的姿态表示。目前人体姿态估计和行为识别已经得到了广泛发展,然而在猴类动物上相关方法的研发却发展缓慢。因此,使用人工智能方法自动识别猴类动物的姿态和行为对临床前药物安全评价具有重要的现实意义和应用前景。本文主要对基于卷积神经网络的猴类动物姿态估计与行为识别方法展开研究: 1.建立了猴类动物姿态估计和行为识别数据集。 大规模数据集在人工智能的发展过程中发挥着重要作用,由于缺少完善的猴类动物数据集,人工智能方法在猴类动物应用中发展缓慢。针对临床前药物安全评价场景下猴类动物数据集规模小、丰富度低等问题,本文建立了猴类动物姿态估计和行为识别数据集,数据集中的原始数据是在实际临床前药物安全评价场景下采集的。相机使用特制的装置进行固定和保护,并对猴类动物日常生活的视频数据进行拍摄采集。获取到的视频数据经过手动筛选、视频帧预处理、关键点坐标和行为类别标注以及标签文件生成等流程,形成适用于猴类动物姿态估计和行为识别的数据集。 2.提出了一种基于目标区域注意力机制的姿态估计方法。 在基于深度学习的动物姿态估计方法中,大多数的工作将人体姿态估计任务中的数据集和模型直接应用到动物场景中,缺乏对应用场景特有问题的分析。在临床前药物安全评价场景下,猴类动物姿态估计任务主要存在以下难点:猴类动物的关键点被毛发遮挡且关键点之间非常相似;猴类动物躯体柔软,形成的姿态比人体更复杂;猴类动物运动较快,采集的部分视频中局部区域出现模糊情况。针对上述问题,本文提出了基于目标区域注意力机制的姿态估计方法。首先利用前景目标区域位置的先验信息,训练一个辅助的卷积神经网络用于生成目标区域的注意力特征图。然后利用姿态信息训练主干卷积神经网络,在训练过程中融合辅助网络生成的目标区域注意力特征图。实验表明,本文提出的基于目标区域注意力机制的方法有助于卷积神经网络模型定位并区分不同的关键点,从而进一步生成更加准确的目标姿态信息。 3.提出了一种基于全局时空编码器的骨架行为识别方法。 临床前药物安全评价任务中猴类动物所处的场景单一,背景扰动、光照变化以及外观差异较小,导致连续的视频帧和光流图中会包含冗余信息。基于骨架时序信息的行为识别方法关注目标的肢体动作,丢弃了外观和背景中的冗余信息,降低了数据对模型参数量的要求。然而,现有的一些骨架行为识别方法通常使用卷积层来提取空间维度和时间维度的局部特征,忽略了行为的整体性。本文提出一种基于全局时空编码器的骨架行为识别方法,在卷积神经网络的基础上融合时空维度的全局特征和局部特征。实验表明,全局时空编码器在基本不增加模型参数量的情况下,可以显著提高猴类动物行为识别准确率,有助于提升模型的鲁棒性。 总体来说,本文工作从实际临床前药物安全评价场景出发,使用深度学习方法对猴类动物姿态估计和行为识别任务进行了进一步研究,对人工智能方法在药物安全评价中的应用进行了积极的探索。 |
语种 | 中文 |
页码 | 64 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/48503] |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 孙峥. 基于卷积神经网络的猴类动物行为识别[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论