基于强化学习的波动鳍推进水下作业机器人悬停控制
马睿宸2,3; 白雪剑1,2; 王宇2; 王睿2; 王硕2,3
刊名控制理论与应用
2022-11
卷号39期号:11页码:2022-2099
关键词水下作业机器人 悬停控制 波动鳍 神经网络 强化学习
DOI10.7641/CTA.2022.11054
英文摘要

本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究. 首先, 给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数–力映射模型, 建立了基于马尔可夫决策过程的悬停控制训练框架. 其次, 基于模型结构和训练策略, 使用强化学习的方法进行网络训练, 得到最佳的悬停控制器. 最终, 在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验, 实验结果验证了所提方法的有效性.

语种中文
内容类型期刊论文
源URL[http://ir.ia.ac.cn/handle/173211/52353]  
专题智能机器人系统研究
通讯作者白雪剑
作者单位1.中国科学院大学,人工智能学院
2.中国科学院自动化研究所,复杂系统管理与控制国家重点实验室
3.中国科学院大学
推荐引用方式
GB/T 7714
马睿宸,白雪剑,王宇,等. 基于强化学习的波动鳍推进水下作业机器人悬停控制[J]. 控制理论与应用,2022,39(11):2022-2099.
APA 马睿宸,白雪剑,王宇,王睿,&王硕.(2022).基于强化学习的波动鳍推进水下作业机器人悬停控制.控制理论与应用,39(11),2022-2099.
MLA 马睿宸,et al."基于强化学习的波动鳍推进水下作业机器人悬停控制".控制理论与应用 39.11(2022):2022-2099.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace