一种基于Q学习的AUV浮力调节方法
贾松力; 林扬; 朱兴华; 孙铁; 孙铁铭
2021-12-17
著作权人中国科学院沈阳自动化研究所
国家中国
文献子类发明
产权排序1
英文摘要本发明公开了一种基于Q学习的AUV浮力调节方法,包括根据不同AUV的执行机构定义系统环境状态集、根据浮力调节系统的能力及AUV的实际特性定义浮力调节动作集,从而由此形成初始Q表;确定用以更新Q表的奖励机制,根据epsilon贪婪策略选择浮力调节动作,根据产生的奖励更新Q表;学习过程中Q表各状态下最优动作对应的Q值会不断增加,依据充分学习的Q表可选取最优浮力调节动作。
申请日期2020-06-11
语种中文
状态公开
内容类型专利
源URL[http://ir.sia.cn/handle/173321/30145]  
专题沈阳自动化研究所_海洋信息技术装备中心
作者单位中国科学院沈阳自动化研究所
推荐引用方式
GB/T 7714
贾松力,林扬,朱兴华,等. 一种基于Q学习的AUV浮力调节方法. 2021-12-17.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace