一种基于Q学习的AUV浮力调节方法 | |
贾松力; 林扬; 朱兴华; 孙铁; 孙铁铭 | |
2021-12-17 | |
著作权人 | 中国科学院沈阳自动化研究所 |
国家 | 中国 |
文献子类 | 发明 |
产权排序 | 1 |
英文摘要 | 本发明公开了一种基于Q学习的AUV浮力调节方法,包括根据不同AUV的执行机构定义系统环境状态集、根据浮力调节系统的能力及AUV的实际特性定义浮力调节动作集,从而由此形成初始Q表;确定用以更新Q表的奖励机制,根据epsilon贪婪策略选择浮力调节动作,根据产生的奖励更新Q表;学习过程中Q表各状态下最优动作对应的Q值会不断增加,依据充分学习的Q表可选取最优浮力调节动作。 |
申请日期 | 2020-06-11 |
语种 | 中文 |
状态 | 公开 |
内容类型 | 专利 |
源URL | [http://ir.sia.cn/handle/173321/30145] ![]() |
专题 | 沈阳自动化研究所_海洋信息技术装备中心 |
作者单位 | 中国科学院沈阳自动化研究所 |
推荐引用方式 GB/T 7714 | 贾松力,林扬,朱兴华,等. 一种基于Q学习的AUV浮力调节方法. 2021-12-17. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论