CORC  > 自动化研究所  > 中国科学院自动化研究所  > 学术期刊  > 自动化学报
异策略深度强化学习中的经验回放研究综述
胡子剑; 高晓光; 万开方; 张乐天; 汪强龙; NERETINEvgeny
刊名自动化学报
2023
卷号49期号:11页码:2237-2256
关键词深度强化学习 异策略 经验回放 人工智能
ISSN号0254-4156
DOI10.16383/j.aas.c220648
英文摘要作为一种不需要事先获得训练数据的机器学习方法,强化学习(Reinforcement learning, RL)在智能体与环境的不断交互过程中寻找最优策略,是解决序贯决策问题的一种重要方法.通过与深度学习(Deep learning, DL)结合,深度强化学习(Deep reinforcement learning, DRL)同时具备了强大的感知和决策能力,被广泛应用于多个领域来解决复杂的决策问题.异策略强化学习通过将交互经验进行存储和回放,将探索和利用分离开来,更易寻找到全局最优解.如何对经验进行合理高效的利用是提升异策略强化学习方法效率的关键.首先对强化学习的基本理论进行介绍;随后对同策略和异策略强化学习算法进行简要介绍;接着介绍经验回放(Experience replay, ER)问题的两种主流解决方案,包括经验利用和经验增广;最后对相关的研究工作进行总结和展望.
内容类型期刊论文
源URL[http://ir.ia.ac.cn/handle/173211/55782]  
专题自动化研究所_学术期刊_自动化学报
推荐引用方式
GB/T 7714
胡子剑,高晓光,万开方,等. 异策略深度强化学习中的经验回放研究综述[J]. 自动化学报,2023,49(11):2237-2256.
APA 胡子剑,高晓光,万开方,张乐天,汪强龙,&NERETINEvgeny.(2023).异策略深度强化学习中的经验回放研究综述.自动化学报,49(11),2237-2256.
MLA 胡子剑,et al."异策略深度强化学习中的经验回放研究综述".自动化学报 49.11(2023):2237-2256.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace