异策略深度强化学习中的经验回放研究综述

doi:10.16383/j.aas.c220648

CORC > 自动化研究所 > 中国科学院自动化研究所 > 学术期刊 > 自动化学报

	异策略深度强化学习中的经验回放研究综述
	胡子剑; 高晓光; 万开方; 张乐天; 汪强龙; NERETINEvgeny
刊名	自动化学报
	2023
卷号	49 期号:11 页码:2237-2256
关键词	深度强化学习异策略经验回放人工智能
ISSN号	0254-4156
DOI	10.16383/j.aas.c220648
英文摘要	作为一种不需要事先获得训练数据的机器学习方法,强化学习(Reinforcement learning, RL)在智能体与环境的不断交互过程中寻找最优策略,是解决序贯决策问题的一种重要方法.通过与深度学习(Deep learning, DL)结合,深度强化学习(Deep reinforcement learning, DRL)同时具备了强大的感知和决策能力,被广泛应用于多个领域来解决复杂的决策问题.异策略强化学习通过将交互经验进行存储和回放,将探索和利用分离开来,更易寻找到全局最优解.如何对经验进行合理高效的利用是提升异策略强化学习方法效率的关键.首先对强化学习的基本理论进行介绍;随后对同策略和异策略强化学习算法进行简要介绍;接着介绍经验回放(Experience replay, ER)问题的两种主流解决方案,包括经验利用和经验增广;最后对相关的研究工作进行总结和展望.
内容类型	期刊论文
源URL	[http://ir.ia.ac.cn/handle/173211/55782]
专题	自动化研究所_学术期刊_自动化学报
推荐引用方式 GB/T 7714	胡子剑,高晓光,万开方,等. 异策略深度强化学习中的经验回放研究综述[J]. 自动化学报,2023,49(11):2237-2256.
APA	胡子剑,高晓光,万开方,张乐天,汪强龙,&NERETINEvgeny.(2023).异策略深度强化学习中的经验回放研究综述.自动化学报,49(11),2237-2256.
MLA	胡子剑,et al."异策略深度强化学习中的经验回放研究综述".自动化学报 49.11(2023):2237-2256.