CORC  > 清华大学
递阶再励学习中Option的自动发现与生成
孟江华 ; 朱纪洪 ; 孙增圻 ; MENG Jiang-hua ; ZHU Ji-hong ; SUN Zeng-qi
2010-06-09 ; 2010-06-09
关键词递阶再励学习 Option 探索密度检测 hierarchical reinforcement learning Option Exploration Density(ED) Inspection TP181
其他题名Autonomous Discovery and Creation of Options in Hierarchical Reinforcement Learning
中文摘要Option的自动发现与生成是递阶再励学习的难点之一,论文提出探索密度检测(ED)法,通过检测状态空间中的探索密度来发现并构建Option。和现有的方法相比具有和任务无关、不需要先验知识等优点;能很好地工作于完全未知的环境中;并且构造出的Option,在同一环境下不同任务间可以直接共享。; Autonomous discovery and creation of Options is one of the open and difficult problems in research of hierachical reinforcement learning(RL).The new method presented in this article is named "Exploration Density(ED) Inspection",which discovers and creates useful Options through inspecting ED in state space.The method has many advantages such as task-independence,no need of prior knowledge.ED method works well in unknown surroundings and the Options it created can transfer among tasks directly.
语种中文 ; 中文
内容类型期刊论文
源URL[http://hdl.handle.net/123456789/55984]  
专题清华大学
推荐引用方式
GB/T 7714
孟江华,朱纪洪,孙增圻,等. 递阶再励学习中Option的自动发现与生成[J],2010, 2010.
APA 孟江华,朱纪洪,孙增圻,MENG Jiang-hua,ZHU Ji-hong,&SUN Zeng-qi.(2010).递阶再励学习中Option的自动发现与生成..
MLA 孟江华,et al."递阶再励学习中Option的自动发现与生成".(2010).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace