基于高斯过程分类器的连续空间强化学习

CORC > 中国矿业大学（徐州）

	基于高斯过程分类器的连续空间强化学习
	王雪松 ; 张依阳 ; 程玉虎
	2015-09-10 ; 2015-09-10
关键词	高斯过程分类器连续空间强化学习小船靠岸问题
中文摘要	如何将强化学习方法推广到大规模或连续空间,是决定强化学习方法能否得到广泛应用的关键.不同于已有的值函数逼近法,把强化学习构建为一个简单的二分类问题,利用分类算法来得到强化学习中的策略,提出一种基于高斯过程分类器的连续状态和连续动作空间强化学习方法.首先将连续动作空间离散化为确定数目的离散动作,然后利用高斯分类器对系统的连续状态-离散动作对进行正负分类,对判定为正类的离散动作按其概率值进行加权求和,进而得到实际作用于系统的连续动作.小船靠岸问题的仿真结果表明所提方法能够有效解决强化学习的连续空间表示问题.
内容类型	期刊论文
源URL	[http://ir.calis.edu.cn/hdl/232060/14162]
专题	中国矿业大学（徐州）
推荐引用方式 GB/T 7714	王雪松,张依阳,程玉虎. 基于高斯过程分类器的连续空间强化学习[J],2015, 2015.
APA	王雪松,张依阳,&程玉虎.(2015).基于高斯过程分类器的连续空间强化学习..
MLA	王雪松,et al."基于高斯过程分类器的连续空间强化学习".(2015).

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

暂无评论

评注功能仅针对注册用户开放，请您登录

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接