CORC  > 中国矿业大学(徐州)
最小二乘支持向量机在强化学习系统中的应用
王雪松 ; 田西兰 ; 程玉虎 ; 马小平
2015-09-10 ; 2015-09-10
关键词最小二乘支持向量机 强化学习 Q学习 泛化
中文摘要将连续状态空间下的Q学习构建为最小二乘支持向量机的回归估计问题,利用最小二乘支持向量机良好的泛化以及非线性逼近性能实现由系统状态-动作对到Q值函数的映射。为了保证计算速度以及适应Q学习系统在线学习的需要,最小二乘支持向量机的训练样本是窗式移动的,即在Q学习系统学习的同时获取样本数据并进行最小二乘支持向量机的训练。小车爬山控制问题的仿真结果表明该方法学习效率高,能够有效解决强化学习系统连续状态空间的泛化问题。
内容类型期刊论文
源URL[http://ir.calis.edu.cn/hdl/232060/14176]  
专题中国矿业大学(徐州)
推荐引用方式
GB/T 7714
王雪松,田西兰,程玉虎,等. 最小二乘支持向量机在强化学习系统中的应用[J],2015, 2015.
APA 王雪松,田西兰,程玉虎,&马小平.(2015).最小二乘支持向量机在强化学习系统中的应用..
MLA 王雪松,et al."最小二乘支持向量机在强化学习系统中的应用".(2015).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace