CORC  > 中国矿业大学(徐州)
基于协同最小二乘支持向量机的Q学习
王雪松 ; 田西兰 ; 程玉虎 ; 易建强
2015-09-10 ; 2015-09-10
关键词强化学习 Q学习 协同 最小二乘支持向量机 映射
中文摘要针对强化学习系统收敛速度慢的问题,提出一种适用于连续状态、离散动作空间的基于协同最小二乘支持向量机的Q学习.该Q学习系统由一个最小二乘支持向量回归机(Least squares support vector regression machine,LS-SVRM)和一个最小二乘支持向量分类机(Least squares support vector classification machine,LS-SVCM)构成.LS-SVRM用于逼近状态-动作对到值函数的映射,LS-SVCM则用于逼近连续状态空间到离散动作空间的映射,并为LS-SVRM提供实时、动态的知识或建议(建议动作值)以促进值函数的学习.小车爬山最短时间控制仿真结果表明,与基于单一LS-SVRM的Q学习系统相比,该方法加快了系统的学习收敛速度,具有较好的学习性能.
内容类型期刊论文
源URL[http://ir.calis.edu.cn/hdl/232060/14159]  
专题中国矿业大学(徐州)
推荐引用方式
GB/T 7714
王雪松,田西兰,程玉虎,等. 基于协同最小二乘支持向量机的Q学习[J],2015, 2015.
APA 王雪松,田西兰,程玉虎,&易建强.(2015).基于协同最小二乘支持向量机的Q学习..
MLA 王雪松,et al."基于协同最小二乘支持向量机的Q学习".(2015).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace