基于协同最小二乘支持向量机的Q学习

CORC > 中国矿业大学（徐州）

	基于协同最小二乘支持向量机的Q学习
	王雪松 ; 田西兰 ; 程玉虎 ; 易建强
	2015-09-10 ; 2015-09-10
关键词	强化学习 Q学习协同最小二乘支持向量机映射
中文摘要	针对强化学习系统收敛速度慢的问题,提出一种适用于连续状态、离散动作空间的基于协同最小二乘支持向量机的Q学习.该Q学习系统由一个最小二乘支持向量回归机(Least squares support vector regression machine,LS-SVRM)和一个最小二乘支持向量分类机(Least squares support vector classification machine,LS-SVCM)构成.LS-SVRM用于逼近状态-动作对到值函数的映射,LS-SVCM则用于逼近连续状态空间到离散动作空间的映射,并为LS-SVRM提供实时、动态的知识或建议(建议动作值)以促进值函数的学习.小车爬山最短时间控制仿真结果表明,与基于单一LS-SVRM的Q学习系统相比,该方法加快了系统的学习收敛速度,具有较好的学习性能.
内容类型	期刊论文
源URL	[http://ir.calis.edu.cn/hdl/232060/14159]
专题	中国矿业大学（徐州）
推荐引用方式 GB/T 7714	王雪松,田西兰,程玉虎,等. 基于协同最小二乘支持向量机的Q学习[J],2015, 2015.
APA	王雪松,田西兰,程玉虎,&易建强.(2015).基于协同最小二乘支持向量机的Q学习..
MLA	王雪松,et al."基于协同最小二乘支持向量机的Q学习".(2015).

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

暂无评论

评注功能仅针对注册用户开放，请您登录

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接