基于增量式RBF网络的Q学习算法 | |
李德才3,4; 韩建达1,3,4; 何玉庆3,4; 胡艳明2,3,4 | |
刊名 | 机器人 |
2019 | |
卷号 | 41期号:5页码:562-573 |
关键词 | 核方法 最小二乘算法 增量式学习 移动机器人 Q学习 |
ISSN号 | 1002-0446 |
其他题名 | Q-Learning Algorithm Based on Incremental RBF Network |
产权排序 | 1 |
英文摘要 | 为提升机器人的行为智能水平,提出一种基于增量式径向基函数网络(IRBFN)的Q学习(IRBFNQL)算法.其核心是通过结构的自适应增长与参数的在线学习,实现对Q值函数的学习与存储,从而使机器人可以在未知环境中自主增量式地学习行为策略.首先,采用近似线性独立(ALD)准则在线增加网络节点,使机器人的记忆容量伴随状态空间的拓展自适应增长.同时,节点的增加意味着网络拓扑内部连接的改变.采用核递归最小二乘(KRLS)算法更新网络拓扑连接关系及参数,使机器人不断扩展与优化自身的行为策略.此外,为避免过拟合问题,将L2正则项融合到KRLS算法中,得到L2约束下的核递归最小二乘算法(L2KRLS).实验结果表明,IRBFN-QL算法能够实现机器人与未知环境的自主交互,并逐步提高移动机器人在走廊环境中的导航行为能力. |
语种 | 中文 |
资助机构 | 国家自然科学基金(U1608253,91748208) |
内容类型 | 期刊论文 |
源URL | [http://ir.sia.cn/handle/173321/24934] |
专题 | 沈阳自动化研究所_机器人学研究室 |
通讯作者 | 何玉庆 |
作者单位 | 1.南开大学人工智能学院 2.中国科学院大学 3.中国科学院机器人与智能制造创新研究院 4.中国科学院沈阳自动化研究所机器人学国家重点实验室 |
推荐引用方式 GB/T 7714 | 李德才,韩建达,何玉庆,等. 基于增量式RBF网络的Q学习算法[J]. 机器人,2019,41(5):562-573. |
APA | 李德才,韩建达,何玉庆,&胡艳明.(2019).基于增量式RBF网络的Q学习算法.机器人,41(5),562-573. |
MLA | 李德才,et al."基于增量式RBF网络的Q学习算法".机器人 41.5(2019):562-573. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论