CORC  > 自动化研究所  > 中国科学院自动化研究所  > 学术期刊  > 自动化学报
基于强化学习的部分线性离散时间系统的最优输出调节
庞文砚; 范家璐; 姜艺; LEWISFrankLeroy
刊名自动化学报
2022
卷号48期号:9页码:2242-2253
关键词输出调节 离散时间系统 强化学习 非线性未知动态
ISSN号0254-4156
DOI10.16383/j.aas.c190853
英文摘要针对同时具有线性外部干扰与非线性不确定性下的离散时间部分线性系统的最优输出调节问题,提出了仅利用在线数据的基于强化学习的数据驱动控制方法.首先,该问题可拆分为一个受约束的静态优化问题和一个动态规划问题,第一个问题可以解出调节器方程的解.第二个问题可以确定出控制器的最优反馈增益.然后,运用小增益定理证明了存在非线性不确定性离散时间部分线性系统的最优输出调节问题的稳定性.针对传统的控制方法需要准确的系统模型参数用来解决这两个优化问题,提出了一种数据驱动离线策略更新算法,该算法仅使用在线数据找到动态规划问题的解.然后,基于动态规划问题的解,利用在线数据为静态优化问题提供了最优解.最后,仿真结果验证了该方法的有效性.
内容类型期刊论文
源URL[http://ir.ia.ac.cn/handle/173211/56284]  
专题自动化研究所_学术期刊_自动化学报
推荐引用方式
GB/T 7714
庞文砚,范家璐,姜艺,等. 基于强化学习的部分线性离散时间系统的最优输出调节[J]. 自动化学报,2022,48(9):2242-2253.
APA 庞文砚,范家璐,姜艺,&LEWISFrankLeroy.(2022).基于强化学习的部分线性离散时间系统的最优输出调节.自动化学报,48(9),2242-2253.
MLA 庞文砚,et al."基于强化学习的部分线性离散时间系统的最优输出调节".自动化学报 48.9(2022):2242-2253.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace