×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [24]
沈阳自动化研究所 [3]
心理研究所 [1]
内容类型
学位论文 [22]
期刊论文 [4]
专利 [2]
发表日期
2024 [5]
2023 [6]
2022 [5]
2021 [5]
2020 [1]
2017 [1]
更多...
学科主题
计算机科学技术::人... [1]
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共28条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
基于预训练模型的决策序列化建模研究
学位论文
2024
作者:
林润基
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2024/06/07
预训练模型
决策序列化
序列模型
多智能体强化学习预训练方法研究
学位论文
2024
作者:
孟令辉
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/05/28
多智能体强化学习
预训练方法
神经网络
表示学习
在线强化评估
基于用户行为预测和强化学习的推荐策略研究
学位论文
2024
作者:
张志远
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2024/06/25
强化学习
推荐系统
用户行为建模
稀疏奖励环境下基于自博弈框架的智能空战算法研究
学位论文
2024
作者:
何少钦
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/05/30
强化学习,离线强化学习,空战,智能决策,好奇心机制
基于优先采样模型的离线强化学习
期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:
顾扬
;
程玉虎
;
王雪松
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/04/12
离线强化学习
优先采样模型
时序差分误差
鞅
批约束深度Q学习
基于自适应动态规划的最优跟踪控制方法研究
学位论文
2023
作者:
王鑫
收藏
  |  
浏览/下载:3/0
  |  
提交时间:2023/06/08
自适应动态规划
输出调节
追逃博弈
最优控制
一致性控制
基于表示学习和对手建模的动态博弈系统策略生成技术研究
学位论文
2023
作者:
詹员
收藏
  |  
浏览/下载:8/0
  |  
提交时间:2023/06/06
深度强化学习
表示学习
对手建模
空中博弈
双足机器人高效安全自主导航与避障研究
学位论文
2023
作者:
单钦锋
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2023/06/05
双足机器人
自主导航与避障
运动可达集
轨迹优化
执行者-评论家算法框架下的强化学习稳定性研究
学位论文
2023
作者:
龚晨
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2023/06/26
深度强化学习,稳定性,共轭,对抗性攻击,后门攻击
安全强化学习综述
期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
作者:
王雪松
;
王荣荣
;
程玉虎
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/04/24
安全强化学习
约束马尔科夫决策过程
学习过程
学习目标
离线强化学习
©版权所有 ©2017 CSpace - Powered by
CSpace