中国开放科研知识云: 检索

验证码:

换一张

忘记密码？记住我

取消登录

CORC

首页
科研机构
检索
知识图谱
申请加入
托管服务

在结果中检索

科研机构

自动化研究所 [24]

沈阳自动化研究所 [3]

心理研究所 [1]

内容类型

学位论文 [22]

期刊论文 [4]

发表日期

学科主题

计算机科学技术::人... [1]

知识图谱

CORC

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共28条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	基于预训练模型的决策序列化建模研究学位论文 2024 作者: 林润基收藏 \| 浏览/下载：1/0 \| 提交时间：2024/06/07 预训练模型决策序列化序列模型
	多智能体强化学习预训练方法研究学位论文 2024 作者: 孟令辉收藏 \| 浏览/下载：0/0 \| 提交时间：2024/05/28 多智能体强化学习预训练方法神经网络表示学习在线强化评估
	基于用户行为预测和强化学习的推荐策略研究学位论文 2024 作者: 张志远收藏 \| 浏览/下载：1/0 \| 提交时间：2024/06/25 强化学习推荐系统用户行为建模
	稀疏奖励环境下基于自博弈框架的智能空战算法研究学位论文 2024 作者: 何少钦收藏 \| 浏览/下载：0/0 \| 提交时间：2024/05/30 强化学习，离线强化学习，空战，智能决策，好奇心机制
	基于优先采样模型的离线强化学习期刊论文自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153 作者: 顾扬; 程玉虎; 王雪松收藏 \| 浏览/下载：0/0 \| 提交时间：2024/04/12 离线强化学习优先采样模型时序差分误差鞅批约束深度Q学习
	基于自适应动态规划的最优跟踪控制方法研究学位论文 2023 作者: 王鑫收藏 \| 浏览/下载：3/0 \| 提交时间：2023/06/08 自适应动态规划输出调节追逃博弈最优控制一致性控制
	基于表示学习和对手建模的动态博弈系统策略生成技术研究学位论文 2023 作者: 詹员收藏 \| 浏览/下载：8/0 \| 提交时间：2023/06/06 深度强化学习表示学习对手建模空中博弈
	双足机器人高效安全自主导航与避障研究学位论文 2023 作者: 单钦锋收藏 \| 浏览/下载：4/0 \| 提交时间：2023/06/05 双足机器人自主导航与避障运动可达集轨迹优化
	执行者-评论家算法框架下的强化学习稳定性研究学位论文 2023 作者: 龚晨收藏 \| 浏览/下载：1/0 \| 提交时间：2023/06/26 深度强化学习，稳定性，共轭，对抗性攻击，后门攻击
	安全强化学习综述期刊论文自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835 作者: 王雪松; 王荣荣; 程玉虎收藏 \| 浏览/下载：0/0 \| 提交时间：2024/04/24 安全强化学习约束马尔科夫决策过程学习过程学习目标离线强化学习

相关链接
欧盟学术资源开放存取平台
CALIS高校机构知识库
台湾学术机构典藏
香港机构知识库整合系统
中国科学院机构知识库网格系统

CORC
关于我们
服务条款
隐私条款

联系我们
0931-8270076
cspace@llas.ac.cn
China-OR

中文简体

©版权所有 ©2017 CSpace - Powered by CSpace