CORC

浏览/检索结果: 共702条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文
中国重庆, 2024.5.7-5.9
作者:  Niu LY(钮龙宇);  Wan J(万军)
收藏  |  浏览/下载:3/0  |  提交时间:2024/05/28
Boosting On-Policy Actor-Critic With Shallow Updates in Critic 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 10
作者:  Li, Luntong;  Zhu, Yuanheng
收藏  |  浏览/下载:4/0  |  提交时间:2024/07/03
Token-level Direct Preference Optimization 会议论文
Vienna, Austria, 2024/7/21-27
作者:  Zeng,Yongcheng;  Liu,Guoqing;  Ma,Weiyu;  Yang,Ning;  Zhang,Haifeng
收藏  |  浏览/下载:5/0  |  提交时间:2024/06/05
Learning State-Specific Action Masks for Reinforcement Learning 期刊论文
Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60
作者:  Wang ZY(王梓薏);  Li XR(李欣然);  Sun LY(孙罗洋);  Zhang HF(张海峰);  Liu HL(刘华林)
收藏  |  浏览/下载:2/0  |  提交时间:2024/07/05
NVIF: Neighboring Variational Information Flow for Cooperative Large-Scale Multiagent Reinforcement Learning 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 页码: 13
作者:  Chai, Jiajun;  Zhu, Yuanheng;  Zhao, Dongbin
收藏  |  浏览/下载:9/0  |  提交时间:2023/11/16
面向稀疏奖励环境的多智能体协同探索问题研究 学位论文
2023
作者:  白云鹏
收藏  |  浏览/下载:8/0  |  提交时间:2023/06/13
仿生机器双髻鲨的水下环境感知与自主导航研究 学位论文
2023
作者:  闫帅铮
收藏  |  浏览/下载:6/0  |  提交时间:2023/06/07
面向飞行目标的多传感器协同探测资源调度方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 6, 页码: 1242-1255
作者:  汪梦倩;  梁皓星;  郭茂耘;  陈小龙;  武艺
收藏  |  浏览/下载:0/0  |  提交时间:2024/05/09
基于终端诱导强化学习的航天器轨道追逃博弈 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 974-984
作者:  耿远卓;  袁利;  黄煌;  汤亮
收藏  |  浏览/下载:0/0  |  提交时间:2024/05/09
Multi-objective Deep Reinforcement Learning for Mobile Edge Computing 会议论文
Singapore, 2023/8/24-27
作者:  Yang,Ning;  Wen,Junrui;  Zhang,Meng;  Tang,Ming
收藏  |  浏览/下载:1/0  |  提交时间:2024/06/05


©版权所有 ©2017 CSpace - Powered by CSpace