已选(0)清除
条数/页: 排序方式:
|
| D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文 中国重庆, 2024.5.7-5.9 作者: Niu LY(钮龙宇); Wan J(万军) 收藏  |  浏览/下载:3/0  |  提交时间:2024/05/28
|
| Boosting On-Policy Actor-Critic With Shallow Updates in Critic 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 10 作者: Li, Luntong; Zhu, Yuanheng 收藏  |  浏览/下载:4/0  |  提交时间:2024/07/03
|
| Token-level Direct Preference Optimization 会议论文 Vienna, Austria, 2024/7/21-27 作者: Zeng,Yongcheng; Liu,Guoqing; Ma,Weiyu; Yang,Ning; Zhang,Haifeng 收藏  |  浏览/下载:5/0  |  提交时间:2024/06/05 |
| Learning State-Specific Action Masks for Reinforcement Learning 期刊论文 Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60 作者: Wang ZY(王梓薏); Li XR(李欣然); Sun LY(孙罗洋); Zhang HF(张海峰); Liu HL(刘华林) 收藏  |  浏览/下载:2/0  |  提交时间:2024/07/05
|
| NVIF: Neighboring Variational Information Flow for Cooperative Large-Scale Multiagent Reinforcement Learning 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 页码: 13 作者: Chai, Jiajun; Zhu, Yuanheng; Zhao, Dongbin 收藏  |  浏览/下载:9/0  |  提交时间:2023/11/16
|
| 面向稀疏奖励环境的多智能体协同探索问题研究 学位论文 2023 作者: 白云鹏 收藏  |  浏览/下载:8/0  |  提交时间:2023/06/13
|
| 仿生机器双髻鲨的水下环境感知与自主导航研究 学位论文 2023 作者: 闫帅铮 收藏  |  浏览/下载:6/0  |  提交时间:2023/06/07
|
| 面向飞行目标的多传感器协同探测资源调度方法 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 6, 页码: 1242-1255 作者: 汪梦倩; 梁皓星; 郭茂耘; 陈小龙; 武艺 收藏  |  浏览/下载:0/0  |  提交时间:2024/05/09
|
| 基于终端诱导强化学习的航天器轨道追逃博弈 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 974-984 作者: 耿远卓; 袁利; 黄煌; 汤亮 收藏  |  浏览/下载:0/0  |  提交时间:2024/05/09
|
| Multi-objective Deep Reinforcement Learning for Mobile Edge Computing 会议论文 Singapore, 2023/8/24-27 作者: Yang,Ning; Wen,Junrui; Zhang,Meng; Tang,Ming 收藏  |  浏览/下载:1/0  |  提交时间:2024/06/05
|