面向Ad-Hoc协作的局部观测重建方法
陈皓2,3; 杨立昆2,3; 尹奇跃2,3; 黄凯奇1,2,3
刊名中国科学院大学学报
2022-04
页码1
关键词多智能体 深度强化学习 信用分配 Ad-Hoc协作
DOI10.7523/j.ucas.2022.028.
英文摘要

近年来,多智能体强化学习得到了研究人员们的广泛关注。在多智能体强化学习的研究中,如何进行Ad-Hoc协作,也就是说如何适应种类和数量变化的队友,是一个关键问题。现有方法或者有很强的先验知识假设,或者使用硬编码的规则来进行合作,缺乏通用性,无法泛化到更一般的Ad-Hoc协作场景。为解决该问题,本文提出了一种面向Ad-Hoc协作的局部观测重建算法,利用注意力机制和采样网络对局部观测进行重建,使得算法认识到并充分利用不同局面中的高维状态表征,实现了在Ad-Hoc协作场景下的零样本泛化。本文在星际争霸微操环境和Ad-Hoc协作场景上与代表性算法的性能进行对比与分析,验证了算法的有效性。

URL标识查看原文
语种中文
内容类型期刊论文
源URL[http://ir.ia.ac.cn/handle/173211/48766]  
专题智能系统与工程
通讯作者黄凯奇
作者单位1.中国科学院脑科学与智能技术卓越创新中心
2.中国科学院大学人工智能学院
3.中国科学院自动化研究所智能系统与工程研究中心
推荐引用方式
GB/T 7714
陈皓,杨立昆,尹奇跃,等. 面向Ad-Hoc协作的局部观测重建方法[J]. 中国科学院大学学报,2022:1.
APA 陈皓,杨立昆,尹奇跃,&黄凯奇.(2022).面向Ad-Hoc协作的局部观测重建方法.中国科学院大学学报,1.
MLA 陈皓,et al."面向Ad-Hoc协作的局部观测重建方法".中国科学院大学学报 (2022):1.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace