一种基于值分解的多智能体强化学习方法及系统

被引:0
申请号
CN202210301408.7
申请日
2022-03-24
公开(公告)号
CN114662639A
公开(公告)日
2022-06-24
发明(设计)人
谢在鹏 邵鹏飞 高原 张雨锋
申请人
申请人地址
211100 江苏省南京市江宁区佛城西路8号
IPC主分类号
G06N300
IPC分类号
G06N304 G06N308 A63F1357 A63F1377 A63F13847
代理机构
南京泉为知识产权代理事务所(特殊普通合伙) 32408
代理人
许丹丹
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
一种基于值分解的多智能体强化学习方法及系统 [P]. 
谢在鹏 ;
邵鹏飞 ;
高原 ;
张雨锋 .
中国专利 :CN114662639B ,2025-05-27
[2]
一种基于值分解和注意力机制的多智能体强化学习方法 [P]. 
吴健 ;
宋广华 ;
姜晓红 ;
范晟 ;
叶振辉 ;
陈弈宁 ;
应豪超 .
中国专利 :CN113313267A ,2021-08-27
[3]
一种基于值分布的多智能体强化学习方法及系统 [P]. 
李厚强 ;
周文罡 ;
赵鉴 ;
阳明宇 .
中国专利 :CN113792861A ,2021-12-14
[4]
一种基于值分布的多智能体强化学习方法及系统 [P]. 
李厚强 ;
周文罡 ;
赵鉴 ;
阳明宇 .
中国专利 :CN113792861B ,2024-02-27
[5]
一种基于分层注意力机制的多智能体强化学习方法及系统 [P]. 
史殿习 ;
王雅洁 ;
张拥军 ;
薛超 ;
郝锋 ;
姜浩 ;
王功举 .
中国专利 :CN112232478A ,2021-01-15
[6]
基于多智能体深度强化学习方法及系统 [P]. 
臧义华 ;
孟晓燕 ;
张丽颖 ;
李小娟 ;
郭彦文 .
中国专利 :CN119561829B ,2025-07-18
[7]
基于多智能体深度强化学习方法及系统 [P]. 
臧义华 ;
孟晓燕 ;
张丽颖 ;
李小娟 ;
郭彦文 .
中国专利 :CN119561829A ,2025-03-04
[8]
多智能体强化学习方法 [P]. 
刘绍辉 ;
姜兴宗 ;
赵海涛 ;
王鑫 ;
李刚 ;
刘可人 ;
于涛 .
中国专利 :CN121031706A ,2025-11-28
[9]
基于动态层级通信网络的多智能体强化学习方法及系统 [P]. 
兰旭光 ;
刘泽阳 ;
万里鹏 ;
睢雪 ;
丁季时雨 ;
董博 ;
杨皙睿 .
中国专利 :CN113919485A ,2022-01-11
[10]
基于动态层级通信网络的多智能体强化学习方法及系统 [P]. 
兰旭光 ;
刘泽阳 ;
万里鹏 ;
睢雪 ;
丁季时雨 ;
董博 ;
杨皙睿 .
中国专利 :CN113919485B ,2024-03-15