一种基于值分解的多智能体强化学习方法及系统

被引:0
专利类型
发明
申请号
CN202210301408.7
申请日
2022-03-24
公开(公告)号
CN114662639B
公开(公告)日
2025-05-27
发明(设计)人
谢在鹏 邵鹏飞 高原 张雨锋
申请人
河海大学
申请人地址
211100 江苏省南京市江宁区佛城西路8号
IPC主分类号
G06N3/008
IPC分类号
G06N3/0442 G06N3/092 A63F13/57 A63F13/77 A63F13/847
代理机构
南京泉为知识产权代理事务所(特殊普通合伙) 32408
代理人
许丹丹
法律状态
授权
国省代码
江苏省 南京市
引用
下载
收藏
共 50 条
[1]
一种基于值分解的多智能体强化学习方法及系统 [P]. 
谢在鹏 ;
邵鹏飞 ;
高原 ;
张雨锋 .
中国专利 :CN114662639A ,2022-06-24
[2]
一种基于值分解和注意力机制的多智能体强化学习方法 [P]. 
吴健 ;
宋广华 ;
姜晓红 ;
范晟 ;
叶振辉 ;
陈弈宁 ;
应豪超 .
中国专利 :CN113313267A ,2021-08-27
[3]
一种基于值分布的多智能体强化学习方法及系统 [P]. 
李厚强 ;
周文罡 ;
赵鉴 ;
阳明宇 .
中国专利 :CN113792861A ,2021-12-14
[4]
一种基于值分布的多智能体强化学习方法及系统 [P]. 
李厚强 ;
周文罡 ;
赵鉴 ;
阳明宇 .
中国专利 :CN113792861B ,2024-02-27
[5]
一种基于分层注意力机制的多智能体强化学习方法及系统 [P]. 
史殿习 ;
王雅洁 ;
张拥军 ;
薛超 ;
郝锋 ;
姜浩 ;
王功举 .
中国专利 :CN112232478A ,2021-01-15
[6]
基于多智能体深度强化学习方法及系统 [P]. 
臧义华 ;
孟晓燕 ;
张丽颖 ;
李小娟 ;
郭彦文 .
中国专利 :CN119561829B ,2025-07-18
[7]
基于多智能体深度强化学习方法及系统 [P]. 
臧义华 ;
孟晓燕 ;
张丽颖 ;
李小娟 ;
郭彦文 .
中国专利 :CN119561829A ,2025-03-04
[8]
多智能体强化学习方法 [P]. 
刘绍辉 ;
姜兴宗 ;
赵海涛 ;
王鑫 ;
李刚 ;
刘可人 ;
于涛 .
中国专利 :CN121031706A ,2025-11-28
[9]
基于动态层级通信网络的多智能体强化学习方法及系统 [P]. 
兰旭光 ;
刘泽阳 ;
万里鹏 ;
睢雪 ;
丁季时雨 ;
董博 ;
杨皙睿 .
中国专利 :CN113919485A ,2022-01-11
[10]
基于动态层级通信网络的多智能体强化学习方法及系统 [P]. 
兰旭光 ;
刘泽阳 ;
万里鹏 ;
睢雪 ;
丁季时雨 ;
董博 ;
杨皙睿 .
中国专利 :CN113919485B ,2024-03-15