一种多智能体分布式强化学习方法

被引:0
专利类型
发明
申请号
CN202110484030.4
申请日
2021-04-30
公开(公告)号
CN113269329B
公开(公告)日
2024-03-19
发明(设计)人
王勇 袁利 黄煌 韩冬 石恒 王殿佑
申请人
北京控制工程研究所
申请人地址
100080 北京市海淀区北京2729信箱
IPC主分类号
G06N20/00
IPC分类号
G06N3/006 G06N3/0442 G06N3/092
代理机构
中国航天科技专利中心 11009
代理人
褚鹏蛟
法律状态
授权
国省代码
北京市
引用
下载
收藏
共 50 条
[1]
一种多智能体分布式强化学习方法 [P]. 
王勇 ;
袁利 ;
黄煌 ;
韩冬 ;
石恒 ;
王殿佑 .
中国专利 :CN113269329A ,2021-08-17
[2]
分布式强化学习 [P]. 
W.C.达布尼 ;
M.金德罗-贝尔-梅尔 .
中国专利 :CN110520868A ,2019-11-29
[3]
一种基于Ray的分布式强化学习方法及装置 [P]. 
樊松源 ;
朴海音 ;
孙智孝 ;
孙阳 ;
于津 ;
彭宣淇 ;
韩玥 ;
杨晟琦 ;
詹光 ;
郎魁军 .
中国专利 :CN113920388A ,2022-01-11
[4]
一种基于强化学习奖励塑造的分布式多智能体路径规划方法 [P]. 
郑荣濠 ;
宋振宇 ;
刘妹琴 ;
张森林 .
中国专利 :CN120274781A ,2025-07-08
[5]
基于多智能体强化学习的多微电网分布式控制方法及装置 [P]. 
史志超 ;
孙云鹏 ;
张涛 ;
刘亚杰 ;
王锐 ;
黄生俊 ;
李凯文 .
中国专利 :CN120110023B ,2025-08-05
[6]
基于多智能体强化学习的多微电网分布式控制方法及装置 [P]. 
史志超 ;
孙云鹏 ;
张涛 ;
刘亚杰 ;
王锐 ;
黄生俊 ;
李凯文 .
中国专利 :CN120110023A ,2025-06-06
[7]
一种基于kubernetes容器集群的分布式强化学习方法及装置 [P]. 
叶超 ;
朴海音 ;
陈永红 ;
陶晓洋 ;
樊松源 ;
孙阳 ;
郝一行 ;
王汉 ;
于津 ;
韩玥 ;
杨晟琦 ;
彭宣淇 .
中国专利 :CN113742065A ,2021-12-03
[8]
基于分布式强化学习的多牙种植体定位规划方法 [P]. 
祝宁 ;
胡杨熠 ;
张宇 .
中国专利 :CN120260943A ,2025-07-04
[9]
一种基于分布式强化学习的智能兵棋推演方法 [P]. 
彭星光 ;
李亚男 ;
宋保维 ;
潘光 ;
张福斌 ;
高剑 ;
李乐 ;
张立川 .
中国专利 :CN113222106A ,2021-08-06
[10]
一种基于分布式强化学习的智能兵棋推演方法 [P]. 
彭星光 ;
李亚男 ;
宋保维 ;
潘光 ;
张福斌 ;
高剑 ;
李乐 ;
张立川 .
中国专利 :CN113222106B ,2024-04-30