一种多智能体分布式强化学习方法

被引：0

专利类型：

发明

申请号：

CN202110484030.4

申请日：

2021-04-30

公开(公告)号：

CN113269329B

公开(公告)日：

2024-03-19

发明(设计)人：

王勇袁利黄煌韩冬石恒王殿佑

申请人：

北京控制工程研究所

申请人地址：

100080 北京市海淀区北京2729信箱

IPC主分类号：

G06N20/00

IPC分类号：

G06N3/006 G06N3/0442 G06N3/092

代理机构：

中国航天科技专利中心 11009

代理人：

褚鹏蛟

法律状态：

授权

国省代码：

北京市

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2024-03-19	授权	授权

共 50 条

[1]

一种多智能体分布式强化学习方法 [P].

王勇 ;

袁利 ;

黄煌 ;

韩冬 ;

石恒 ;

王殿佑 .

中国专利 :CN113269329A ,2021-08-17

[2]

分布式强化学习 [P].

W.C.达布尼 ;

M.金德罗-贝尔-梅尔 .

中国专利 :CN110520868A ,2019-11-29

[3]

一种基于Ray的分布式强化学习方法及装置 [P].

樊松源 ;

朴海音 ;

孙智孝 ;

孙阳 ;

于津 ;

彭宣淇 ;

韩玥 ;

杨晟琦 ;

詹光 ;

郎魁军 .

中国专利 :CN113920388A ,2022-01-11

[4]

一种基于强化学习奖励塑造的分布式多智能体路径规划方法 [P].

郑荣濠 ;

宋振宇 ;

刘妹琴 ;

张森林 .

中国专利 :CN120274781A ,2025-07-08

[5]

基于多智能体强化学习的多微电网分布式控制方法及装置 [P].

史志超 ;

孙云鹏 ;

张涛 ;

刘亚杰 ;

王锐 ;

黄生俊 ;

李凯文 .

中国专利 :CN120110023B ,2025-08-05

[6]

基于多智能体强化学习的多微电网分布式控制方法及装置 [P].

史志超 ;

孙云鹏 ;

张涛 ;

刘亚杰 ;

王锐 ;

黄生俊 ;

李凯文 .

中国专利 :CN120110023A ,2025-06-06

[7]

一种基于kubernetes容器集群的分布式强化学习方法及装置 [P].

叶超 ;

朴海音 ;

陈永红 ;

陶晓洋 ;

樊松源 ;

孙阳 ;

郝一行 ;

王汉 ;

于津 ;

韩玥 ;

杨晟琦 ;

彭宣淇 .

中国专利 :CN113742065A ,2021-12-03

[8]

基于分布式强化学习的多牙种植体定位规划方法 [P].

祝宁 ;

胡杨熠 ;

张宇 .

中国专利 :CN120260943A ,2025-07-04

[9]

一种基于分布式强化学习的智能兵棋推演方法 [P].

彭星光 ;

李亚男 ;

宋保维 ;

潘光 ;

张福斌 ;

高剑 ;

李乐 ;

张立川 .

中国专利 :CN113222106A ,2021-08-06

[10]

一种基于分布式强化学习的智能兵棋推演方法 [P].

彭星光 ;

李亚男 ;

宋保维 ;

潘光 ;

张福斌 ;

高剑 ;

李乐 ;

张立川 .

中国专利 :CN113222106B ,2024-04-30

← 1 2 3 4 5 →