一种基于分层注意力机制的多智能体强化学习方法及系统

被引：0

专利类型：

发明

申请号：

CN202010913132.9

申请日：

2020-09-03

公开(公告)号：

CN112232478A

公开(公告)日：

2021-01-15

发明(设计)人：

史殿习王雅洁张拥军薛超郝锋姜浩王功举

申请人：

申请人地址：

300450 天津市滨海新区泰达服务外包产业园7号楼

IPC主分类号：

G06N304

IPC分类号：

G06N308

代理机构：

北京安博达知识产权代理有限公司 11271

代理人：

徐国文

法律状态：

实质审查的生效

国省代码：

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2021-03-02	实质审查的生效	实质审查的生效 IPC(主分类):G06N 3/04 申请日:20200903
2021-01-15	公开	公开

共 50 条

[1]

基于稀疏注意力机制的多智能体强化学习方法及系统 [P].

金博 ;

李文浩 ;

王祥丰 ;

张致恺 .

中国专利 :CN112949856A ,2021-06-11

[2]

一种基于值分解和注意力机制的多智能体强化学习方法 [P].

吴健 ;

宋广华 ;

姜晓红 ;

范晟 ;

叶振辉 ;

陈弈宁 ;

应豪超 .

中国专利 :CN113313267A ,2021-08-27

[3]

一种基于分层评价图注意力网络的多智能体强化学习方法 [P].

李修贤 ;

高鹏 ;

孟敏 .

中国专利 :CN120181180A ,2025-06-20

[4]

基于多头分类堆叠注意力机制的多智能体强化学习方法 [P].

陈润泽 ;

唐思琦 ;

胡昆 .

中国专利 :CN118378687A ,2024-07-23

[5]

一种基于图注意力机制的多智能体强化学习方法 [P].

吉庆兵 ;

罗杰 ;

史豪斌 ;

谈程 ;

吴哲平 ;

何自明 .

中国专利 :CN119005292A ,2024-11-22

[6]

一种基于因果推理和分层注意力机制的强化学习方法 [P].

朱大勇 ;

张若洁 ;

罗光春 ;

付波 ;

王勇 ;

林劼 .

中国专利 :CN120975174A ,2025-11-18

[7]

基于注意力机制的多智能体深度强化学习策略优化方法 [P].

陈晋音 ;

胡书隆 ;

王雪柯 ;

章燕 .

中国专利 :CN113392935A ,2021-09-14

[8]

基于技能学习和自注意力的围捕多智能体强化学习方法 [P].

刘瑜 ;

张文鹏 ;

李徵 ;

李劭辉 ;

姜智卓 ;

李耀文 .

中国专利 :CN118569066A ,2024-08-30

[9]

一种基于值分解的多智能体强化学习方法及系统 [P].

谢在鹏 ;

邵鹏飞 ;

高原 ;

张雨锋 .

中国专利 :CN114662639A ,2022-06-24

[10]

一种基于值分解的多智能体强化学习方法及系统 [P].

谢在鹏 ;

邵鹏飞 ;

高原 ;

张雨锋 .

中国专利 :CN114662639B ,2025-05-27

← 1 2 3 4 5 →