一种基于分层注意力机制的多智能体强化学习方法及系统

被引:0
专利类型
发明
申请号
CN202010913132.9
申请日
2020-09-03
公开(公告)号
CN112232478A
公开(公告)日
2021-01-15
发明(设计)人
史殿习 王雅洁 张拥军 薛超 郝锋 姜浩 王功举
申请人
申请人地址
300450 天津市滨海新区泰达服务外包产业园7号楼
IPC主分类号
G06N304
IPC分类号
G06N308
代理机构
北京安博达知识产权代理有限公司 11271
代理人
徐国文
法律状态
实质审查的生效
国省代码
引用
下载
收藏
共 50 条
[1]
基于稀疏注意力机制的多智能体强化学习方法及系统 [P]. 
金博 ;
李文浩 ;
王祥丰 ;
张致恺 .
中国专利 :CN112949856A ,2021-06-11
[2]
一种基于值分解和注意力机制的多智能体强化学习方法 [P]. 
吴健 ;
宋广华 ;
姜晓红 ;
范晟 ;
叶振辉 ;
陈弈宁 ;
应豪超 .
中国专利 :CN113313267A ,2021-08-27
[3]
一种基于分层评价图注意力网络的多智能体强化学习方法 [P]. 
李修贤 ;
高鹏 ;
孟敏 .
中国专利 :CN120181180A ,2025-06-20
[4]
基于多头分类堆叠注意力机制的多智能体强化学习方法 [P]. 
陈润泽 ;
唐思琦 ;
胡昆 .
中国专利 :CN118378687A ,2024-07-23
[5]
一种基于图注意力机制的多智能体强化学习方法 [P]. 
吉庆兵 ;
罗杰 ;
史豪斌 ;
谈程 ;
吴哲平 ;
何自明 .
中国专利 :CN119005292A ,2024-11-22
[6]
一种基于因果推理和分层注意力机制的强化学习方法 [P]. 
朱大勇 ;
张若洁 ;
罗光春 ;
付波 ;
王勇 ;
林劼 .
中国专利 :CN120975174A ,2025-11-18
[7]
基于注意力机制的多智能体深度强化学习策略优化方法 [P]. 
陈晋音 ;
胡书隆 ;
王雪柯 ;
章燕 .
中国专利 :CN113392935A ,2021-09-14
[8]
基于技能学习和自注意力的围捕多智能体强化学习方法 [P]. 
刘瑜 ;
张文鹏 ;
李徵 ;
李劭辉 ;
姜智卓 ;
李耀文 .
中国专利 :CN118569066A ,2024-08-30
[9]
一种基于值分解的多智能体强化学习方法及系统 [P]. 
谢在鹏 ;
邵鹏飞 ;
高原 ;
张雨锋 .
中国专利 :CN114662639A ,2022-06-24
[10]
一种基于值分解的多智能体强化学习方法及系统 [P]. 
谢在鹏 ;
邵鹏飞 ;
高原 ;
张雨锋 .
中国专利 :CN114662639B ,2025-05-27