多智能体强化学习模型训练方法、学习方法及装置

被引:0
专利类型
发明
申请号
CN202510627093.9
申请日
2025-05-15
公开(公告)号
CN120654767A
公开(公告)日
2025-09-16
发明(设计)人
陈润泽 唐思琦 胡昆
申请人
中国电子科技集团公司信息科学研究院
申请人地址
100041 北京市石景山区实兴大街金府路30号院4号楼
IPC主分类号
G06N3/092
IPC分类号
G06N3/006 G06N3/045 G06N3/048
代理机构
北京中知法苑知识产权代理有限公司 11226
代理人
唐妍
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
多智能体强化学习方法 [P]. 
刘绍辉 ;
姜兴宗 ;
赵海涛 ;
王鑫 ;
李刚 ;
刘可人 ;
于涛 .
中国专利 :CN121031706A ,2025-11-28
[2]
基于强化学习的多智能体动态追捕任务训练方法及装置 [P]. 
汪玉 ;
陈佳煜 ;
于超 ;
阳欣怡 ;
杨华中 .
中国专利 :CN117408159A ,2024-01-16
[3]
强化学习模型训练方法及装置 [P]. 
韩旭东 ;
张锐 ;
李震 ;
沙剑 ;
赵军平 .
中国专利 :CN118350483A ,2024-07-16
[4]
强化学习模型的训练方法及装置 [P]. 
王芳 ;
暴宇健 .
中国专利 :CN117669650A ,2024-03-08
[5]
一种高样本效率的多智能体强化学习训练方法 [P]. 
吴健 ;
宋广华 ;
姜晓红 ;
叶振辉 ;
陈弈宁 ;
王珂 ;
应豪超 .
中国专利 :CN113313209A ,2021-08-27
[6]
一种多智能体强化学习方法及系统 [P]. 
李厚强 ;
周文罡 ;
赵鉴 ;
胡迅晗 .
中国专利 :CN113592100A ,2021-11-02
[7]
一种多智能体强化学习方法及系统 [P]. 
李厚强 ;
周文罡 ;
赵鉴 ;
胡迅晗 .
中国专利 :CN113592100B ,2024-02-23
[8]
基于强化学习的问题模板生成模型训练方法及装置 [P]. 
张文俊 ;
暴宇健 .
中国专利 :CN117454865A ,2024-01-26
[9]
一种基于博弈约简的多智能体强化学习方法 [P]. 
陈佳瑞 ;
高阳 .
中国专利 :CN111639756A ,2020-09-08
[10]
多智能体强化学习系统、方法、电子设备及存储介质 [P]. 
徐亮 ;
单彬 ;
赵鉴 ;
秦熔均 ;
俞扬 .
中国专利 :CN117933350A ,2024-04-26