一种多智能体协同决策强化学习方法、系统及装置

被引:0
专利类型
发明
申请号
CN202311322476.2
申请日
2023-10-12
公开(公告)号
CN117151206B
公开(公告)日
2024-04-12
发明(设计)人
陈嘉义 茹吉 项轼辙 罗家胜 曹涛 张灿阳 张旭 胡影超 魏冉 褚坤 王斌 刘哲祺
申请人
北京蓝色创想网络科技有限责任公司
申请人地址
100144 北京市石景山区八大处路49号院6号楼一层116号
IPC主分类号
G06N3/092
IPC分类号
G06N3/0442 G06N3/084
代理机构
北京轻创知识产权代理有限公司 11212
代理人
何佩英
法律状态
授权
国省代码
北京市 市辖区
引用
下载
收藏
共 50 条
[1]
一种多智能体协同强化学习方法、终端及存储介质 [P]. 
漆舒汉 ;
张书豪 ;
王轩 ;
张加佳 ;
吴宇琳 ;
王强 ;
施少怀 ;
侯晓涵 .
中国专利 :CN116226662B ,2024-02-09
[2]
一种基于联邦强化学习的多智能体协同决策方法 [P]. 
王帅 ;
龙浩然 ;
罗吉润 ;
沈怡 .
中国专利 :CN120745684A ,2025-10-03
[3]
基于多智能体协同决策与强化学习的结构化决策方法 [P]. 
张明昌 ;
戴佳音 .
中国专利 :CN121116554A ,2025-12-12
[4]
一种基于强化学习的多智能体协同动态目标拦截决策方法 [P]. 
陈邦彦 ;
苏洋 .
中国专利 :CN121069790A ,2025-12-05
[5]
基于默契行为预训练的多智能体协同对抗强化学习方法 [P]. 
王学谦 ;
姚诗晴 ;
常永哲 ;
谭俊波 .
中国专利 :CN120373406A ,2025-07-25
[6]
离散化多智能体的深度强化学习方法及系统 [P]. 
朱圆恒 ;
傅宇千 ;
赵冬斌 .
中国专利 :CN117610643B ,2024-10-11
[7]
离散化多智能体的深度强化学习方法及系统 [P]. 
朱圆恒 ;
傅宇千 ;
赵冬斌 .
中国专利 :CN117610643A ,2024-02-27
[8]
一种工业废气治理强化学习多智能体协同优化方法及系统 [P]. 
陈雷 ;
陆雪梅 ;
王金龙 ;
王云枫 ;
王明秀 .
中国专利 :CN118311876A ,2024-07-09
[9]
一种基于深度强化学习的多智能体协同控制方法及系统 [P]. 
宋勇 ;
石其同 ;
许庆阳 ;
袁宪锋 ;
刘萍萍 ;
刘冰 ;
田容雨 ;
李贻斌 .
中国专利 :CN119026666A ,2024-11-26
[10]
一种工业废气治理强化学习多智能体协同优化方法及系统 [P]. 
陈雷 ;
陆雪梅 ;
王金龙 ;
王云枫 ;
王明秀 .
中国专利 :CN118311876B ,2024-10-18