一种基于探索奖励塑造的双阶段多智能体协同方法

被引:0
专利类型
发明
申请号
CN202510912462.9
申请日
2025-07-03
公开(公告)号
CN120952091A
公开(公告)日
2025-11-14
发明(设计)人
韩升 吕凯 王硕 林友芳 章迅
申请人
北京交通大学
申请人地址
100044 北京市海淀区上园村3号北京交通大学计算机科学与技术学院
IPC主分类号
G06N3/092
IPC分类号
G06F18/214 G06F18/213 G06N3/042
代理机构
北京红福盈知识产权代理事务所(普通合伙) 11525
代理人
陈月福
法律状态
实质审查的生效
国省代码
北京市 市辖区
引用
下载
收藏
共 50 条
[1]
基于信息增益构建内在个体奖励的多智能体协同探索方法 [P]. 
任璐 ;
冯浩宇 ;
沈博文 ;
王振 ;
柳文章 .
中国专利 :CN120087410A ,2025-06-03
[2]
一种基于语义通信的多智能体协同方法 [P]. 
李朋 ;
曹江 ;
王双双 ;
高原 ;
吴冠霖 ;
赵锦明 ;
秦潜聪 ;
王嗣平 .
中国专利 :CN118643837A ,2024-09-13
[3]
一种基于最大熵的多智能体协同方法和装置 [P]. 
汤海南 ;
刘俊涛 ;
王振杰 ;
高子文 ;
饶子昀 .
中国专利 :CN118504651A ,2024-08-16
[4]
一种基于大语言模型的多智能体协同方法 [P]. 
张煇 ;
陆大仕 ;
曹文涛 ;
檀晓梅 .
中国专利 :CN120338035A ,2025-07-18
[5]
一种基于大语言模型的多智能体协同方法 [P]. 
张煇 ;
陆大仕 ;
曹文涛 ;
檀晓梅 .
中国专利 :CN120338035B ,2025-09-05
[6]
一种通信敏感的多智能体协同方法 [P]. 
李静林 ;
袁泉 ;
刘丽哲 ;
罗贵阳 ;
李梓延 ;
刘志晗 ;
王尚广 .
中国专利 :CN114327935A ,2022-04-12
[7]
一种通信敏感的多智能体协同方法 [P]. 
李静林 ;
袁泉 ;
刘丽哲 ;
罗贵阳 ;
李梓延 ;
刘志晗 ;
王尚广 .
中国专利 :CN114327935B ,2025-03-21
[8]
一种基于优先经验回放的多智能体协同方法和装置 [P]. 
汤海南 ;
刘俊涛 ;
张毅 ;
黄雪倩 ;
江舟 .
中国专利 :CN119647625A ,2025-03-18
[9]
一种基于MCP的多智能体协同方法、设备及介质 [P]. 
李圣伟 ;
仵夺 ;
贾荫鹏 ;
周祥龙 ;
魏子重 .
中国专利 :CN120631469A ,2025-09-12
[10]
基于大模型的多智能体协同方法、装置以及设备 [P]. 
秦华赟 ;
赖宏焕 ;
金盛杰 ;
张天伟 .
中国专利 :CN120297319A ,2025-07-11