一种用于多智能体系统协同通信和控制的强化学习算法

被引:0
专利类型
发明
申请号
CN202011278974.8
申请日
2020-11-16
公开(公告)号
CN112434792A
公开(公告)日
2021-03-02
发明(设计)人
王远大 孙长银 孙佳
申请人
申请人地址
210096 江苏省南京市玄武区四牌楼2号
IPC主分类号
G06N304
IPC分类号
G06N2000 H04L2908
代理机构
南京众联专利代理有限公司 32206
代理人
蒋昱
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
基于强化学习算法的多智能体系统协同控制方法及系统 [P]. 
王炳昌 ;
张宝强 ;
王天祥 .
中国专利 :CN113534660A ,2021-10-22
[2]
多智能体系统的多梯度递归强化学习模糊控制方法及系统 [P]. 
李铁山 ;
龙跃 ;
程玉华 ;
李美霖 ;
李耀仑 .
中国专利 :CN111948937A ,2020-11-17
[3]
基于强化学习的双时间尺度多智能体系统控制方法及系统 [P]. 
夏荣盛 ;
李涛 ;
秦玉林 ;
滕超群 ;
徐彩霞 .
中国专利 :CN119717537A ,2025-03-28
[4]
一种基于多智能体系统的深度强化学习方法 [P]. 
张翼 ;
赵岭忠 ;
翟仲毅 .
中国专利 :CN115048973A ,2022-09-13
[5]
一种基于多智能体分层强化学习的车路协同通信系统及其方法 [P]. 
师晓晔 ;
任乐飞 ;
杨世豪 ;
丁飞 ;
鲍楠 ;
潘甦 .
中国专利 :CN118400786A ,2024-07-26
[6]
一种基于异质多智能体强化学习算法的异构设备控制方法 [P]. 
郑晓东 ;
曹晖 ;
石天卓 ;
禹世璇 ;
房嘉玥 ;
薛霜思 ;
刘雨晗 .
中国专利 :CN119335857A ,2025-01-21
[7]
基于模糊强化学习的多智能体系统预设时间编队控制方法 [P]. 
熊师洵 ;
张娜 ;
吕沁 .
中国专利 :CN119781302B ,2025-07-11
[8]
基于模糊强化学习的多智能体系统预设时间编队控制方法 [P]. 
熊师洵 ;
张娜 ;
吕沁 .
中国专利 :CN119781302A ,2025-04-08
[9]
一种用于多智能体强化学习中的对比学习表征方法 [P]. 
王志 ;
胡紫灿 ;
章宗长 ;
魏婧雯 ;
李华雄 ;
陈春林 ;
王博 ;
辛博 ;
朱张青 .
中国专利 :CN117634645A ,2024-03-01
[10]
一种基于多智能体强化学习的协同决策系统 [P]. 
杨文波 ;
雷富强 ;
关鹏 ;
江小丫 ;
成政 .
中国专利 :CN119511713A ,2025-02-25