基于强化学习的变化环境多智能体控制方法与装置

被引:0
专利类型
发明
申请号
CN202110858503.2
申请日
2021-07-28
公开(公告)号
CN113837348B
公开(公告)日
2024-12-10
发明(设计)人
朱圆恒 柴嘉骏 李伟凡 赵冬斌 孙科武 丁季时雨 董博
申请人
中国科学院自动化研究所
申请人地址
100190 北京市海淀区中关村东路95号
IPC主分类号
G06N3/02
IPC分类号
G06N3/08 A63F13/847 A63F13/822
代理机构
北京路浩知识产权代理有限公司 11002
代理人
王宇杨
法律状态
授权
国省代码
北京市
引用
下载
收藏
共 50 条
[1]
基于强化学习的变化环境多智能体控制方法与装置 [P]. 
朱圆恒 ;
柴嘉骏 ;
李伟凡 ;
赵冬斌 ;
孙科武 ;
丁季时雨 ;
董博 .
中国专利 :CN113837348A ,2021-12-24
[2]
基于时空特征与多智能体强化学习的多机智能博弈方法 [P]. 
王正宁 ;
张毓丁 ;
匡育衡 ;
石镇瑜 ;
曲唐祺 ;
廖振宇 .
中国专利 :CN120523023A ,2025-08-22
[3]
基于多智能体深度强化学习的TCP拥塞控制方法及装置 [P]. 
李文中 ;
高少华 ;
李想 ;
张淋洺 ;
郑昕韬 ;
陆桑璐 .
中国专利 :CN113114581A ,2021-07-13
[4]
基于合作式强化学习与迁移学习的多智能体对抗决策方法 [P]. 
冷立雄 ;
马占国 ;
宫业国 .
中国专利 :CN111695690A ,2020-09-22
[5]
基于深度强化学习的多智能体未知环境搜救方法及系统 [P]. 
顾东晓 ;
王芹 ;
李晓玥 ;
李霄剑 ;
丁帅 ;
欧阳波 ;
杨善林 ;
徐正飞 ;
苏凯翔 ;
魏琪 ;
谢懿 .
中国专利 :CN115330029B ,2025-08-29
[6]
基于深度强化学习的多智能体未知环境搜救方法及系统 [P]. 
顾东晓 ;
王芹 ;
李晓玥 ;
李霄剑 ;
丁帅 ;
欧阳波 ;
杨善林 ;
徐正飞 ;
苏凯翔 ;
魏琪 ;
谢懿 .
中国专利 :CN115330029A ,2022-11-11
[7]
基于GAT和多智能体强化学习的建筑能耗控制方法及装置 [P]. 
刘斯奇 ;
毕功兵 .
中国专利 :CN118966838A ,2024-11-15
[8]
基于GAT和多智能体强化学习的建筑能耗控制方法及装置 [P]. 
刘斯奇 ;
毕功兵 .
中国专利 :CN118966838B ,2025-01-07
[9]
基于多智能体强化学习的智能驾驶模拟方法及系统 [P]. 
李浥东 ;
陶耀东 ;
邓昌义 .
中国专利 :CN120540387A ,2025-08-26
[10]
基于强化学习与反馈投票的多智能体任务执行方法及系统 [P]. 
赵玉琦 ;
李志文 ;
和诗雨 ;
邹梓辰 .
中国专利 :CN121168505A ,2025-12-19