一种基于博弈约简的多智能体强化学习方法

被引:0
专利类型
发明
申请号
CN202010537805.5
申请日
2020-06-12
公开(公告)号
CN111639756A
公开(公告)日
2020-09-08
发明(设计)人
陈佳瑞 高阳
申请人
申请人地址
210023 江苏省南京市栖霞区仙林大道163号
IPC主分类号
G06N304
IPC分类号
G06N308 G06N2000
代理机构
南京泰普专利代理事务所(普通合伙) 32360
代理人
窦贤宇
法律状态
实质审查的生效
国省代码
引用
下载
收藏
共 50 条
[1]
多智能体强化学习方法 [P]. 
刘绍辉 ;
姜兴宗 ;
赵海涛 ;
王鑫 ;
李刚 ;
刘可人 ;
于涛 .
中国专利 :CN121031706A ,2025-11-28
[2]
多智能体强化学习模型训练方法、学习方法及装置 [P]. 
陈润泽 ;
唐思琦 ;
胡昆 .
中国专利 :CN120654767A ,2025-09-16
[3]
一种基于多智能体强化学习的公交智能调度方法 [P]. 
李俊俊 ;
董皓 ;
赵学东 ;
陶黎明 ;
梁超 ;
张迎 .
中国专利 :CN116307448B ,2024-04-02
[4]
基于多智能体强化学习算法的无人机博弈对抗夺岛方法 [P]. 
张博 ;
杨超凡 ;
王琦 .
中国专利 :CN120031068A ,2025-05-23
[5]
两团队零和博弈的多智能体强化学习方法 [P]. 
朱圆恒 ;
胡光政 ;
赵冬斌 .
中国专利 :CN118863006A ,2024-10-29
[6]
一种基于多智能体强化学习的多机空战决策方法 [P]. 
刘小雄 ;
尹逸 ;
苏玉展 ;
秦斌 ;
韦大正 .
中国专利 :CN113791634A ,2021-12-14
[7]
一种基于多智能体强化学习的多机空战决策方法 [P]. 
刘小雄 ;
尹逸 ;
苏玉展 ;
秦斌 ;
韦大正 .
中国专利 :CN113791634B ,2024-02-02
[8]
一种多智能体强化学习方法 [P]. 
张龙 .
中国专利 :CN120337975A ,2025-07-18
[9]
一种基于多智能体强化学习的机场滑行智能调度方法 [P]. 
唐岚 ;
梁永胜 ;
黄泓毓 ;
丁辉 ;
付胜豪 ;
董斌 ;
王凯 .
中国专利 :CN116402273B ,2025-11-18
[10]
一种基于多智能体强化学习的边缘缓存替换方法 [P]. 
范琪琳 ;
史若涵 ;
李秀华 ;
付澍 ;
陈蒙 ;
王悦阳 ;
刘奇峰 .
中国专利 :CN115714814B ,2024-05-07