基于最大熵投影的控制系统强化学习方法和装置

被引:0
申请号
CN202211119789.3
申请日
2022-09-15
公开(公告)号
CN115526335A
公开(公告)日
2022-12-27
发明(设计)人
刘俊涛 汤海南 王振杰 高子文 李昊
申请人
申请人地址
430000 湖北省武汉市江夏区凤凰产业园藏龙北路1号
IPC主分类号
G06N2000
IPC分类号
G06K962 G05B1304
代理机构
深圳市六加知识产权代理有限公司 44372
代理人
向彬
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
基于最大熵投影的控制系统强化学习方法和装置 [P]. 
刘俊涛 ;
汤海南 ;
王振杰 ;
高子文 ;
李昊 .
中国专利 :CN115526335B ,2025-07-29
[2]
基于最大熵强化学习的自适应智能环境控制系统及方法 [P]. 
玉鹏 ;
陈龙辉 ;
张超 .
中国专利 :CN121143014A ,2025-12-16
[3]
基于最大熵框架的强化学习的交通信号控制方法 [P]. 
阚宇衡 ;
王茂南 ;
谷心洋 .
中国专利 :CN115588303A ,2023-01-10
[4]
基于最大熵框架的强化学习的交通信号控制方法 [P]. 
阚宇衡 ;
王茂南 ;
谷心洋 .
中国专利 :CN115588303B ,2025-12-12
[5]
基于多智能体的强化学习系统和强化学习方法 [P]. 
郑同训 ;
方晶焕 ;
温亨锡 ;
全原奭 ;
金奇相 ;
田炳昱 ;
元东薰 ;
罗熙渊 .
韩国专利 :CN117540777A ,2024-02-09
[6]
迁移强化学习方法及装置、多任务强化学习方法及装置 [P]. 
张海超 ;
孙凌峰 ;
徐伟 .
美国专利 :CN118171752A ,2024-06-11
[7]
基于强化学习的中央空调控制方法和控制系统 [P]. 
郭睿 ;
陈东 ;
叶傲霜 ;
李逸超 ;
徐刚 ;
胥栋 ;
李赟 ;
石珺 ;
林巧月 ;
周思瑜 ;
钱韦辰 .
中国专利 :CN114234381A ,2022-03-25
[8]
基于世界模型的增强强化学习方法 [P]. 
刘鑫 ;
王嘉博 ;
杜长坤 ;
岳振江 .
中国专利 :CN120542512A ,2025-08-26
[9]
基于多智能体强化学习的原料混合控制方法和控制系统 [P]. 
孙毅 ;
谭达克 ;
蔡李峰 ;
陈康 .
中国专利 :CN119493368B ,2025-11-07
[10]
基于多智能体强化学习的原料混合控制方法和控制系统 [P]. 
孙毅 ;
谭达克 ;
蔡李峰 ;
陈康 .
中国专利 :CN119493368A ,2025-02-21