基于最大熵投影的控制系统强化学习方法和装置

被引:0
专利类型
发明
申请号
CN202211119789.3
申请日
2022-09-15
公开(公告)号
CN115526335B
公开(公告)日
2025-07-29
发明(设计)人
刘俊涛 汤海南 王振杰 高子文 李昊
申请人
中国船舶集团有限公司第七〇九研究所
申请人地址
430000 湖北省武汉市江夏区凤凰产业园藏龙北路1号
IPC主分类号
G06N20/00
IPC分类号
G06F18/214 G05B13/04
代理机构
深圳市六加知识产权代理有限公司 44372
代理人
向彬
法律状态
授权
国省代码
上海市 市辖区
引用
下载
收藏
共 50 条
[1]
基于最大熵投影的控制系统强化学习方法和装置 [P]. 
刘俊涛 ;
汤海南 ;
王振杰 ;
高子文 ;
李昊 .
中国专利 :CN115526335A ,2022-12-27
[2]
基于最大熵强化学习的自适应智能环境控制系统及方法 [P]. 
玉鹏 ;
陈龙辉 ;
张超 .
中国专利 :CN121143014A ,2025-12-16
[3]
基于最大熵框架的强化学习的交通信号控制方法 [P]. 
阚宇衡 ;
王茂南 ;
谷心洋 .
中国专利 :CN115588303A ,2023-01-10
[4]
基于最大熵框架的强化学习的交通信号控制方法 [P]. 
阚宇衡 ;
王茂南 ;
谷心洋 .
中国专利 :CN115588303B ,2025-12-12
[5]
基于多智能体的强化学习系统和强化学习方法 [P]. 
郑同训 ;
方晶焕 ;
温亨锡 ;
全原奭 ;
金奇相 ;
田炳昱 ;
元东薰 ;
罗熙渊 .
韩国专利 :CN117540777A ,2024-02-09
[6]
迁移强化学习方法及装置、多任务强化学习方法及装置 [P]. 
张海超 ;
孙凌峰 ;
徐伟 .
美国专利 :CN118171752A ,2024-06-11
[7]
基于强化学习的中央空调控制方法和控制系统 [P]. 
郭睿 ;
陈东 ;
叶傲霜 ;
李逸超 ;
徐刚 ;
胥栋 ;
李赟 ;
石珺 ;
林巧月 ;
周思瑜 ;
钱韦辰 .
中国专利 :CN114234381A ,2022-03-25
[8]
基于世界模型的增强强化学习方法 [P]. 
刘鑫 ;
王嘉博 ;
杜长坤 ;
岳振江 .
中国专利 :CN120542512A ,2025-08-26
[9]
基于多智能体强化学习的原料混合控制方法和控制系统 [P]. 
孙毅 ;
谭达克 ;
蔡李峰 ;
陈康 .
中国专利 :CN119493368B ,2025-11-07
[10]
基于多智能体强化学习的原料混合控制方法和控制系统 [P]. 
孙毅 ;
谭达克 ;
蔡李峰 ;
陈康 .
中国专利 :CN119493368A ,2025-02-21