基于最大熵投影的控制系统强化学习方法和装置

被引：0

专利类型：

发明

申请号：

CN202211119789.3

申请日：

2022-09-15

公开(公告)号：

CN115526335B

公开(公告)日：

2025-07-29

发明(设计)人：

刘俊涛汤海南王振杰高子文李昊

申请人：

中国船舶集团有限公司第七〇九研究所

申请人地址：

430000 湖北省武汉市江夏区凤凰产业园藏龙北路1号

IPC主分类号：

G06N20/00

IPC分类号：

G06F18/214 G05B13/04

代理机构：

深圳市六加知识产权代理有限公司 44372

代理人：

向彬

法律状态：

授权

国省代码：

上海市市辖区

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2025-07-29	授权	授权

共 50 条

[1]

基于最大熵投影的控制系统强化学习方法和装置 [P].

刘俊涛 ;

汤海南 ;

王振杰 ;

高子文 ;

李昊 .

中国专利 :CN115526335A ,2022-12-27

[2]

基于最大熵强化学习的自适应智能环境控制系统及方法 [P].

玉鹏 ;

陈龙辉 ;

张超 .

中国专利 :CN121143014A ,2025-12-16

[3]

基于最大熵框架的强化学习的交通信号控制方法 [P].

阚宇衡 ;

王茂南 ;

谷心洋 .

中国专利 :CN115588303A ,2023-01-10

[4]

基于最大熵框架的强化学习的交通信号控制方法 [P].

阚宇衡 ;

王茂南 ;

谷心洋 .

中国专利 :CN115588303B ,2025-12-12

[5]

基于多智能体的强化学习系统和强化学习方法 [P].

郑同训 ;

方晶焕 ;

温亨锡 ;

全原奭 ;

金奇相 ;

田炳昱 ;

元东薰 ;

罗熙渊 .

韩国专利 :CN117540777A ,2024-02-09

[6]

迁移强化学习方法及装置、多任务强化学习方法及装置 [P].

张海超 ;

孙凌峰 ;

徐伟 .

美国专利 :CN118171752A ,2024-06-11

[7]

基于强化学习的中央空调控制方法和控制系统 [P].

郭睿 ;

陈东 ;

叶傲霜 ;

李逸超 ;

徐刚 ;

胥栋 ;

李赟 ;

石珺 ;

林巧月 ;

周思瑜 ;

钱韦辰 .

中国专利 :CN114234381A ,2022-03-25

[8]

基于世界模型的增强强化学习方法 [P].

刘鑫 ;

王嘉博 ;

杜长坤 ;

岳振江 .

中国专利 :CN120542512A ,2025-08-26

[9]

基于多智能体强化学习的原料混合控制方法和控制系统 [P].

孙毅 ;

谭达克 ;

蔡李峰 ;

陈康 .

中国专利 :CN119493368B ,2025-11-07

[10]

基于多智能体强化学习的原料混合控制方法和控制系统 [P].

孙毅 ;

谭达克 ;

蔡李峰 ;

陈康 .

中国专利 :CN119493368A ,2025-02-21

← 1 2 3 4 5 →