基于相互学习的深度强化学习方法

被引：0

专利类型：

发明

申请号：

CN202410486393.5

申请日：

2024-04-22

公开(公告)号：

CN118446278A

公开(公告)日：

2024-08-06

发明(设计)人：

侯璐韩莹潘真真韩灵怡

申请人：

北京邮电大学

申请人地址：

100876 北京市海淀区西土城路10号

IPC主分类号：

G06N3/092

IPC分类号：

G06N3/084 G06N3/045 G06N3/006

代理机构：

北京中海智圣知识产权代理有限公司 11282

代理人：

王志东

法律状态：

实质审查的生效

国省代码：

北京市市辖区

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2024-08-23	实质审查的生效	实质审查的生效IPC(主分类):G06N 3/092申请日:20240422
2024-08-06	公开	公开

共 50 条

[1]

基于状态表示学习的深度强化学习方法及装置 [P].

李厚强 ;

周文罡 ;

赵鉴 .

中国专利 :CN113705805A ,2021-11-26

[2]

基于深度强化学习方法的中国象棋博弈学习方法及系统 [P].

姚建国 ;

涂冰洁 ;

赵立东 ;

鹿艳梅 .

中国专利 :CN113599798A ,2021-11-05

[3]

用于建筑能源控制的深度强化学习方法及系统 [P].

张彦如 ;

胥汶渲 ;

陈维龙 ;

刘羽旗 ;

刘旻昊 ;

王岩 ;

杨涵 .

中国专利 :CN120542515B ,2025-09-19

[4]

用于建筑能源控制的深度强化学习方法及系统 [P].

张彦如 ;

胥汶渲 ;

陈维龙 ;

刘羽旗 ;

刘旻昊 ;

王岩 ;

杨涵 .

中国专利 :CN120542515A ,2025-08-26

[5]

具有实时性的深度强化学习方法 [P].

孟媛 ;

吴爱国 ;

戚文念 ;

张颖 .

中国专利 :CN119005288A ,2024-11-22

[6]

具有实时性的深度强化学习方法 [P].

孟媛 ;

吴爱国 ;

戚文念 ;

张颖 .

中国专利 :CN119005288B ,2025-05-06

[7]

基于环境动态分解模型的深度强化学习方法 [P].

王聪 ;

杨天培 ;

郝建业 ;

郑岩 ;

马亿 .

中国专利 :CN114154582A ,2022-03-08

[8]

基于环境动态分解模型的深度强化学习方法 [P].

郑岩 ;

郝建业 ;

杨天培 ;

马亿 ;

王聪 .

中国专利 :CN114154582B ,2024-04-19

[9]

一种基于抽象训练与验证的安全深度强化学习方法 [P].

李魁昊 ;

田家旭 ;

张民 .

中国专利 :CN117808075A ,2024-04-02

[10]

并行训练的异策略深度强化学习方法 [P].

陈志波 ;

张直政 ;

陈嘉乐 ;

石隽 .

中国专利 :CN108108822A ,2018-06-01

← 1 2 3 4 5 →