基于相互学习的深度强化学习方法

被引:0
专利类型
发明
申请号
CN202410486393.5
申请日
2024-04-22
公开(公告)号
CN118446278A
公开(公告)日
2024-08-06
发明(设计)人
侯璐 韩莹 潘真真 韩灵怡
申请人
北京邮电大学
申请人地址
100876 北京市海淀区西土城路10号
IPC主分类号
G06N3/092
IPC分类号
G06N3/084 G06N3/045 G06N3/006
代理机构
北京中海智圣知识产权代理有限公司 11282
代理人
王志东
法律状态
实质审查的生效
国省代码
北京市 市辖区
引用
下载
收藏
共 50 条
[1]
基于状态表示学习的深度强化学习方法及装置 [P]. 
李厚强 ;
周文罡 ;
赵鉴 .
中国专利 :CN113705805A ,2021-11-26
[2]
基于深度强化学习方法的中国象棋博弈学习方法及系统 [P]. 
姚建国 ;
涂冰洁 ;
赵立东 ;
鹿艳梅 .
中国专利 :CN113599798A ,2021-11-05
[3]
用于建筑能源控制的深度强化学习方法及系统 [P]. 
张彦如 ;
胥汶渲 ;
陈维龙 ;
刘羽旗 ;
刘旻昊 ;
王岩 ;
杨涵 .
中国专利 :CN120542515B ,2025-09-19
[4]
用于建筑能源控制的深度强化学习方法及系统 [P]. 
张彦如 ;
胥汶渲 ;
陈维龙 ;
刘羽旗 ;
刘旻昊 ;
王岩 ;
杨涵 .
中国专利 :CN120542515A ,2025-08-26
[5]
具有实时性的深度强化学习方法 [P]. 
孟媛 ;
吴爱国 ;
戚文念 ;
张颖 .
中国专利 :CN119005288A ,2024-11-22
[6]
具有实时性的深度强化学习方法 [P]. 
孟媛 ;
吴爱国 ;
戚文念 ;
张颖 .
中国专利 :CN119005288B ,2025-05-06
[7]
基于环境动态分解模型的深度强化学习方法 [P]. 
王聪 ;
杨天培 ;
郝建业 ;
郑岩 ;
马亿 .
中国专利 :CN114154582A ,2022-03-08
[8]
基于环境动态分解模型的深度强化学习方法 [P]. 
郑岩 ;
郝建业 ;
杨天培 ;
马亿 ;
王聪 .
中国专利 :CN114154582B ,2024-04-19
[9]
一种基于抽象训练与验证的安全深度强化学习方法 [P]. 
李魁昊 ;
田家旭 ;
张民 .
中国专利 :CN117808075A ,2024-04-02
[10]
并行训练的异策略深度强化学习方法 [P]. 
陈志波 ;
张直政 ;
陈嘉乐 ;
石隽 .
中国专利 :CN108108822A ,2018-06-01