学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于相互学习的深度强化学习方法
被引:0
专利类型
:
发明
申请号
:
CN202410486393.5
申请日
:
2024-04-22
公开(公告)号
:
CN118446278A
公开(公告)日
:
2024-08-06
发明(设计)人
:
侯璐
韩莹
潘真真
韩灵怡
申请人
:
北京邮电大学
申请人地址
:
100876 北京市海淀区西土城路10号
IPC主分类号
:
G06N3/092
IPC分类号
:
G06N3/084
G06N3/045
G06N3/006
代理机构
:
北京中海智圣知识产权代理有限公司 11282
代理人
:
王志东
法律状态
:
实质审查的生效
国省代码
:
北京市 市辖区
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2024-08-23
实质审查的生效
实质审查的生效IPC(主分类):G06N 3/092申请日:20240422
2024-08-06
公开
公开
共 50 条
[1]
基于状态表示学习的深度强化学习方法及装置
[P].
李厚强
论文数:
0
引用数:
0
h-index:
0
李厚强
;
周文罡
论文数:
0
引用数:
0
h-index:
0
周文罡
;
赵鉴
论文数:
0
引用数:
0
h-index:
0
赵鉴
.
中国专利
:CN113705805A
,2021-11-26
[2]
基于深度强化学习方法的中国象棋博弈学习方法及系统
[P].
姚建国
论文数:
0
引用数:
0
h-index:
0
姚建国
;
涂冰洁
论文数:
0
引用数:
0
h-index:
0
涂冰洁
;
赵立东
论文数:
0
引用数:
0
h-index:
0
赵立东
;
鹿艳梅
论文数:
0
引用数:
0
h-index:
0
鹿艳梅
.
中国专利
:CN113599798A
,2021-11-05
[3]
用于建筑能源控制的深度强化学习方法及系统
[P].
张彦如
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
张彦如
;
胥汶渲
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
胥汶渲
;
陈维龙
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
陈维龙
;
刘羽旗
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
刘羽旗
;
刘旻昊
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
刘旻昊
;
王岩
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
王岩
;
杨涵
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
杨涵
.
中国专利
:CN120542515B
,2025-09-19
[4]
用于建筑能源控制的深度强化学习方法及系统
[P].
张彦如
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
张彦如
;
胥汶渲
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
胥汶渲
;
陈维龙
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
陈维龙
;
刘羽旗
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
刘羽旗
;
刘旻昊
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
刘旻昊
;
王岩
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
王岩
;
杨涵
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
杨涵
.
中国专利
:CN120542515A
,2025-08-26
[5]
具有实时性的深度强化学习方法
[P].
孟媛
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
孟媛
;
论文数:
引用数:
h-index:
机构:
吴爱国
;
戚文念
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
戚文念
;
论文数:
引用数:
h-index:
机构:
张颖
.
中国专利
:CN119005288A
,2024-11-22
[6]
具有实时性的深度强化学习方法
[P].
孟媛
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
孟媛
;
论文数:
引用数:
h-index:
机构:
吴爱国
;
戚文念
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
戚文念
;
论文数:
引用数:
h-index:
机构:
张颖
.
中国专利
:CN119005288B
,2025-05-06
[7]
基于环境动态分解模型的深度强化学习方法
[P].
王聪
论文数:
0
引用数:
0
h-index:
0
王聪
;
杨天培
论文数:
0
引用数:
0
h-index:
0
杨天培
;
郝建业
论文数:
0
引用数:
0
h-index:
0
郝建业
;
郑岩
论文数:
0
引用数:
0
h-index:
0
郑岩
;
马亿
论文数:
0
引用数:
0
h-index:
0
马亿
.
中国专利
:CN114154582A
,2022-03-08
[8]
基于环境动态分解模型的深度强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
郑岩
;
论文数:
引用数:
h-index:
机构:
郝建业
;
杨天培
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学
天津大学
杨天培
;
马亿
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学
天津大学
马亿
;
论文数:
引用数:
h-index:
机构:
王聪
.
中国专利
:CN114154582B
,2024-04-19
[9]
一种基于抽象训练与验证的安全深度强化学习方法
[P].
李魁昊
论文数:
0
引用数:
0
h-index:
0
机构:
华东师范大学
华东师范大学
李魁昊
;
田家旭
论文数:
0
引用数:
0
h-index:
0
机构:
华东师范大学
华东师范大学
田家旭
;
论文数:
引用数:
h-index:
机构:
张民
.
中国专利
:CN117808075A
,2024-04-02
[10]
并行训练的异策略深度强化学习方法
[P].
陈志波
论文数:
0
引用数:
0
h-index:
0
陈志波
;
张直政
论文数:
0
引用数:
0
h-index:
0
张直政
;
陈嘉乐
论文数:
0
引用数:
0
h-index:
0
陈嘉乐
;
石隽
论文数:
0
引用数:
0
h-index:
0
石隽
.
中国专利
:CN108108822A
,2018-06-01
←
1
2
3
4
5
→