学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于状态表示学习的深度强化学习方法及装置
被引:0
专利类型
:
发明
申请号
:
CN202010441544.7
申请日
:
2020-05-22
公开(公告)号
:
CN113705805A
公开(公告)日
:
2021-11-26
发明(设计)人
:
李厚强
周文罡
赵鉴
申请人
:
申请人地址
:
230026 安徽省合肥市包河区金寨路96号
IPC主分类号
:
G06N308
IPC分类号
:
G06N304
代理机构
:
北京集佳知识产权代理有限公司 11227
代理人
:
李伟
法律状态
:
公开
国省代码
:
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2021-11-26
公开
公开
2021-12-14
实质审查的生效
实质审查的生效 IPC(主分类):G06N 3/08 申请日:20200522
共 50 条
[1]
基于相互学习的深度强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
侯璐
;
韩莹
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学
北京邮电大学
韩莹
;
潘真真
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学
北京邮电大学
潘真真
;
韩灵怡
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学
北京邮电大学
韩灵怡
.
中国专利
:CN118446278A
,2024-08-06
[2]
基于环境状态预测的深度强化学习方法及装置
[P].
陈峰
论文数:
0
引用数:
0
h-index:
0
陈峰
;
陈达贵
论文数:
0
引用数:
0
h-index:
0
陈达贵
;
闫琪
论文数:
0
引用数:
0
h-index:
0
闫琪
.
中国专利
:CN108288094A
,2018-07-17
[3]
基于深度强化学习方法的中国象棋博弈学习方法及系统
[P].
姚建国
论文数:
0
引用数:
0
h-index:
0
姚建国
;
涂冰洁
论文数:
0
引用数:
0
h-index:
0
涂冰洁
;
赵立东
论文数:
0
引用数:
0
h-index:
0
赵立东
;
鹿艳梅
论文数:
0
引用数:
0
h-index:
0
鹿艳梅
.
中国专利
:CN113599798A
,2021-11-05
[4]
基于图表示学习和深度强化学习的知识推理方法及装置
[P].
赵刚
论文数:
0
引用数:
0
h-index:
0
赵刚
;
宋浩楠
论文数:
0
引用数:
0
h-index:
0
宋浩楠
;
王兴芬
论文数:
0
引用数:
0
h-index:
0
王兴芬
.
中国专利
:CN113780002A
,2021-12-10
[5]
深度强化学习方法、装置、设备及存储介质
[P].
论文数:
引用数:
h-index:
机构:
肖仲喆
;
论文数:
引用数:
h-index:
机构:
黄敏
;
论文数:
引用数:
h-index:
机构:
刘智丰
;
论文数:
引用数:
h-index:
机构:
罗杰
;
论文数:
引用数:
h-index:
机构:
高雷
.
中国专利
:CN117591868A
,2024-02-23
[6]
具有实时性的深度强化学习方法
[P].
孟媛
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
孟媛
;
论文数:
引用数:
h-index:
机构:
吴爱国
;
戚文念
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
戚文念
;
论文数:
引用数:
h-index:
机构:
张颖
.
中国专利
:CN119005288A
,2024-11-22
[7]
具有实时性的深度强化学习方法
[P].
孟媛
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
孟媛
;
论文数:
引用数:
h-index:
机构:
吴爱国
;
戚文念
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
戚文念
;
论文数:
引用数:
h-index:
机构:
张颖
.
中国专利
:CN119005288B
,2025-05-06
[8]
用于建筑能源控制的深度强化学习方法及系统
[P].
张彦如
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
张彦如
;
胥汶渲
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
胥汶渲
;
陈维龙
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
陈维龙
;
刘羽旗
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
刘羽旗
;
刘旻昊
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
刘旻昊
;
王岩
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
王岩
;
杨涵
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
杨涵
.
中国专利
:CN120542515B
,2025-09-19
[9]
用于建筑能源控制的深度强化学习方法及系统
[P].
张彦如
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
张彦如
;
胥汶渲
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
胥汶渲
;
陈维龙
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
陈维龙
;
刘羽旗
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
刘羽旗
;
刘旻昊
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
刘旻昊
;
王岩
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
王岩
;
杨涵
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学(深圳)高等研究院
电子科技大学(深圳)高等研究院
杨涵
.
中国专利
:CN120542515A
,2025-08-26
[10]
基于环境动态分解模型的深度强化学习方法
[P].
王聪
论文数:
0
引用数:
0
h-index:
0
王聪
;
杨天培
论文数:
0
引用数:
0
h-index:
0
杨天培
;
郝建业
论文数:
0
引用数:
0
h-index:
0
郝建业
;
郑岩
论文数:
0
引用数:
0
h-index:
0
郑岩
;
马亿
论文数:
0
引用数:
0
h-index:
0
马亿
.
中国专利
:CN114154582A
,2022-03-08
←
1
2
3
4
5
→