学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
使用分布式优先化回放的强化学习
被引:0
专利类型
:
发明
申请号
:
CN201880068801.8
申请日
:
2018-10-29
公开(公告)号
:
CN111316295A
公开(公告)日
:
2020-06-19
发明(设计)人
:
D.巴登
G.巴特马伦
J.全
D.G.霍根
申请人
:
申请人地址
:
英国伦敦
IPC主分类号
:
G06N308
IPC分类号
:
G06N304
代理机构
:
北京市柳沈律师事务所 11105
代理人
:
金玉洁
法律状态
:
实质审查的生效
国省代码
:
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2020-07-14
实质审查的生效
实质审查的生效 IPC(主分类):G06N 3/08 申请日:20181029
2020-06-19
公开
公开
共 50 条
[1]
分布式强化学习
[P].
W.C.达布尼
论文数:
0
引用数:
0
h-index:
0
W.C.达布尼
;
M.金德罗-贝尔-梅尔
论文数:
0
引用数:
0
h-index:
0
M.金德罗-贝尔-梅尔
.
中国专利
:CN110520868A
,2019-11-29
[2]
使用异策略行动者-评价者强化学习进行分布式训练
[P].
H.J.索耶
论文数:
0
引用数:
0
h-index:
0
H.J.索耶
;
L.埃思佩霍尔特
论文数:
0
引用数:
0
h-index:
0
L.埃思佩霍尔特
;
K.西蒙扬
论文数:
0
引用数:
0
h-index:
0
K.西蒙扬
;
Y.多伦
论文数:
0
引用数:
0
h-index:
0
Y.多伦
;
V.菲罗伊
论文数:
0
引用数:
0
h-index:
0
V.菲罗伊
;
V.米尼
论文数:
0
引用数:
0
h-index:
0
V.米尼
;
K.卡沃克库格鲁
论文数:
0
引用数:
0
h-index:
0
K.卡沃克库格鲁
;
R.穆诺斯
论文数:
0
引用数:
0
h-index:
0
R.穆诺斯
;
T.沃德
论文数:
0
引用数:
0
h-index:
0
T.沃德
;
T.J.A.哈利
论文数:
0
引用数:
0
h-index:
0
T.J.A.哈利
;
I.杜宁
论文数:
0
引用数:
0
h-index:
0
I.杜宁
.
中国专利
:CN111417964A
,2020-07-14
[3]
使用异策略行动者-评价者强化学习进行分布式训练
[P].
H·J·索耶
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
H·J·索耶
;
L·埃思佩霍尔特
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
L·埃思佩霍尔特
;
K·西蒙扬
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
K·西蒙扬
;
Y·多伦
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
Y·多伦
;
V·菲罗伊
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
V·菲罗伊
;
V·米尼
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
V·米尼
;
K·卡沃克库格鲁
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
K·卡沃克库格鲁
;
R·穆诺斯
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
R·穆诺斯
;
T·沃德
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
T·沃德
;
T·J·A·哈利
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
T·J·A·哈利
;
I·杜宁
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
I·杜宁
.
英国专利
:CN118211640A
,2024-06-18
[4]
使用强化学习的环境导航
[P].
F.维奥拉
论文数:
0
引用数:
0
h-index:
0
F.维奥拉
;
P.W.米罗夫基
论文数:
0
引用数:
0
h-index:
0
P.W.米罗夫基
;
A.巴尼诺
论文数:
0
引用数:
0
h-index:
0
A.巴尼诺
;
R.帕斯卡努
论文数:
0
引用数:
0
h-index:
0
R.帕斯卡努
;
H.J.索耶
论文数:
0
引用数:
0
h-index:
0
H.J.索耶
;
A.J.巴拉德
论文数:
0
引用数:
0
h-index:
0
A.J.巴拉德
;
S.库马兰
论文数:
0
引用数:
0
h-index:
0
S.库马兰
;
R.T.哈德塞尔
论文数:
0
引用数:
0
h-index:
0
R.T.哈德塞尔
;
L.西夫勒
论文数:
0
引用数:
0
h-index:
0
L.西夫勒
;
R.戈罗什恩
论文数:
0
引用数:
0
h-index:
0
R.戈罗什恩
;
K.卡夫克佐格卢
论文数:
0
引用数:
0
h-index:
0
K.卡夫克佐格卢
;
M.M.R.德尼尔
论文数:
0
引用数:
0
h-index:
0
M.M.R.德尼尔
.
中国专利
:CN110088774A
,2019-08-02
[5]
用于分布式强化学习的方法、程序产品和存储介质
[P].
W·C·达布尼
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
W·C·达布尼
;
M·金德罗-贝尔-梅尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
M·金德罗-贝尔-梅尔
.
英国专利
:CN116776964B
,2025-11-25
[6]
使用强化学习选择动作名单
[P].
彼得·戈兰·苏内哈格
论文数:
0
引用数:
0
h-index:
0
彼得·戈兰·苏内哈格
.
中国专利
:CN108604314B
,2018-09-28
[7]
使用代理课程的强化学习
[P].
W.恰尔内茨基
论文数:
0
引用数:
0
h-index:
0
W.恰尔内茨基
;
S.贾亚库马尔
论文数:
0
引用数:
0
h-index:
0
S.贾亚库马尔
.
中国专利
:CN112154458A
,2020-12-29
[8]
使用代理课程的强化学习
[P].
W.恰尔内茨基
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
W.恰尔内茨基
;
S.贾亚库马尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
S.贾亚库马尔
.
英国专利
:CN112154458B
,2025-06-27
[9]
使用优先化经验存储器训练神经网络
[P].
汤姆·绍尔
论文数:
0
引用数:
0
h-index:
0
汤姆·绍尔
;
关小龙
论文数:
0
引用数:
0
h-index:
0
关小龙
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
.
中国专利
:CN108701252A
,2018-10-23
[10]
使用优先化经验存储器训练神经网络
[P].
汤姆·绍尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
汤姆·绍尔
;
关小龙
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
关小龙
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
大卫·西尔韦
.
英国专利
:CN108701252B
,2024-02-02
←
1
2
3
4
5
→