使用分布式优先化回放的强化学习

被引:0
专利类型
发明
申请号
CN201880068801.8
申请日
2018-10-29
公开(公告)号
CN111316295A
公开(公告)日
2020-06-19
发明(设计)人
D.巴登 G.巴特马伦 J.全 D.G.霍根
申请人
申请人地址
英国伦敦
IPC主分类号
G06N308
IPC分类号
G06N304
代理机构
北京市柳沈律师事务所 11105
代理人
金玉洁
法律状态
实质审查的生效
国省代码
引用
下载
收藏
共 50 条
[1]
分布式强化学习 [P]. 
W.C.达布尼 ;
M.金德罗-贝尔-梅尔 .
中国专利 :CN110520868A ,2019-11-29
[2]
使用异策略行动者-评价者强化学习进行分布式训练 [P]. 
H.J.索耶 ;
L.埃思佩霍尔特 ;
K.西蒙扬 ;
Y.多伦 ;
V.菲罗伊 ;
V.米尼 ;
K.卡沃克库格鲁 ;
R.穆诺斯 ;
T.沃德 ;
T.J.A.哈利 ;
I.杜宁 .
中国专利 :CN111417964A ,2020-07-14
[3]
使用异策略行动者-评价者强化学习进行分布式训练 [P]. 
H·J·索耶 ;
L·埃思佩霍尔特 ;
K·西蒙扬 ;
Y·多伦 ;
V·菲罗伊 ;
V·米尼 ;
K·卡沃克库格鲁 ;
R·穆诺斯 ;
T·沃德 ;
T·J·A·哈利 ;
I·杜宁 .
英国专利 :CN118211640A ,2024-06-18
[4]
使用强化学习的环境导航 [P]. 
F.维奥拉 ;
P.W.米罗夫基 ;
A.巴尼诺 ;
R.帕斯卡努 ;
H.J.索耶 ;
A.J.巴拉德 ;
S.库马兰 ;
R.T.哈德塞尔 ;
L.西夫勒 ;
R.戈罗什恩 ;
K.卡夫克佐格卢 ;
M.M.R.德尼尔 .
中国专利 :CN110088774A ,2019-08-02
[5]
用于分布式强化学习的方法、程序产品和存储介质 [P]. 
W·C·达布尼 ;
M·金德罗-贝尔-梅尔 .
英国专利 :CN116776964B ,2025-11-25
[6]
使用强化学习选择动作名单 [P]. 
彼得·戈兰·苏内哈格 .
中国专利 :CN108604314B ,2018-09-28
[7]
使用代理课程的强化学习 [P]. 
W.恰尔内茨基 ;
S.贾亚库马尔 .
中国专利 :CN112154458A ,2020-12-29
[8]
使用代理课程的强化学习 [P]. 
W.恰尔内茨基 ;
S.贾亚库马尔 .
英国专利 :CN112154458B ,2025-06-27
[9]
使用优先化经验存储器训练神经网络 [P]. 
汤姆·绍尔 ;
关小龙 ;
大卫·西尔韦 .
中国专利 :CN108701252A ,2018-10-23
[10]
使用优先化经验存储器训练神经网络 [P]. 
汤姆·绍尔 ;
关小龙 ;
大卫·西尔韦 .
英国专利 :CN108701252B ,2024-02-02