分布式强化学习

被引:0
专利类型
发明
申请号
CN201880025072.8
申请日
2018-04-16
公开(公告)号
CN110520868A
公开(公告)日
2019-11-29
发明(设计)人
W.C.达布尼 M.金德罗-贝尔-梅尔
申请人
申请人地址
英国伦敦
IPC主分类号
G06N300
IPC分类号
G06N304 G06N308
代理机构
北京市柳沈律师事务所 11105
代理人
金玉洁
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
用于分布式强化学习的方法、程序产品和存储介质 [P]. 
W·C·达布尼 ;
M·金德罗-贝尔-梅尔 .
英国专利 :CN116776964B ,2025-11-25
[2]
使用分布式优先化回放的强化学习 [P]. 
D.巴登 ;
G.巴特马伦 ;
J.全 ;
D.G.霍根 .
中国专利 :CN111316295A ,2020-06-19
[3]
使用异策略行动者-评价者强化学习进行分布式训练 [P]. 
H·J·索耶 ;
L·埃思佩霍尔特 ;
K·西蒙扬 ;
Y·多伦 ;
V·菲罗伊 ;
V·米尼 ;
K·卡沃克库格鲁 ;
R·穆诺斯 ;
T·沃德 ;
T·J·A·哈利 ;
I·杜宁 .
英国专利 :CN118211640A ,2024-06-18
[4]
使用异策略行动者-评价者强化学习进行分布式训练 [P]. 
H.J.索耶 ;
L.埃思佩霍尔特 ;
K.西蒙扬 ;
Y.多伦 ;
V.菲罗伊 ;
V.米尼 ;
K.卡沃克库格鲁 ;
R.穆诺斯 ;
T.沃德 ;
T.J.A.哈利 ;
I.杜宁 .
中国专利 :CN111417964A ,2020-07-14
[5]
批量强化学习 [P]. 
D.哈夫纳 .
美国专利 :CN110753936B ,2024-10-29
[6]
批量强化学习 [P]. 
D.哈夫纳 .
中国专利 :CN110753936A ,2020-02-04
[7]
检索增强强化学习 [P]. 
阿尼鲁德·戈亚尔 ;
安德烈亚·巴尼诺 ;
艾布拉姆·卢克·弗里森 ;
塞奥法尼·纪尧姆·韦伯 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
柯楠 ;
西蒙·奥辛德罗 ;
蒂莫西·保罗·利利克拉普 ;
查尔斯·布伦代尔 .
英国专利 :CN118043824A ,2024-05-14
[8]
异步深度强化学习 [P]. 
沃洛季米尔·姆尼赫 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
亚历山大·本杰明·格拉韦斯 ;
蒂莫西·詹姆斯·亚历山大·哈莱 ;
大卫·西尔韦 ;
科拉伊·卡武克曲奥卢 .
中国专利 :CN114897156A ,2022-08-12
[9]
异步深度强化学习 [P]. 
沃洛季米尔·姆尼赫 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
亚历山大·本杰明·格拉韦斯 ;
蒂莫西·詹姆斯·亚历山大·哈莱 ;
大卫·西尔韦 ;
科拉伊·卡武克曲奥卢 .
中国专利 :CN108885717B ,2018-11-23
[10]
分布式机器人演示学习 [P]. 
B.V.S.R.K.科卢里 ;
S.沙尔 ;
B.M.戴维斯 ;
R.O.M.肖恩赫尔 ;
N.叶 .
中国专利 :CN115666871A ,2023-01-31