批量强化学习

被引:0
专利类型
发明
申请号
CN201880038408.4
申请日
2018-08-24
公开(公告)号
CN110753936A
公开(公告)日
2020-02-04
发明(设计)人
D.哈夫纳
申请人
申请人地址
美国加利福尼亚州
IPC主分类号
G06N300
IPC分类号
G06N308 G06F950
代理机构
北京市柳沈律师事务所 11105
代理人
金玉洁
法律状态
实质审查的生效
国省代码
引用
下载
收藏
共 50 条
[1]
批量强化学习 [P]. 
D.哈夫纳 .
美国专利 :CN110753936B ,2024-10-29
[2]
利用辅助任务的强化学习 [P]. 
V.姆尼 ;
W.扎内基 ;
M.E.雅德伯格 ;
T.绍尔 ;
D.西尔弗 ;
K.卡乌库奥格卢 .
中国专利 :CN110114783A ,2019-08-09
[3]
大规模检索增强强化学习 [P]. 
彼得·康威·汉弗莱斯 ;
亚瑟·克莱蒙特·格斯 .
英国专利 :CN119213428A ,2024-12-27
[4]
使用强化学习的环境导航 [P]. 
F.维奥拉 ;
P.W.米罗夫基 ;
A.巴尼诺 ;
R.帕斯卡努 ;
H.J.索耶 ;
A.J.巴拉德 ;
S.库马兰 ;
R.T.哈德塞尔 ;
L.西夫勒 ;
R.戈罗什恩 ;
K.卡夫克佐格卢 ;
M.M.R.德尼尔 .
中国专利 :CN110088774A ,2019-08-02
[5]
检索增强强化学习 [P]. 
阿尼鲁德·戈亚尔 ;
安德烈亚·巴尼诺 ;
艾布拉姆·卢克·弗里森 ;
塞奥法尼·纪尧姆·韦伯 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
柯楠 ;
西蒙·奥辛德罗 ;
蒂莫西·保罗·利利克拉普 ;
查尔斯·布伦代尔 .
英国专利 :CN118043824A ,2024-05-14
[6]
异步深度强化学习 [P]. 
沃洛季米尔·姆尼赫 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
亚历山大·本杰明·格拉韦斯 ;
蒂莫西·詹姆斯·亚历山大·哈莱 ;
大卫·西尔韦 ;
科拉伊·卡武克曲奥卢 .
中国专利 :CN114897156A ,2022-08-12
[7]
异步深度强化学习 [P]. 
沃洛季米尔·姆尼赫 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
亚历山大·本杰明·格拉韦斯 ;
蒂莫西·詹姆斯·亚历山大·哈莱 ;
大卫·西尔韦 ;
科拉伊·卡武克曲奥卢 .
中国专利 :CN108885717B ,2018-11-23
[8]
训练强化学习神经网络 [P]. 
豪多·菲利普·范哈塞尔特 ;
亚瑟·克莱蒙特·格斯 .
中国专利 :CN107851216A ,2018-03-27
[9]
使用强化学习选择动作名单 [P]. 
彼得·戈兰·苏内哈格 .
中国专利 :CN108604314B ,2018-09-28
[10]
利用深度强化学习的连续控制 [P]. 
蒂莫西·保罗·利利克拉普 ;
乔纳森·詹姆斯·亨特 ;
亚历山大·普里策尔 ;
尼古拉斯·曼弗雷德·奥托·黑斯 ;
汤姆·埃雷兹 ;
尤瓦尔·塔萨 ;
大卫·西尔韦 ;
丹尼尔·彼得·维尔斯特拉 .
英国专利 :CN114757333B ,2025-12-12