使用优势估计强化学习

被引:0
专利类型
发明
申请号
CN201780015574.8
申请日
2017-02-09
公开(公告)号
CN108701251B
公开(公告)日
2018-10-23
发明(设计)人
顾世翔 蒂莫西·保罗·利利克拉普 伊利亚·苏特思科韦尔 谢尔盖·弗拉迪米尔·莱文
申请人
申请人地址
美国加利福尼亚州
IPC主分类号
G06N304
IPC分类号
G06N308
代理机构
中原信达知识产权代理有限责任公司 11219
代理人
李佳;穆德骏
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
使用代理课程的强化学习 [P]. 
W.恰尔内茨基 ;
S.贾亚库马尔 .
中国专利 :CN112154458A ,2020-12-29
[2]
使用强化学习选择动作名单 [P]. 
彼得·戈兰·苏内哈格 .
中国专利 :CN108604314B ,2018-09-28
[3]
使用代理课程的强化学习 [P]. 
W.恰尔内茨基 ;
S.贾亚库马尔 .
英国专利 :CN112154458B ,2025-06-27
[4]
使用强化学习的环境导航 [P]. 
F.维奥拉 ;
P.W.米罗夫基 ;
A.巴尼诺 ;
R.帕斯卡努 ;
H.J.索耶 ;
A.J.巴拉德 ;
S.库马兰 ;
R.T.哈德塞尔 ;
L.西夫勒 ;
R.戈罗什恩 ;
K.卡夫克佐格卢 ;
M.M.R.德尼尔 .
中国专利 :CN110088774A ,2019-08-02
[5]
批量强化学习 [P]. 
D.哈夫纳 .
美国专利 :CN110753936B ,2024-10-29
[6]
批量强化学习 [P]. 
D.哈夫纳 .
中国专利 :CN110753936A ,2020-02-04
[7]
使用强化学习来选择内容项 [P]. 
本杰明·肯尼斯·科潘 ;
穆斯塔法·苏莱曼 ;
托马斯·查德威克·沃尔特斯 ;
蒂莫西·曼 ;
谢-月·卡尔顿·朱 ;
马丁·苏迈尔 ;
路易斯·卡洛斯·科博·鲁斯 ;
让-弗朗索瓦·克雷斯波 .
中国专利 :CN109643323A ,2019-04-16
[8]
检索增强强化学习 [P]. 
阿尼鲁德·戈亚尔 ;
安德烈亚·巴尼诺 ;
艾布拉姆·卢克·弗里森 ;
塞奥法尼·纪尧姆·韦伯 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
柯楠 ;
西蒙·奥辛德罗 ;
蒂莫西·保罗·利利克拉普 ;
查尔斯·布伦代尔 .
英国专利 :CN118043824A ,2024-05-14
[9]
异步深度强化学习 [P]. 
沃洛季米尔·姆尼赫 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
亚历山大·本杰明·格拉韦斯 ;
蒂莫西·詹姆斯·亚历山大·哈莱 ;
大卫·西尔韦 ;
科拉伊·卡武克曲奥卢 .
中国专利 :CN114897156A ,2022-08-12
[10]
异步深度强化学习 [P]. 
沃洛季米尔·姆尼赫 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
亚历山大·本杰明·格拉韦斯 ;
蒂莫西·詹姆斯·亚历山大·哈莱 ;
大卫·西尔韦 ;
科拉伊·卡武克曲奥卢 .
中国专利 :CN108885717B ,2018-11-23