利用深度强化学习的连续控制

被引:0
专利类型
发明
申请号
CN202210278695.4
申请日
2016-07-22
公开(公告)号
CN114757333B
公开(公告)日
2025-12-12
发明(设计)人
蒂莫西·保罗·利利克拉普 乔纳森·詹姆斯·亨特 亚历山大·普里策尔 尼古拉斯·曼弗雷德·奥托·黑斯 汤姆·埃雷兹 尤瓦尔·塔萨 大卫·西尔韦 丹尼尔·彼得·维尔斯特拉
申请人
渊慧科技有限公司
申请人地址
英国伦敦
IPC主分类号
G06N3/092
IPC分类号
G06N3/045 G06N3/10 G06N3/084
代理机构
中原信达知识产权代理有限责任公司 11219
代理人
周亚荣;邓聪惠
法律状态
专利申请权、专利权的转移
国省代码
引用
下载
收藏
共 50 条
[1]
利用深度强化学习的连续控制 [P]. 
蒂莫西·保罗·利利克拉普 ;
乔纳森·詹姆斯·亨特 ;
亚历山大·普里策尔 ;
尼古拉斯·曼弗雷德·奥托·黑斯 ;
汤姆·埃雷兹 ;
尤瓦尔·塔萨 ;
大卫·西尔韦 ;
丹尼尔·彼得·维尔斯特拉 .
中国专利 :CN114757333A ,2022-07-15
[2]
利用深度强化学习的连续控制 [P]. 
蒂莫西·保罗·利利克拉普 ;
乔纳森·詹姆斯·亨特 ;
亚历山大·普里策尔 ;
尼古拉斯·曼弗雷德·奥托·黑斯 ;
汤姆·埃雷兹 ;
尤瓦尔·塔萨 ;
大卫·西尔韦 ;
丹尼尔·彼得·维尔斯特拉 .
中国专利 :CN108027897B ,2018-05-11
[3]
异步深度强化学习 [P]. 
沃洛季米尔·姆尼赫 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
亚历山大·本杰明·格拉韦斯 ;
蒂莫西·詹姆斯·亚历山大·哈莱 ;
大卫·西尔韦 ;
科拉伊·卡武克曲奥卢 .
中国专利 :CN108885717B ,2018-11-23
[4]
异步深度强化学习 [P]. 
沃洛季米尔·姆尼赫 ;
阿德里亚·普伊赫多梅内奇·巴迪亚 ;
亚历山大·本杰明·格拉韦斯 ;
蒂莫西·詹姆斯·亚历山大·哈莱 ;
大卫·西尔韦 ;
科拉伊·卡武克曲奥卢 .
中国专利 :CN114897156A ,2022-08-12
[5]
利用辅助任务的强化学习 [P]. 
V.姆尼 ;
W.扎内基 ;
M.E.雅德伯格 ;
T.绍尔 ;
D.西尔弗 ;
K.卡乌库奥格卢 .
中国专利 :CN110114783A ,2019-08-09
[6]
用于连续控制任务的数据高效强化学习 [P]. 
M.里德米勒 ;
R.哈夫纳 ;
M.维切里克 ;
T.P.利利克拉普 ;
T.兰珀 ;
I.波波夫 ;
G.巴斯-马龙 ;
N.M.O.希斯 .
中国专利 :CN110383298A ,2019-10-25
[7]
用于连续控制任务的数据高效强化学习 [P]. 
M.里德米勒 ;
R.哈夫纳 ;
M.维切里克 ;
T.P.利利克拉普 ;
T.兰珀 ;
I.波波夫 ;
G.巴斯-马龙 ;
N.M.O.希斯 .
英国专利 :CN110383298B ,2024-08-06
[8]
用于连续控制任务的数据高效强化学习 [P]. 
M·里德米勒 ;
R·哈夫纳 ;
M·维切里克 ;
T·P·利利克拉普 ;
T·兰珀 ;
I·波波夫 ;
G·巴斯-马龙 ;
N·M·O·希斯 .
英国专利 :CN118780344A ,2024-10-15
[9]
使用深度强化学习的自动导航 [P]. 
考希克·巴拉科瑞斯南 ;
普拉韦恩·纳拉亚南 ;
莫森·莱克哈尔-阿亚特 .
中国专利 :CN110341700A ,2019-10-18
[10]
批量强化学习 [P]. 
D.哈夫纳 .
美国专利 :CN110753936B ,2024-10-29