学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
利用深度强化学习的连续控制
被引:0
申请号
:
CN202210278695.4
申请日
:
2016-07-22
公开(公告)号
:
CN114757333A
公开(公告)日
:
2022-07-15
发明(设计)人
:
蒂莫西·保罗·利利克拉普
乔纳森·詹姆斯·亨特
亚历山大·普里策尔
尼古拉斯·曼弗雷德·奥托·黑斯
汤姆·埃雷兹
尤瓦尔·塔萨
大卫·西尔韦
丹尼尔·彼得·维尔斯特拉
申请人
:
申请人地址
:
英国伦敦
IPC主分类号
:
G06N304
IPC分类号
:
G06N308
G06N300
代理机构
:
中原信达知识产权代理有限责任公司 11219
代理人
:
周亚荣;邓聪惠
法律状态
:
公开
国省代码
:
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2022-07-15
公开
公开
2022-08-02
实质审查的生效
实质审查的生效 IPC(主分类):G06N 3/04 申请日:20160722
共 50 条
[1]
利用深度强化学习的连续控制
[P].
蒂莫西·保罗·利利克拉普
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
蒂莫西·保罗·利利克拉普
;
乔纳森·詹姆斯·亨特
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
乔纳森·詹姆斯·亨特
;
亚历山大·普里策尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
亚历山大·普里策尔
;
尼古拉斯·曼弗雷德·奥托·黑斯
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
尼古拉斯·曼弗雷德·奥托·黑斯
;
汤姆·埃雷兹
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
汤姆·埃雷兹
;
尤瓦尔·塔萨
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
尤瓦尔·塔萨
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
大卫·西尔韦
;
丹尼尔·彼得·维尔斯特拉
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
丹尼尔·彼得·维尔斯特拉
.
英国专利
:CN114757333B
,2025-12-12
[2]
利用深度强化学习的连续控制
[P].
蒂莫西·保罗·利利克拉普
论文数:
0
引用数:
0
h-index:
0
蒂莫西·保罗·利利克拉普
;
乔纳森·詹姆斯·亨特
论文数:
0
引用数:
0
h-index:
0
乔纳森·詹姆斯·亨特
;
亚历山大·普里策尔
论文数:
0
引用数:
0
h-index:
0
亚历山大·普里策尔
;
尼古拉斯·曼弗雷德·奥托·黑斯
论文数:
0
引用数:
0
h-index:
0
尼古拉斯·曼弗雷德·奥托·黑斯
;
汤姆·埃雷兹
论文数:
0
引用数:
0
h-index:
0
汤姆·埃雷兹
;
尤瓦尔·塔萨
论文数:
0
引用数:
0
h-index:
0
尤瓦尔·塔萨
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
;
丹尼尔·彼得·维尔斯特拉
论文数:
0
引用数:
0
h-index:
0
丹尼尔·彼得·维尔斯特拉
.
中国专利
:CN108027897B
,2018-05-11
[3]
异步深度强化学习
[P].
沃洛季米尔·姆尼赫
论文数:
0
引用数:
0
h-index:
0
沃洛季米尔·姆尼赫
;
阿德里亚·普伊赫多梅内奇·巴迪亚
论文数:
0
引用数:
0
h-index:
0
阿德里亚·普伊赫多梅内奇·巴迪亚
;
亚历山大·本杰明·格拉韦斯
论文数:
0
引用数:
0
h-index:
0
亚历山大·本杰明·格拉韦斯
;
蒂莫西·詹姆斯·亚历山大·哈莱
论文数:
0
引用数:
0
h-index:
0
蒂莫西·詹姆斯·亚历山大·哈莱
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
;
科拉伊·卡武克曲奥卢
论文数:
0
引用数:
0
h-index:
0
科拉伊·卡武克曲奥卢
.
中国专利
:CN108885717B
,2018-11-23
[4]
异步深度强化学习
[P].
沃洛季米尔·姆尼赫
论文数:
0
引用数:
0
h-index:
0
沃洛季米尔·姆尼赫
;
阿德里亚·普伊赫多梅内奇·巴迪亚
论文数:
0
引用数:
0
h-index:
0
阿德里亚·普伊赫多梅内奇·巴迪亚
;
亚历山大·本杰明·格拉韦斯
论文数:
0
引用数:
0
h-index:
0
亚历山大·本杰明·格拉韦斯
;
蒂莫西·詹姆斯·亚历山大·哈莱
论文数:
0
引用数:
0
h-index:
0
蒂莫西·詹姆斯·亚历山大·哈莱
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
;
科拉伊·卡武克曲奥卢
论文数:
0
引用数:
0
h-index:
0
科拉伊·卡武克曲奥卢
.
中国专利
:CN114897156A
,2022-08-12
[5]
利用辅助任务的强化学习
[P].
V.姆尼
论文数:
0
引用数:
0
h-index:
0
V.姆尼
;
W.扎内基
论文数:
0
引用数:
0
h-index:
0
W.扎内基
;
M.E.雅德伯格
论文数:
0
引用数:
0
h-index:
0
M.E.雅德伯格
;
T.绍尔
论文数:
0
引用数:
0
h-index:
0
T.绍尔
;
D.西尔弗
论文数:
0
引用数:
0
h-index:
0
D.西尔弗
;
K.卡乌库奥格卢
论文数:
0
引用数:
0
h-index:
0
K.卡乌库奥格卢
.
中国专利
:CN110114783A
,2019-08-09
[6]
用于连续控制任务的数据高效强化学习
[P].
M.里德米勒
论文数:
0
引用数:
0
h-index:
0
M.里德米勒
;
R.哈夫纳
论文数:
0
引用数:
0
h-index:
0
R.哈夫纳
;
M.维切里克
论文数:
0
引用数:
0
h-index:
0
M.维切里克
;
T.P.利利克拉普
论文数:
0
引用数:
0
h-index:
0
T.P.利利克拉普
;
T.兰珀
论文数:
0
引用数:
0
h-index:
0
T.兰珀
;
I.波波夫
论文数:
0
引用数:
0
h-index:
0
I.波波夫
;
G.巴斯-马龙
论文数:
0
引用数:
0
h-index:
0
G.巴斯-马龙
;
N.M.O.希斯
论文数:
0
引用数:
0
h-index:
0
N.M.O.希斯
.
中国专利
:CN110383298A
,2019-10-25
[7]
用于连续控制任务的数据高效强化学习
[P].
M.里德米勒
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
M.里德米勒
;
R.哈夫纳
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
R.哈夫纳
;
M.维切里克
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
M.维切里克
;
T.P.利利克拉普
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
T.P.利利克拉普
;
T.兰珀
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
T.兰珀
;
I.波波夫
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
I.波波夫
;
G.巴斯-马龙
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
G.巴斯-马龙
;
N.M.O.希斯
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
N.M.O.希斯
.
英国专利
:CN110383298B
,2024-08-06
[8]
用于连续控制任务的数据高效强化学习
[P].
M·里德米勒
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
M·里德米勒
;
R·哈夫纳
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
R·哈夫纳
;
M·维切里克
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
M·维切里克
;
T·P·利利克拉普
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
T·P·利利克拉普
;
T·兰珀
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
T·兰珀
;
I·波波夫
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
I·波波夫
;
G·巴斯-马龙
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
G·巴斯-马龙
;
N·M·O·希斯
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
N·M·O·希斯
.
英国专利
:CN118780344A
,2024-10-15
[9]
使用深度强化学习的自动导航
[P].
考希克·巴拉科瑞斯南
论文数:
0
引用数:
0
h-index:
0
考希克·巴拉科瑞斯南
;
普拉韦恩·纳拉亚南
论文数:
0
引用数:
0
h-index:
0
普拉韦恩·纳拉亚南
;
莫森·莱克哈尔-阿亚特
论文数:
0
引用数:
0
h-index:
0
莫森·莱克哈尔-阿亚特
.
中国专利
:CN110341700A
,2019-10-18
[10]
批量强化学习
[P].
D.哈夫纳
论文数:
0
引用数:
0
h-index:
0
机构:
谷歌有限责任公司
谷歌有限责任公司
D.哈夫纳
.
美国专利
:CN110753936B
,2024-10-29
←
1
2
3
4
5
→