学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
使用优势估计强化学习
被引:0
专利类型
:
发明
申请号
:
CN201780015574.8
申请日
:
2017-02-09
公开(公告)号
:
CN108701251B
公开(公告)日
:
2018-10-23
发明(设计)人
:
顾世翔
蒂莫西·保罗·利利克拉普
伊利亚·苏特思科韦尔
谢尔盖·弗拉迪米尔·莱文
申请人
:
申请人地址
:
美国加利福尼亚州
IPC主分类号
:
G06N304
IPC分类号
:
G06N308
代理机构
:
中原信达知识产权代理有限责任公司 11219
代理人
:
李佳;穆德骏
法律状态
:
公开
国省代码
:
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2018-10-23
公开
公开
2018-11-16
实质审查的生效
实质审查的生效 IPC(主分类):G06N 3/04 申请日:20170209
2022-08-12
授权
授权
共 50 条
[1]
使用代理课程的强化学习
[P].
W.恰尔内茨基
论文数:
0
引用数:
0
h-index:
0
W.恰尔内茨基
;
S.贾亚库马尔
论文数:
0
引用数:
0
h-index:
0
S.贾亚库马尔
.
中国专利
:CN112154458A
,2020-12-29
[2]
使用强化学习选择动作名单
[P].
彼得·戈兰·苏内哈格
论文数:
0
引用数:
0
h-index:
0
彼得·戈兰·苏内哈格
.
中国专利
:CN108604314B
,2018-09-28
[3]
使用代理课程的强化学习
[P].
W.恰尔内茨基
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
W.恰尔内茨基
;
S.贾亚库马尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
S.贾亚库马尔
.
英国专利
:CN112154458B
,2025-06-27
[4]
使用强化学习的环境导航
[P].
F.维奥拉
论文数:
0
引用数:
0
h-index:
0
F.维奥拉
;
P.W.米罗夫基
论文数:
0
引用数:
0
h-index:
0
P.W.米罗夫基
;
A.巴尼诺
论文数:
0
引用数:
0
h-index:
0
A.巴尼诺
;
R.帕斯卡努
论文数:
0
引用数:
0
h-index:
0
R.帕斯卡努
;
H.J.索耶
论文数:
0
引用数:
0
h-index:
0
H.J.索耶
;
A.J.巴拉德
论文数:
0
引用数:
0
h-index:
0
A.J.巴拉德
;
S.库马兰
论文数:
0
引用数:
0
h-index:
0
S.库马兰
;
R.T.哈德塞尔
论文数:
0
引用数:
0
h-index:
0
R.T.哈德塞尔
;
L.西夫勒
论文数:
0
引用数:
0
h-index:
0
L.西夫勒
;
R.戈罗什恩
论文数:
0
引用数:
0
h-index:
0
R.戈罗什恩
;
K.卡夫克佐格卢
论文数:
0
引用数:
0
h-index:
0
K.卡夫克佐格卢
;
M.M.R.德尼尔
论文数:
0
引用数:
0
h-index:
0
M.M.R.德尼尔
.
中国专利
:CN110088774A
,2019-08-02
[5]
批量强化学习
[P].
D.哈夫纳
论文数:
0
引用数:
0
h-index:
0
机构:
谷歌有限责任公司
谷歌有限责任公司
D.哈夫纳
.
美国专利
:CN110753936B
,2024-10-29
[6]
批量强化学习
[P].
D.哈夫纳
论文数:
0
引用数:
0
h-index:
0
D.哈夫纳
.
中国专利
:CN110753936A
,2020-02-04
[7]
使用强化学习来选择内容项
[P].
本杰明·肯尼斯·科潘
论文数:
0
引用数:
0
h-index:
0
本杰明·肯尼斯·科潘
;
穆斯塔法·苏莱曼
论文数:
0
引用数:
0
h-index:
0
穆斯塔法·苏莱曼
;
托马斯·查德威克·沃尔特斯
论文数:
0
引用数:
0
h-index:
0
托马斯·查德威克·沃尔特斯
;
蒂莫西·曼
论文数:
0
引用数:
0
h-index:
0
蒂莫西·曼
;
谢-月·卡尔顿·朱
论文数:
0
引用数:
0
h-index:
0
谢-月·卡尔顿·朱
;
马丁·苏迈尔
论文数:
0
引用数:
0
h-index:
0
马丁·苏迈尔
;
路易斯·卡洛斯·科博·鲁斯
论文数:
0
引用数:
0
h-index:
0
路易斯·卡洛斯·科博·鲁斯
;
让-弗朗索瓦·克雷斯波
论文数:
0
引用数:
0
h-index:
0
让-弗朗索瓦·克雷斯波
.
中国专利
:CN109643323A
,2019-04-16
[8]
检索增强强化学习
[P].
阿尼鲁德·戈亚尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
阿尼鲁德·戈亚尔
;
安德烈亚·巴尼诺
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
安德烈亚·巴尼诺
;
艾布拉姆·卢克·弗里森
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
艾布拉姆·卢克·弗里森
;
塞奥法尼·纪尧姆·韦伯
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
塞奥法尼·纪尧姆·韦伯
;
阿德里亚·普伊赫多梅内奇·巴迪亚
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
阿德里亚·普伊赫多梅内奇·巴迪亚
;
柯楠
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
柯楠
;
西蒙·奥辛德罗
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
西蒙·奥辛德罗
;
蒂莫西·保罗·利利克拉普
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
蒂莫西·保罗·利利克拉普
;
查尔斯·布伦代尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
查尔斯·布伦代尔
.
英国专利
:CN118043824A
,2024-05-14
[9]
异步深度强化学习
[P].
沃洛季米尔·姆尼赫
论文数:
0
引用数:
0
h-index:
0
沃洛季米尔·姆尼赫
;
阿德里亚·普伊赫多梅内奇·巴迪亚
论文数:
0
引用数:
0
h-index:
0
阿德里亚·普伊赫多梅内奇·巴迪亚
;
亚历山大·本杰明·格拉韦斯
论文数:
0
引用数:
0
h-index:
0
亚历山大·本杰明·格拉韦斯
;
蒂莫西·詹姆斯·亚历山大·哈莱
论文数:
0
引用数:
0
h-index:
0
蒂莫西·詹姆斯·亚历山大·哈莱
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
;
科拉伊·卡武克曲奥卢
论文数:
0
引用数:
0
h-index:
0
科拉伊·卡武克曲奥卢
.
中国专利
:CN114897156A
,2022-08-12
[10]
异步深度强化学习
[P].
沃洛季米尔·姆尼赫
论文数:
0
引用数:
0
h-index:
0
沃洛季米尔·姆尼赫
;
阿德里亚·普伊赫多梅内奇·巴迪亚
论文数:
0
引用数:
0
h-index:
0
阿德里亚·普伊赫多梅内奇·巴迪亚
;
亚历山大·本杰明·格拉韦斯
论文数:
0
引用数:
0
h-index:
0
亚历山大·本杰明·格拉韦斯
;
蒂莫西·詹姆斯·亚历山大·哈莱
论文数:
0
引用数:
0
h-index:
0
蒂莫西·詹姆斯·亚历山大·哈莱
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
;
科拉伊·卡武克曲奥卢
论文数:
0
引用数:
0
h-index:
0
科拉伊·卡武克曲奥卢
.
中国专利
:CN108885717B
,2018-11-23
←
1
2
3
4
5
→