学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
分布式强化学习
被引:0
专利类型
:
发明
申请号
:
CN201880025072.8
申请日
:
2018-04-16
公开(公告)号
:
CN110520868A
公开(公告)日
:
2019-11-29
发明(设计)人
:
W.C.达布尼
M.金德罗-贝尔-梅尔
申请人
:
申请人地址
:
英国伦敦
IPC主分类号
:
G06N300
IPC分类号
:
G06N304
G06N308
代理机构
:
北京市柳沈律师事务所 11105
代理人
:
金玉洁
法律状态
:
公开
国省代码
:
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2019-11-29
公开
公开
2019-12-24
实质审查的生效
实质审查的生效 IPC(主分类):G06N 3/00 申请日:20180416
共 50 条
[1]
用于分布式强化学习的方法、程序产品和存储介质
[P].
W·C·达布尼
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
W·C·达布尼
;
M·金德罗-贝尔-梅尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
M·金德罗-贝尔-梅尔
.
英国专利
:CN116776964B
,2025-11-25
[2]
使用分布式优先化回放的强化学习
[P].
D.巴登
论文数:
0
引用数:
0
h-index:
0
D.巴登
;
G.巴特马伦
论文数:
0
引用数:
0
h-index:
0
G.巴特马伦
;
J.全
论文数:
0
引用数:
0
h-index:
0
J.全
;
D.G.霍根
论文数:
0
引用数:
0
h-index:
0
D.G.霍根
.
中国专利
:CN111316295A
,2020-06-19
[3]
使用异策略行动者-评价者强化学习进行分布式训练
[P].
H·J·索耶
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
H·J·索耶
;
L·埃思佩霍尔特
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
L·埃思佩霍尔特
;
K·西蒙扬
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
K·西蒙扬
;
Y·多伦
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
Y·多伦
;
V·菲罗伊
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
V·菲罗伊
;
V·米尼
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
V·米尼
;
K·卡沃克库格鲁
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
K·卡沃克库格鲁
;
R·穆诺斯
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
R·穆诺斯
;
T·沃德
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
T·沃德
;
T·J·A·哈利
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
T·J·A·哈利
;
I·杜宁
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
I·杜宁
.
英国专利
:CN118211640A
,2024-06-18
[4]
使用异策略行动者-评价者强化学习进行分布式训练
[P].
H.J.索耶
论文数:
0
引用数:
0
h-index:
0
H.J.索耶
;
L.埃思佩霍尔特
论文数:
0
引用数:
0
h-index:
0
L.埃思佩霍尔特
;
K.西蒙扬
论文数:
0
引用数:
0
h-index:
0
K.西蒙扬
;
Y.多伦
论文数:
0
引用数:
0
h-index:
0
Y.多伦
;
V.菲罗伊
论文数:
0
引用数:
0
h-index:
0
V.菲罗伊
;
V.米尼
论文数:
0
引用数:
0
h-index:
0
V.米尼
;
K.卡沃克库格鲁
论文数:
0
引用数:
0
h-index:
0
K.卡沃克库格鲁
;
R.穆诺斯
论文数:
0
引用数:
0
h-index:
0
R.穆诺斯
;
T.沃德
论文数:
0
引用数:
0
h-index:
0
T.沃德
;
T.J.A.哈利
论文数:
0
引用数:
0
h-index:
0
T.J.A.哈利
;
I.杜宁
论文数:
0
引用数:
0
h-index:
0
I.杜宁
.
中国专利
:CN111417964A
,2020-07-14
[5]
批量强化学习
[P].
D.哈夫纳
论文数:
0
引用数:
0
h-index:
0
机构:
谷歌有限责任公司
谷歌有限责任公司
D.哈夫纳
.
美国专利
:CN110753936B
,2024-10-29
[6]
批量强化学习
[P].
D.哈夫纳
论文数:
0
引用数:
0
h-index:
0
D.哈夫纳
.
中国专利
:CN110753936A
,2020-02-04
[7]
检索增强强化学习
[P].
阿尼鲁德·戈亚尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
阿尼鲁德·戈亚尔
;
安德烈亚·巴尼诺
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
安德烈亚·巴尼诺
;
艾布拉姆·卢克·弗里森
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
艾布拉姆·卢克·弗里森
;
塞奥法尼·纪尧姆·韦伯
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
塞奥法尼·纪尧姆·韦伯
;
阿德里亚·普伊赫多梅内奇·巴迪亚
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
阿德里亚·普伊赫多梅内奇·巴迪亚
;
柯楠
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
柯楠
;
西蒙·奥辛德罗
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
西蒙·奥辛德罗
;
蒂莫西·保罗·利利克拉普
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
蒂莫西·保罗·利利克拉普
;
查尔斯·布伦代尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
查尔斯·布伦代尔
.
英国专利
:CN118043824A
,2024-05-14
[8]
异步深度强化学习
[P].
沃洛季米尔·姆尼赫
论文数:
0
引用数:
0
h-index:
0
沃洛季米尔·姆尼赫
;
阿德里亚·普伊赫多梅内奇·巴迪亚
论文数:
0
引用数:
0
h-index:
0
阿德里亚·普伊赫多梅内奇·巴迪亚
;
亚历山大·本杰明·格拉韦斯
论文数:
0
引用数:
0
h-index:
0
亚历山大·本杰明·格拉韦斯
;
蒂莫西·詹姆斯·亚历山大·哈莱
论文数:
0
引用数:
0
h-index:
0
蒂莫西·詹姆斯·亚历山大·哈莱
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
;
科拉伊·卡武克曲奥卢
论文数:
0
引用数:
0
h-index:
0
科拉伊·卡武克曲奥卢
.
中国专利
:CN114897156A
,2022-08-12
[9]
异步深度强化学习
[P].
沃洛季米尔·姆尼赫
论文数:
0
引用数:
0
h-index:
0
沃洛季米尔·姆尼赫
;
阿德里亚·普伊赫多梅内奇·巴迪亚
论文数:
0
引用数:
0
h-index:
0
阿德里亚·普伊赫多梅内奇·巴迪亚
;
亚历山大·本杰明·格拉韦斯
论文数:
0
引用数:
0
h-index:
0
亚历山大·本杰明·格拉韦斯
;
蒂莫西·詹姆斯·亚历山大·哈莱
论文数:
0
引用数:
0
h-index:
0
蒂莫西·詹姆斯·亚历山大·哈莱
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
;
科拉伊·卡武克曲奥卢
论文数:
0
引用数:
0
h-index:
0
科拉伊·卡武克曲奥卢
.
中国专利
:CN108885717B
,2018-11-23
[10]
分布式机器人演示学习
[P].
B.V.S.R.K.科卢里
论文数:
0
引用数:
0
h-index:
0
B.V.S.R.K.科卢里
;
S.沙尔
论文数:
0
引用数:
0
h-index:
0
S.沙尔
;
B.M.戴维斯
论文数:
0
引用数:
0
h-index:
0
B.M.戴维斯
;
R.O.M.肖恩赫尔
论文数:
0
引用数:
0
h-index:
0
R.O.M.肖恩赫尔
;
N.叶
论文数:
0
引用数:
0
h-index:
0
N.叶
.
中国专利
:CN115666871A
,2023-01-31
←
1
2
3
4
5
→