学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
中间强化学习目标的无监督的检测
被引:0
专利类型
:
发明
申请号
:
CN201780074215.X
申请日
:
2017-11-06
公开(公告)号
:
CN110168574A
公开(公告)日
:
2019-08-23
发明(设计)人
:
皮埃尔·塞马内
申请人
:
申请人地址
:
美国加利福尼亚州
IPC主分类号
:
G06N304
IPC分类号
:
G06N300
G06N308
代理机构
:
中原信达知识产权代理有限责任公司 11219
代理人
:
周亚荣;安翔
法律状态
:
公开
国省代码
:
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2019-08-23
公开
公开
2019-09-17
实质审查的生效
实质审查的生效 IPC(主分类):G06N 3/04 申请日:20171106
共 50 条
[1]
使用目标和观察来选择强化学习动作
[P].
汤姆·绍尔
论文数:
0
引用数:
0
h-index:
0
汤姆·绍尔
;
丹尼尔·乔治·霍根
论文数:
0
引用数:
0
h-index:
0
丹尼尔·乔治·霍根
;
卡罗尔·格雷戈尔
论文数:
0
引用数:
0
h-index:
0
卡罗尔·格雷戈尔
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
.
中国专利
:CN106056213B
,2016-10-26
[2]
具有强化学习的无监督文本概括
[P].
小比田凉介
论文数:
0
引用数:
0
h-index:
0
小比田凉介
;
和地瞭良
论文数:
0
引用数:
0
h-index:
0
和地瞭良
.
中国专利
:CN115668171A
,2023-01-31
[3]
具有强化学习的无监督文本概括
[P].
小比田凉介
论文数:
0
引用数:
0
h-index:
0
机构:
国际商业机器公司
国际商业机器公司
小比田凉介
;
和地瞭良
论文数:
0
引用数:
0
h-index:
0
机构:
国际商业机器公司
国际商业机器公司
和地瞭良
.
美国专利
:CN115668171B
,2025-08-01
[4]
利用辅助任务的强化学习
[P].
V.姆尼
论文数:
0
引用数:
0
h-index:
0
V.姆尼
;
W.扎内基
论文数:
0
引用数:
0
h-index:
0
W.扎内基
;
M.E.雅德伯格
论文数:
0
引用数:
0
h-index:
0
M.E.雅德伯格
;
T.绍尔
论文数:
0
引用数:
0
h-index:
0
T.绍尔
;
D.西尔弗
论文数:
0
引用数:
0
h-index:
0
D.西尔弗
;
K.卡乌库奥格卢
论文数:
0
引用数:
0
h-index:
0
K.卡乌库奥格卢
.
中国专利
:CN110114783A
,2019-08-09
[5]
使用强化学习的环境导航
[P].
F.维奥拉
论文数:
0
引用数:
0
h-index:
0
F.维奥拉
;
P.W.米罗夫基
论文数:
0
引用数:
0
h-index:
0
P.W.米罗夫基
;
A.巴尼诺
论文数:
0
引用数:
0
h-index:
0
A.巴尼诺
;
R.帕斯卡努
论文数:
0
引用数:
0
h-index:
0
R.帕斯卡努
;
H.J.索耶
论文数:
0
引用数:
0
h-index:
0
H.J.索耶
;
A.J.巴拉德
论文数:
0
引用数:
0
h-index:
0
A.J.巴拉德
;
S.库马兰
论文数:
0
引用数:
0
h-index:
0
S.库马兰
;
R.T.哈德塞尔
论文数:
0
引用数:
0
h-index:
0
R.T.哈德塞尔
;
L.西夫勒
论文数:
0
引用数:
0
h-index:
0
L.西夫勒
;
R.戈罗什恩
论文数:
0
引用数:
0
h-index:
0
R.戈罗什恩
;
K.卡夫克佐格卢
论文数:
0
引用数:
0
h-index:
0
K.卡夫克佐格卢
;
M.M.R.德尼尔
论文数:
0
引用数:
0
h-index:
0
M.M.R.德尼尔
.
中国专利
:CN110088774A
,2019-08-02
[6]
用于无模型强化学习的堆叠的卷积长短期记忆
[P].
迈赫迪·米尔扎穆罕默迪
论文数:
0
引用数:
0
h-index:
0
迈赫迪·米尔扎穆罕默迪
;
亚瑟·克莱蒙特·格斯
论文数:
0
引用数:
0
h-index:
0
亚瑟·克莱蒙特·格斯
;
卡罗尔·格雷戈尔
论文数:
0
引用数:
0
h-index:
0
卡罗尔·格雷戈尔
;
里沙巴·卡布拉
论文数:
0
引用数:
0
h-index:
0
里沙巴·卡布拉
.
中国专利
:CN112313672A
,2021-02-02
[7]
用于无模型强化学习的堆叠的卷积长短期记忆
[P].
迈赫迪·米尔扎穆罕默迪
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
迈赫迪·米尔扎穆罕默迪
;
亚瑟·克莱蒙特·格斯
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
亚瑟·克莱蒙特·格斯
;
卡罗尔·格雷戈尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
卡罗尔·格雷戈尔
;
里沙巴·卡布拉
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
里沙巴·卡布拉
.
英国专利
:CN112313672B
,2024-09-13
[8]
利用深度强化学习的连续控制
[P].
蒂莫西·保罗·利利克拉普
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
蒂莫西·保罗·利利克拉普
;
乔纳森·詹姆斯·亨特
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
乔纳森·詹姆斯·亨特
;
亚历山大·普里策尔
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
亚历山大·普里策尔
;
尼古拉斯·曼弗雷德·奥托·黑斯
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
尼古拉斯·曼弗雷德·奥托·黑斯
;
汤姆·埃雷兹
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
汤姆·埃雷兹
;
尤瓦尔·塔萨
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
尤瓦尔·塔萨
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
大卫·西尔韦
;
丹尼尔·彼得·维尔斯特拉
论文数:
0
引用数:
0
h-index:
0
机构:
渊慧科技有限公司
渊慧科技有限公司
丹尼尔·彼得·维尔斯特拉
.
英国专利
:CN114757333B
,2025-12-12
[9]
利用深度强化学习的连续控制
[P].
蒂莫西·保罗·利利克拉普
论文数:
0
引用数:
0
h-index:
0
蒂莫西·保罗·利利克拉普
;
乔纳森·詹姆斯·亨特
论文数:
0
引用数:
0
h-index:
0
乔纳森·詹姆斯·亨特
;
亚历山大·普里策尔
论文数:
0
引用数:
0
h-index:
0
亚历山大·普里策尔
;
尼古拉斯·曼弗雷德·奥托·黑斯
论文数:
0
引用数:
0
h-index:
0
尼古拉斯·曼弗雷德·奥托·黑斯
;
汤姆·埃雷兹
论文数:
0
引用数:
0
h-index:
0
汤姆·埃雷兹
;
尤瓦尔·塔萨
论文数:
0
引用数:
0
h-index:
0
尤瓦尔·塔萨
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
;
丹尼尔·彼得·维尔斯特拉
论文数:
0
引用数:
0
h-index:
0
丹尼尔·彼得·维尔斯特拉
.
中国专利
:CN114757333A
,2022-07-15
[10]
利用深度强化学习的连续控制
[P].
蒂莫西·保罗·利利克拉普
论文数:
0
引用数:
0
h-index:
0
蒂莫西·保罗·利利克拉普
;
乔纳森·詹姆斯·亨特
论文数:
0
引用数:
0
h-index:
0
乔纳森·詹姆斯·亨特
;
亚历山大·普里策尔
论文数:
0
引用数:
0
h-index:
0
亚历山大·普里策尔
;
尼古拉斯·曼弗雷德·奥托·黑斯
论文数:
0
引用数:
0
h-index:
0
尼古拉斯·曼弗雷德·奥托·黑斯
;
汤姆·埃雷兹
论文数:
0
引用数:
0
h-index:
0
汤姆·埃雷兹
;
尤瓦尔·塔萨
论文数:
0
引用数:
0
h-index:
0
尤瓦尔·塔萨
;
大卫·西尔韦
论文数:
0
引用数:
0
h-index:
0
大卫·西尔韦
;
丹尼尔·彼得·维尔斯特拉
论文数:
0
引用数:
0
h-index:
0
丹尼尔·彼得·维尔斯特拉
.
中国专利
:CN108027897B
,2018-05-11
←
1
2
3
4
5
→