中间强化学习目标的无监督的检测

被引:0
专利类型
发明
申请号
CN201780074215.X
申请日
2017-11-06
公开(公告)号
CN110168574A
公开(公告)日
2019-08-23
发明(设计)人
皮埃尔·塞马内
申请人
申请人地址
美国加利福尼亚州
IPC主分类号
G06N304
IPC分类号
G06N300 G06N308
代理机构
中原信达知识产权代理有限责任公司 11219
代理人
周亚荣;安翔
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
使用目标和观察来选择强化学习动作 [P]. 
汤姆·绍尔 ;
丹尼尔·乔治·霍根 ;
卡罗尔·格雷戈尔 ;
大卫·西尔韦 .
中国专利 :CN106056213B ,2016-10-26
[2]
具有强化学习的无监督文本概括 [P]. 
小比田凉介 ;
和地瞭良 .
中国专利 :CN115668171A ,2023-01-31
[3]
具有强化学习的无监督文本概括 [P]. 
小比田凉介 ;
和地瞭良 .
美国专利 :CN115668171B ,2025-08-01
[4]
利用辅助任务的强化学习 [P]. 
V.姆尼 ;
W.扎内基 ;
M.E.雅德伯格 ;
T.绍尔 ;
D.西尔弗 ;
K.卡乌库奥格卢 .
中国专利 :CN110114783A ,2019-08-09
[5]
使用强化学习的环境导航 [P]. 
F.维奥拉 ;
P.W.米罗夫基 ;
A.巴尼诺 ;
R.帕斯卡努 ;
H.J.索耶 ;
A.J.巴拉德 ;
S.库马兰 ;
R.T.哈德塞尔 ;
L.西夫勒 ;
R.戈罗什恩 ;
K.卡夫克佐格卢 ;
M.M.R.德尼尔 .
中国专利 :CN110088774A ,2019-08-02
[6]
用于无模型强化学习的堆叠的卷积长短期记忆 [P]. 
迈赫迪·米尔扎穆罕默迪 ;
亚瑟·克莱蒙特·格斯 ;
卡罗尔·格雷戈尔 ;
里沙巴·卡布拉 .
中国专利 :CN112313672A ,2021-02-02
[7]
用于无模型强化学习的堆叠的卷积长短期记忆 [P]. 
迈赫迪·米尔扎穆罕默迪 ;
亚瑟·克莱蒙特·格斯 ;
卡罗尔·格雷戈尔 ;
里沙巴·卡布拉 .
英国专利 :CN112313672B ,2024-09-13
[8]
利用深度强化学习的连续控制 [P]. 
蒂莫西·保罗·利利克拉普 ;
乔纳森·詹姆斯·亨特 ;
亚历山大·普里策尔 ;
尼古拉斯·曼弗雷德·奥托·黑斯 ;
汤姆·埃雷兹 ;
尤瓦尔·塔萨 ;
大卫·西尔韦 ;
丹尼尔·彼得·维尔斯特拉 .
英国专利 :CN114757333B ,2025-12-12
[9]
利用深度强化学习的连续控制 [P]. 
蒂莫西·保罗·利利克拉普 ;
乔纳森·詹姆斯·亨特 ;
亚历山大·普里策尔 ;
尼古拉斯·曼弗雷德·奥托·黑斯 ;
汤姆·埃雷兹 ;
尤瓦尔·塔萨 ;
大卫·西尔韦 ;
丹尼尔·彼得·维尔斯特拉 .
中国专利 :CN114757333A ,2022-07-15
[10]
利用深度强化学习的连续控制 [P]. 
蒂莫西·保罗·利利克拉普 ;
乔纳森·詹姆斯·亨特 ;
亚历山大·普里策尔 ;
尼古拉斯·曼弗雷德·奥托·黑斯 ;
汤姆·埃雷兹 ;
尤瓦尔·塔萨 ;
大卫·西尔韦 ;
丹尼尔·彼得·维尔斯特拉 .
中国专利 :CN108027897B ,2018-05-11