用于无模型强化学习的堆叠的卷积长短期记忆

被引:0
专利类型
发明
申请号
CN201980040637.4
申请日
2019-09-27
公开(公告)号
CN112313672A
公开(公告)日
2021-02-02
发明(设计)人
迈赫迪·米尔扎穆罕默迪 亚瑟·克莱蒙特·格斯 卡罗尔·格雷戈尔 里沙巴·卡布拉
申请人
申请人地址
英国伦敦
IPC主分类号
G06N300
IPC分类号
G06N304 G06N308 G06N700
代理机构
中原信达知识产权代理有限责任公司 11219
代理人
周亚荣;邓聪惠
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
用于无模型强化学习的堆叠的卷积长短期记忆 [P]. 
迈赫迪·米尔扎穆罕默迪 ;
亚瑟·克莱蒙特·格斯 ;
卡罗尔·格雷戈尔 ;
里沙巴·卡布拉 .
英国专利 :CN112313672B ,2024-09-13
[2]
具有正则化纳什动力学的无模型强化学习 [P]. 
朱利安·佩罗拉特 ;
巴特·德维尔德 ;
卡尔·保罗·图伊尔斯 .
英国专利 :CN119487528A ,2025-02-18
[3]
利用辅助任务的强化学习 [P]. 
V.姆尼 ;
W.扎内基 ;
M.E.雅德伯格 ;
T.绍尔 ;
D.西尔弗 ;
K.卡乌库奥格卢 .
中国专利 :CN110114783A ,2019-08-09
[4]
使用强化学习的环境导航 [P]. 
F.维奥拉 ;
P.W.米罗夫基 ;
A.巴尼诺 ;
R.帕斯卡努 ;
H.J.索耶 ;
A.J.巴拉德 ;
S.库马兰 ;
R.T.哈德塞尔 ;
L.西夫勒 ;
R.戈罗什恩 ;
K.卡夫克佐格卢 ;
M.M.R.德尼尔 .
中国专利 :CN110088774A ,2019-08-02
[5]
中间强化学习目标的无监督的检测 [P]. 
皮埃尔·塞马内 .
中国专利 :CN110168574A ,2019-08-23
[6]
基于长短期记忆网络强化学习的水下视频摘要生成方法 [P]. 
陈华杰 ;
张杰豪 ;
姚勤炜 ;
侯新雨 .
中国专利 :CN109213896A ,2019-01-15
[7]
用于执行推理任务的基于奖励模型的强化学习 [P]. 
伊琳娜·希金斯 ;
乔纳森·肯·尤萨托 ;
纳撒尼尔·亚瑟·库什曼 ;
拉马纳·库马尔 .
英国专利 :CN119998819A ,2025-05-13
[8]
用于计算图形的强化学习 [P]. 
A·斯坦顿 ;
A·马西耶维奇 ;
S·巴洛格 .
美国专利 :CN119183568A ,2024-12-24
[9]
使用神经网络的用于强化学习的动作选择 [P]. 
S.奥新德罗 ;
K.卡夫库格鲁 ;
A.维兹尼韦茨 .
中国专利 :CN110546653A ,2019-12-06
[10]
基于长短期记忆强化学习的PD-IoT设备故障检测方法及系统 [P]. 
郭志民 ;
王磊 ;
郭祥富 ;
杨挺 ;
毛万登 ;
袁少光 ;
刘昊 ;
田杨阳 ;
刘善峰 ;
李哲 ;
贺翔 ;
赵健 ;
陈岑 ;
刘亚闯 ;
马建伟 ;
魏小钊 ;
黄清江 ;
牛荣泽 ;
孙芊 ;
耿俊成 ;
万迪明 .
中国专利 :CN115629591A ,2023-01-20