具有正则化纳什动力学的无模型强化学习

被引:0
专利类型
发明
申请号
CN202380050131.8
申请日
2023-06-27
公开(公告)号
CN119487528A
公开(公告)日
2025-02-18
发明(设计)人
朱利安·佩罗拉特 巴特·德维尔德 卡尔·保罗·图伊尔斯
申请人
渊慧科技有限公司
申请人地址
英国
IPC主分类号
G06N3/092
IPC分类号
G06N3/045
代理机构
中原信达知识产权代理有限责任公司 11219
代理人
周亚荣;李宝泉
法律状态
实质审查的生效
国省代码
引用
下载
收藏
共 50 条
[1]
用于无模型强化学习的堆叠的卷积长短期记忆 [P]. 
迈赫迪·米尔扎穆罕默迪 ;
亚瑟·克莱蒙特·格斯 ;
卡罗尔·格雷戈尔 ;
里沙巴·卡布拉 .
中国专利 :CN112313672A ,2021-02-02
[2]
用于无模型强化学习的堆叠的卷积长短期记忆 [P]. 
迈赫迪·米尔扎穆罕默迪 ;
亚瑟·克莱蒙特·格斯 ;
卡罗尔·格雷戈尔 ;
里沙巴·卡布拉 .
英国专利 :CN112313672B ,2024-09-13
[3]
系统动力学全局稳定建模的动力学模型 [P]. 
G·马内克 ;
J·Z·科特勒 ;
J·维诺格拉德斯卡 .
中国专利 :CN112327612A ,2021-02-05
[4]
系统动力学全局稳定建模的动力学模型 [P]. 
G·马内克 ;
J·Z·科特勒 ;
J·维诺格拉德斯卡 .
德国专利 :CN112327612B ,2025-11-25
[5]
中间强化学习目标的无监督的检测 [P]. 
皮埃尔·塞马内 .
中国专利 :CN110168574A ,2019-08-23
[6]
面向深度强化学习的飞行动力学模型可信度评估方法 [P]. 
黄聪会 ;
王超哲 ;
柴世杰 ;
李韬锐 ;
贾林通 ;
黄鹤松 ;
李慎波 ;
童奇 ;
王彪 .
中国专利 :CN114329766A ,2022-04-12
[7]
齿轮多体动力学约束的强化学习补偿方法及系统 [P]. 
张玲艳 ;
邱水才 ;
赵喜浩 ;
陈瑜 ;
吕高阳 ;
曹群宜 .
中国专利 :CN120745471B ,2025-10-31
[8]
齿轮多体动力学约束的强化学习补偿方法及系统 [P]. 
张玲艳 ;
邱水才 ;
赵喜浩 ;
陈瑜 ;
吕高阳 ;
曹群宜 .
中国专利 :CN120745471A ,2025-10-03
[9]
芳烃氧化反应的动力学模型建模方法及动力学模型 [P]. 
崔国刚 ;
王新兰 ;
李红坤 ;
王小丰 ;
李利军 ;
杨艺 ;
孙伟振 ;
赵玲 .
中国专利 :CN113053463A ,2021-06-29
[10]
使用分布式优先化回放的强化学习 [P]. 
D.巴登 ;
G.巴特马伦 ;
J.全 ;
D.G.霍根 .
中国专利 :CN111316295A ,2020-06-19