一种强化学习训练方法及基于强化学习的决策方法

被引:0
专利类型
发明
申请号
CN202011451511.7
申请日
2020-12-09
公开(公告)号
CN112580801A
公开(公告)日
2021-03-30
发明(设计)人
刘震 王闯 周兴 李华
申请人
申请人地址
511457 广东省广州市南沙区南沙街进港大道8号1107房
IPC主分类号
G06N308
IPC分类号
G06N304
代理机构
北京三聚阳光知识产权代理有限公司 11250
代理人
李红团
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
强化学习系统及训练方法 [P]. 
彭宇劭 ;
汤凯富 ;
张智威 .
中国专利 :CN113392979A ,2021-09-14
[2]
强化学习系统及训练方法 [P]. 
彭宇劭 ;
汤凯富 ;
张智威 .
中国专利 :CN113392979B ,2024-08-16
[3]
强化学习模型训练方法及装置 [P]. 
韩旭东 ;
张锐 ;
李震 ;
沙剑 ;
赵军平 .
中国专利 :CN118350483A ,2024-07-16
[4]
强化学习模型的训练方法及装置 [P]. 
王芳 ;
暴宇健 .
中国专利 :CN117669650A ,2024-03-08
[5]
强化学习模型的训练方法及装置 [P]. 
王昊天 ;
应缜哲 ;
王维强 .
中国专利 :CN113011583B ,2021-06-22
[6]
强化学习模型训练方法、决策方法、装置、设备及介质 [P]. 
刘建林 ;
解鑫 ;
袁晓敏 ;
许铭 ;
刘颖 .
中国专利 :CN113962362A ,2022-01-21
[7]
一种动态强化学习决策训练系统 [P]. 
高放 ;
李明强 ;
陈思 ;
唐思琦 ;
黄彬城 .
中国专利 :CN111178545A ,2020-05-19
[8]
一种强化学习模型训练方法及装置 [P]. 
毛雪 ;
史鑫磊 ;
罗恒亮 .
中国专利 :CN115048991A ,2022-09-13
[9]
一种基于监督学习与强化学习的机动决策训练方法 [P]. 
刘波 ;
杨兴昊 ;
陈肇江 ;
刘泽一 ;
赵柳航 ;
王浩龙 .
中国专利 :CN118642358A ,2024-09-13
[10]
基于视觉强化学习的模型训练方法、装置、设备及介质 [P]. 
许浩然 ;
李论通 ;
彭佩玺 ;
夏灿铭 ;
常亦谦 ;
孙博 ;
谭光 ;
黎文博 ;
许芬 ;
田永鸿 .
中国专利 :CN120543954A ,2025-08-26