一种强化学习训练方法及基于强化学习的决策方法

被引：0

专利类型：

发明

申请号：

CN202011451511.7

申请日：

2020-12-09

公开(公告)号：

CN112580801A

公开(公告)日：

2021-03-30

发明(设计)人：

刘震王闯周兴李华

申请人：

申请人地址：

511457 广东省广州市南沙区南沙街进港大道8号1107房

IPC主分类号：

G06N308

IPC分类号：

G06N304

代理机构：

北京三聚阳光知识产权代理有限公司 11250

代理人：

李红团

法律状态：

公开

国省代码：

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2021-03-30	公开	公开
2021-04-16	实质审查的生效	实质审查的生效 IPC(主分类):G06N 3/08 申请日:20201209
2021-10-15	授权	授权

共 50 条

[1]

强化学习系统及训练方法 [P].

彭宇劭 ;

汤凯富 ;

张智威 .

中国专利 :CN113392979A ,2021-09-14

[2]

强化学习系统及训练方法 [P].

彭宇劭 ;

汤凯富 ;

张智威 .

中国专利 :CN113392979B ,2024-08-16

[3]

强化学习模型训练方法及装置 [P].

韩旭东 ;

张锐 ;

李震 ;

沙剑 ;

赵军平 .

中国专利 :CN118350483A ,2024-07-16

[4]

强化学习模型的训练方法及装置 [P].

王芳 ;

暴宇健 .

中国专利 :CN117669650A ,2024-03-08

[5]

强化学习模型的训练方法及装置 [P].

王昊天 ;

应缜哲 ;

王维强 .

中国专利 :CN113011583B ,2021-06-22

[6]

强化学习模型训练方法、决策方法、装置、设备及介质 [P].

刘建林 ;

解鑫 ;

袁晓敏 ;

许铭 ;

刘颖 .

中国专利 :CN113962362A ,2022-01-21

[7]

一种动态强化学习决策训练系统 [P].

高放 ;

李明强 ;

陈思 ;

唐思琦 ;

黄彬城 .

中国专利 :CN111178545A ,2020-05-19

[8]

一种强化学习模型训练方法及装置 [P].

毛雪 ;

史鑫磊 ;

罗恒亮 .

中国专利 :CN115048991A ,2022-09-13

[9]

一种基于监督学习与强化学习的机动决策训练方法 [P].

刘波 ;

杨兴昊 ;

陈肇江 ;

刘泽一 ;

赵柳航 ;

王浩龙 .

中国专利 :CN118642358A ,2024-09-13

[10]

基于视觉强化学习的模型训练方法、装置、设备及介质 [P].

许浩然 ;

李论通 ;

彭佩玺 ;

夏灿铭 ;

常亦谦 ;

孙博 ;

谭光 ;

黎文博 ;

许芬 ;

田永鸿 .

中国专利 :CN120543954A ,2025-08-26

← 1 2 3 4 5 →