一种动态强化学习决策训练系统

被引：0

专利类型：

发明

申请号：

CN201911412353.1

申请日：

2019-12-31

公开(公告)号：

CN111178545A

公开(公告)日：

2020-05-19

发明(设计)人：

高放李明强陈思唐思琦黄彬城

申请人：

申请人地址：

100086 北京市海淀区四道口北街36号院4号楼

IPC主分类号：

G06N2000

IPC分类号：

代理机构：

北京中知法苑知识产权代理有限公司 11226

代理人：

李明;赵吉阳

法律状态：

公开

国省代码：

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2020-05-19	公开	公开
2020-06-12	实质审查的生效	实质审查的生效 IPC(主分类):G06N 20/00 申请日:20191231

共 50 条

[1]

一种强化学习训练方法及基于强化学习的决策方法 [P].

刘震 ;

王闯 ;

周兴 ;

李华 .

中国专利 :CN112580801A ,2021-03-30

[2]

一种序贯决策强化学习训练方法及其系统 [P].

杨莉芳 ;

尚志刚 ;

王料丰 ;

李蒙蒙 ;

李志辉 ;

杨龙 ;

靳富丽 .

中国专利 :CN120354964A ,2025-07-22

[3]

强化学习系统及训练方法 [P].

彭宇劭 ;

汤凯富 ;

张智威 .

中国专利 :CN113392979A ,2021-09-14

[4]

强化学习系统及训练方法 [P].

彭宇劭 ;

汤凯富 ;

张智威 .

中国专利 :CN113392979B ,2024-08-16

[5]

一种强化学习模型训练方法、系统及相关装置 [P].

李辰 ;

姜金哲 ;

张新 ;

赵雅倩 .

中国专利 :CN115526327A ,2022-12-27

[6]

一种动态自适应强化学习模型的训练方法及系统 [P].

张栩之 ;

孙立新 ;

于海玲 ;

张德军 ;

张羽萱 .

中国专利 :CN121119030A ,2025-12-12

[7]

强化学习模型训练方法、决策方法、装置、设备及介质 [P].

刘建林 ;

解鑫 ;

袁晓敏 ;

许铭 ;

刘颖 .

中国专利 :CN113962362A ,2022-01-21

[8]

一种基于强化学习的智能体决策系统 [P].

孙伟杰 ;

徐进钊 ;

何麒 ;

刘俊研 .

中国专利 :CN120540249A ,2025-08-26

[9]

一种用于无人机空战决策的强化学习模型训练方法 [P].

薛健 ;

向贤财 ;

赵琳 ;

吕科 ;

张宝琳 .

中国专利 :CN117787384A ,2024-03-29

[10]

一种基于强化学习的智能决策测试方法及测试系统 [P].

孙科武 ;

白天翔 ;

戴星原 ;

郑方毅 ;

江业帆 ;

丁季时雨 ;

杨皙睿 .

中国专利 :CN119692157A ,2025-03-25

← 1 2 3 4 5 →