一种动态强化学习决策训练系统

被引:0
专利类型
发明
申请号
CN201911412353.1
申请日
2019-12-31
公开(公告)号
CN111178545A
公开(公告)日
2020-05-19
发明(设计)人
高放 李明强 陈思 唐思琦 黄彬城
申请人
申请人地址
100086 北京市海淀区四道口北街36号院4号楼
IPC主分类号
G06N2000
IPC分类号
代理机构
北京中知法苑知识产权代理有限公司 11226
代理人
李明;赵吉阳
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
一种强化学习训练方法及基于强化学习的决策方法 [P]. 
刘震 ;
王闯 ;
周兴 ;
李华 .
中国专利 :CN112580801A ,2021-03-30
[2]
一种序贯决策强化学习训练方法及其系统 [P]. 
杨莉芳 ;
尚志刚 ;
王料丰 ;
李蒙蒙 ;
李志辉 ;
杨龙 ;
靳富丽 .
中国专利 :CN120354964A ,2025-07-22
[3]
强化学习系统及训练方法 [P]. 
彭宇劭 ;
汤凯富 ;
张智威 .
中国专利 :CN113392979A ,2021-09-14
[4]
强化学习系统及训练方法 [P]. 
彭宇劭 ;
汤凯富 ;
张智威 .
中国专利 :CN113392979B ,2024-08-16
[5]
一种强化学习模型训练方法、系统及相关装置 [P]. 
李辰 ;
姜金哲 ;
张新 ;
赵雅倩 .
中国专利 :CN115526327A ,2022-12-27
[6]
一种动态自适应强化学习模型的训练方法及系统 [P]. 
张栩之 ;
孙立新 ;
于海玲 ;
张德军 ;
张羽萱 .
中国专利 :CN121119030A ,2025-12-12
[7]
强化学习模型训练方法、决策方法、装置、设备及介质 [P]. 
刘建林 ;
解鑫 ;
袁晓敏 ;
许铭 ;
刘颖 .
中国专利 :CN113962362A ,2022-01-21
[8]
一种基于强化学习的智能体决策系统 [P]. 
孙伟杰 ;
徐进钊 ;
何麒 ;
刘俊研 .
中国专利 :CN120540249A ,2025-08-26
[9]
一种用于无人机空战决策的强化学习模型训练方法 [P]. 
薛健 ;
向贤财 ;
赵琳 ;
吕科 ;
张宝琳 .
中国专利 :CN117787384A ,2024-03-29
[10]
一种基于强化学习的智能决策测试方法及测试系统 [P]. 
孙科武 ;
白天翔 ;
戴星原 ;
郑方毅 ;
江业帆 ;
丁季时雨 ;
杨皙睿 .
中国专利 :CN119692157A ,2025-03-25