训练深度强化学习模型的方法及装置

被引:0
专利类型
发明
申请号
CN201810893034.6
申请日
2018-08-07
公开(公告)号
CN109255443A
公开(公告)日
2019-01-22
发明(设计)人
何建杉
申请人
申请人地址
英属开曼群岛大开曼资本大厦一座四层847号邮箱
IPC主分类号
G06N2000
IPC分类号
G06K962
代理机构
北京亿腾知识产权代理事务所 11309
代理人
陈霁;周良玉
法律状态
专利申请权、专利权的转移
国省代码
引用
下载
收藏
共 50 条
[1]
深度强化学习模型的训练方法、装置、介质及设备 [P]. 
范嘉骏 ;
肖昌南 .
中国专利 :CN112766497A ,2021-05-07
[2]
深度强化学习模型的训练方法、装置、介质及设备 [P]. 
范嘉骏 ;
肖昌南 .
中国专利 :CN112766497B ,2024-08-13
[3]
基于深度强化学习的库存模型训练方法、装置 [P]. 
叶润森 ;
马仲能 ;
望明明 ;
赖莉敏 ;
刘志添 ;
高子弋 ;
黄康君 ;
李春晖 ;
梁远星 ;
吴志刚 ;
欧阳芳 ;
刘军 ;
蔡威 ;
吴瑧言 ;
杨斌 ;
黄林泽 ;
蒋敏锋 ;
李波 ;
王兆彤 ;
周松涛 ;
卢冠荣 ;
陈可欣 ;
黄丹妮 ;
丘昕欣 ;
黄妙凤 ;
吴琳恬 .
中国专利 :CN119398655A ,2025-02-07
[4]
深度强化学习模型的训练方法、装置、介质及电子设备 [P]. 
范嘉骏 .
中国专利 :CN113052312B ,2024-08-13
[5]
深度强化学习模型的训练方法、装置、介质及电子设备 [P]. 
范嘉骏 .
中国专利 :CN113052312A ,2021-06-29
[6]
深度强化学习模型的更新方法及装置 [P]. 
张富 .
中国专利 :CN119902789A ,2025-04-29
[7]
基于双层深度强化学习模型的最优策略获取方法及装置 [P]. 
冯旸赫 ;
陈晓轩 ;
黄金才 ;
刘忠 ;
程光权 ;
梁星星 ;
陈丽 ;
许乃夫 .
中国专利 :CN114723065A ,2022-07-08
[8]
基于双层深度强化学习模型的最优策略获取方法及装置 [P]. 
冯旸赫 ;
陈晓轩 ;
黄金才 ;
刘忠 ;
程光权 ;
梁星星 ;
陈丽 ;
许乃夫 .
中国专利 :CN114723065B ,2025-04-29
[9]
深度强化学习模型调参辅助方法及装置 [P]. 
李绍韬 ;
陈子欣 ;
刘笑天 ;
钟劲韵 ;
王鹤新 .
中国专利 :CN121072666A ,2025-12-05
[10]
一种深度强化学习模型的训练方法、装置及存储介质 [P]. 
张佳能 ;
李辉 ;
周俊成 .
中国专利 :CN114065929A ,2022-02-18