强化学习的环境重置方法、装置、电子设备及存储介质

被引:0
专利类型
发明
申请号
CN202511783537.4
申请日
2025-12-01
公开(公告)号
CN121212400A
公开(公告)日
2025-12-26
发明(设计)人
高一博 李立 李宇森 周爽
申请人
华中科技大学
申请人地址
430074 湖北省武汉市洪山区珞喻路1037号
IPC主分类号
G06N20/00
IPC分类号
G06N5/01
代理机构
武汉智恒永道知识产权代理有限公司 42290
代理人
陈建军
法律状态
公开
国省代码
湖北省 武汉市
引用
下载
收藏
共 50 条
[1]
强化学习训练方法及装置、电子设备、存储介质 [P]. 
金丹 ;
唐思琦 ;
李明强 .
中国专利 :CN114529015A ,2022-05-24
[2]
强化学习计算模拟方法、装置、电子设备及存储介质 [P]. 
王鹏飞 .
中国专利 :CN120725093B ,2025-11-14
[3]
强化学习计算模拟方法、装置、电子设备及存储介质 [P]. 
王鹏飞 .
中国专利 :CN120725093A ,2025-09-30
[4]
强化学习模型的优化方法、装置、存储介质及电子设备 [P]. 
张棋 ;
杨博 ;
陈贺昌 ;
孙智孝 ;
朴海音 ;
詹光 ;
常毅 .
中国专利 :CN113435606A ,2021-09-24
[5]
稀疏奖励环境下的强化学习方法、电子设备及存储介质 [P]. 
杨海辉 .
中国专利 :CN117689040A ,2024-03-12
[6]
强化学习方法、装置、电子设备和存储介质 [P]. 
闫立俊 ;
牛京 ;
周照 ;
张西军 ;
杨宁 ;
王彪 ;
张斌 ;
冯超 ;
杨鹏涛 .
中国专利 :CN112418435A ,2021-02-26
[7]
基于强化学习的列车制动方法、装置、电子设备及存储介质 [P]. 
刘鸿恩 ;
刘岭 ;
崔俊锋 .
中国专利 :CN118484931A ,2024-08-13
[8]
强化学习模型的训练方法、装置、电子设备及存储介质 [P]. 
孙长春 ;
李伟东 ;
史浩 ;
马草原 ;
陈前 ;
徐金陵 ;
曹衡 ;
刘启龙 ;
刘大源 ;
赵文嘉 ;
杜新胜 ;
赵明月 .
中国专利 :CN117993473A ,2024-05-07
[9]
强化学习模型训练方法、装置、电子设备及存储介质 [P]. 
谢树雷 ;
曾子胤 .
中国专利 :CN120633761A ,2025-09-12
[10]
强化学习模型训练方法、装置、电子设备及存储介质 [P]. 
徐亮 ;
单彬 ;
赵鉴 ;
秦熔均 ;
俞扬 .
中国专利 :CN117933353B ,2025-02-18