强化学习的策略迁移方法、设备和存储介质

被引:0
专利类型
发明
申请号
CN202210787082.3
申请日
2022-07-04
公开(公告)号
CN117390946A
公开(公告)日
2024-01-12
发明(设计)人
李阔 贾庆山 张涛 白钰 任冬淳 夏华夏
申请人
北京三快在线科技有限公司 清华大学
申请人地址
100080 北京市海淀区北四环西路9号2106-030
IPC主分类号
G06F30/27
IPC分类号
G06N20/00
代理机构
北京三高永信知识产权代理有限责任公司 11138
代理人
谢冬寒
法律状态
实质审查的生效
国省代码
北京市 市辖区
引用
下载
收藏
共 50 条
[1]
基于强化学习的策略制定方法、装置、设备及存储介质 [P]. 
钟伟鹏 .
中国专利 :CN120598625A ,2025-09-05
[2]
迁移强化学习控制方法、系统、存储介质、设备及应用 [P]. 
李光亮 ;
隽荣顺 ;
黄杰 ;
沙启鑫 ;
何波 .
中国专利 :CN112884125A ,2021-06-01
[3]
基于强化学习的信息处理方法、装置、设备和存储介质 [P]. 
刘卓 ;
孙行智 ;
赵惟 ;
徐卓扬 .
中国专利 :CN110928936A ,2020-03-27
[4]
强化学习数据采样方法、系统、设备和存储介质 [P]. 
张超 ;
陈楚凡 ;
张云淞 ;
钱徽 .
中国专利 :CN116776962B ,2025-11-25
[5]
强化学习的迁移训练优化方法、装置、终端及存储介质 [P]. 
梁新乐 ;
刘洋 ;
陈天健 ;
董苗波 .
中国专利 :CN110766169A ,2020-02-07
[6]
用于强化学习的方法、装置、设备和介质 [P]. 
郑天昱 ;
谷清水 ;
温周伏土 ;
邢天舜 ;
曲星威 ;
刘乾 ;
黄文灏 ;
马泽君 ;
张舸 .
:CN120822638A ,2025-10-21
[7]
基于强化学习的卫星调度方法、装置、设备和存储介质 [P]. 
田露 ;
马冬青 ;
李骏平 ;
崔涛 ;
郭芸莹 .
中国专利 :CN120342462B ,2025-12-16
[8]
基于强化学习的卫星调度方法、装置、设备和存储介质 [P]. 
田露 ;
马冬青 ;
李骏平 ;
崔涛 ;
郭芸莹 .
中国专利 :CN120342462A ,2025-07-18
[9]
基于强化学习的投诉处理方法、系统、设备和存储介质 [P]. 
邹颖 ;
李杰 ;
聂彦岭 ;
花磊 ;
赵航 ;
开祥 .
中国专利 :CN121052297A ,2025-12-02
[10]
基于强化学习的节点渗透测试方法、设备和存储介质 [P]. 
郝伟 ;
沈传宝 ;
刘加瑞 ;
马维士 ;
万会来 ;
侯晓雄 ;
李岩 .
中国专利 :CN111817908A ,2020-10-23