多方联合更新的离线强化学习方法

被引:0
申请号
CN202210462517.7
申请日
2022-04-27
公开(公告)号
CN114997410A
公开(公告)日
2022-09-02
发明(设计)人
冯黎明 马煜翔 裴阳 刘文博 邢冰 王玥
申请人
申请人地址
311121 浙江省杭州市余杭区仓前街道鼎创财富中心2幢3012室
IPC主分类号
G06N2000
IPC分类号
代理机构
北京知果之信知识产权代理有限公司 11541
代理人
高科
法律状态
实质审查的生效
国省代码
引用
下载
收藏
共 50 条
[1]
基于轨迹邻域信息序列优化的离线强化学习方法 [P]. 
刘全 ;
颜洁 ;
尤任阳 ;
曹玉康 ;
乌兰 ;
张军 ;
冯是乐 .
中国专利 :CN121072657A ,2025-12-05
[2]
基于状态偏移矫正的离线强化学习方法及装置 [P]. 
季向阳 ;
张宏昌 ;
邵键准 .
中国专利 :CN114781248A ,2022-07-22
[3]
用于目标控制的离线强化学习方法、装置和设备 [P]. 
詹仙园 ;
徐浩然 ;
李健雄 .
中国专利 :CN114186474A ,2022-03-15
[4]
一种基于扩散模型的离线强化学习方法 [P]. 
谭俊波 ;
何龙祥 ;
郭冠求 ;
王学谦 ;
梁斌 .
中国专利 :CN117669689A ,2024-03-08
[5]
一种有效泛化的离线强化学习方法 [P]. 
冯涣婷 ;
王雪松 ;
程玉虎 ;
祝强 .
中国专利 :CN118378689A ,2024-07-23
[6]
用于目标控制的离线强化学习方法、装置和设备 [P]. 
詹仙园 ;
徐浩然 ;
李健雄 .
中国专利 :CN114186474B ,2025-05-09
[7]
迁移强化学习方法及装置、多任务强化学习方法及装置 [P]. 
张海超 ;
孙凌峰 ;
徐伟 .
美国专利 :CN118171752A ,2024-06-11
[8]
基于双重正则化的离线联邦强化学习方法及装置 [P]. 
任炬 ;
岳晟 ;
张尧学 .
中国专利 :CN118211678A ,2024-06-18
[9]
一种基于行为动作生成的离线强化学习方法 [P]. 
张永爱 ;
李海峰 ;
吴朝兴 ;
周雄图 ;
郭太良 .
中国专利 :CN119514639A ,2025-02-25
[10]
一种基于分数模型的离线强化学习方法 [P]. 
李秀 ;
刘泽源 ;
方智睿 ;
吕加飞 .
中国专利 :CN120087446A ,2025-06-03