多方联合更新的离线强化学习方法

被引：0

申请号：

CN202210462517.7

申请日：

2022-04-27

公开(公告)号：

CN114997410A

公开(公告)日：

2022-09-02

发明(设计)人：

冯黎明马煜翔裴阳刘文博邢冰王玥

申请人：

申请人地址：

311121 浙江省杭州市余杭区仓前街道鼎创财富中心2幢3012室

IPC主分类号：

G06N2000

IPC分类号：

代理机构：

北京知果之信知识产权代理有限公司 11541

代理人：

高科

法律状态：

实质审查的生效

国省代码：

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2022-09-20	实质审查的生效	实质审查的生效 IPC(主分类):G06N 20/00 申请日:20220427
2022-09-02	公开	公开

共 50 条

[1]

基于轨迹邻域信息序列优化的离线强化学习方法 [P].

刘全 ;

颜洁 ;

尤任阳 ;

曹玉康 ;

乌兰 ;

张军 ;

冯是乐 .

中国专利 :CN121072657A ,2025-12-05

[2]

基于状态偏移矫正的离线强化学习方法及装置 [P].

季向阳 ;

张宏昌 ;

邵键准 .

中国专利 :CN114781248A ,2022-07-22

[3]

用于目标控制的离线强化学习方法、装置和设备 [P].

詹仙园 ;

徐浩然 ;

李健雄 .

中国专利 :CN114186474A ,2022-03-15

[4]

一种基于扩散模型的离线强化学习方法 [P].

谭俊波 ;

何龙祥 ;

郭冠求 ;

王学谦 ;

梁斌 .

中国专利 :CN117669689A ,2024-03-08

[5]

一种有效泛化的离线强化学习方法 [P].

冯涣婷 ;

王雪松 ;

程玉虎 ;

祝强 .

中国专利 :CN118378689A ,2024-07-23

[6]

用于目标控制的离线强化学习方法、装置和设备 [P].

詹仙园 ;

徐浩然 ;

李健雄 .

中国专利 :CN114186474B ,2025-05-09

[7]

迁移强化学习方法及装置、多任务强化学习方法及装置 [P].

张海超 ;

孙凌峰 ;

徐伟 .

美国专利 :CN118171752A ,2024-06-11

[8]

基于双重正则化的离线联邦强化学习方法及装置 [P].

任炬 ;

岳晟 ;

张尧学 .

中国专利 :CN118211678A ,2024-06-18

[9]

一种基于行为动作生成的离线强化学习方法 [P].

张永爱 ;

李海峰 ;

吴朝兴 ;

周雄图 ;

郭太良 .

中国专利 :CN119514639A ,2025-02-25

[10]

一种基于分数模型的离线强化学习方法 [P].

李秀 ;

刘泽源 ;

方智睿 ;

吕加飞 .

中国专利 :CN120087446A ,2025-06-03

← 1 2 3 4 5 →