一种基于条件扩散模型的安全离线强化学习方法

被引：0

专利类型：

发明

申请号：

CN202510471171.0

申请日：

2025-04-15

公开(公告)号：

CN120317317A

公开(公告)日：

2025-07-15

发明(设计)人：

王丽芳李沛聪王晋光秦品乐柴锐于一

申请人：

中北大学

申请人地址：

030051 山西省太原市学院路3号

IPC主分类号：

G06N3/092

IPC分类号：

G06N3/0455 G06N3/0464 G06N3/0475 G06N7/01

代理机构：

太原申立德知识产权代理事务所(特殊普通合伙) 14115

代理人：

王芳

法律状态：

实质审查的生效

国省代码：

山西省太原市

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2025-08-01	实质审查的生效	实质审查的生效IPC(主分类):G06N 3/092申请日:20250415
2025-07-15	公开	公开

共 50 条

[1]

一种基于扩散模型的离线强化学习方法 [P].

谭俊波 ;

何龙祥 ;

郭冠求 ;

王学谦 ;

梁斌 .

中国专利 :CN117669689A ,2024-03-08

[2]

一种基于逆扩散引导策略的离线强化学习方法 [P].

王雪松 ;

张佳志 ;

程玉虎 ;

李会军 ;

赵忠祥 .

中国专利 :CN117952186B ,2024-07-12

[3]

一种基于逆扩散引导策略的离线强化学习方法 [P].

王雪松 ;

张佳志 ;

程玉虎 ;

李会军 ;

赵忠祥 .

中国专利 :CN117952186A ,2024-04-30

[4]

一种基于扩散状态规划的决策Transformer离线强化学习方法 [P].

王雪松 ;

张恒瑞 ;

程玉虎 ;

万红 .

中国专利 :CN120181138B ,2025-08-12

[5]

一种基于扩散状态规划的决策Transformer离线强化学习方法 [P].

王雪松 ;

张恒瑞 ;

程玉虎 ;

万红 .

中国专利 :CN120181138A ,2025-06-20

[6]

一种基于扩散的双生成回放的持续离线强化学习方法 [P].

王志 ;

刘金梅 ;

李文斌 ;

魏婧雯 ;

陈春林 ;

王博 ;

李华雄 ;

辛博 ;

朱张青 .

中国专利 :CN117634647A ,2024-03-01

[7]

一种基于分数模型的离线强化学习方法 [P].

李秀 ;

刘泽源 ;

方智睿 ;

吕加飞 .

中国专利 :CN120087446A ,2025-06-03

[8]

一种基于行为动作生成的离线强化学习方法 [P].

张永爱 ;

李海峰 ;

吴朝兴 ;

周雄图 ;

郭太良 .

中国专利 :CN119514639A ,2025-02-25

[9]

一种基于扩散模型的微电网能源管理强化学习方法 [P].

张震宇 ;

项超 ;

曾志刚 .

中国专利 :CN120471485A ,2025-08-12

[10]

一种基于双向模型的强化学习方法 [P].

张伟楠 ;

赖行 ;

沈键 .

中国专利 :CN111950735A ,2020-11-17

← 1 2 3 4 5 →