一种基于条件扩散模型的安全离线强化学习方法

被引:0
专利类型
发明
申请号
CN202510471171.0
申请日
2025-04-15
公开(公告)号
CN120317317A
公开(公告)日
2025-07-15
发明(设计)人
王丽芳 李沛聪 王晋光 秦品乐 柴锐 于一
申请人
中北大学
申请人地址
030051 山西省太原市学院路3号
IPC主分类号
G06N3/092
IPC分类号
G06N3/0455 G06N3/0464 G06N3/0475 G06N7/01
代理机构
太原申立德知识产权代理事务所(特殊普通合伙) 14115
代理人
王芳
法律状态
实质审查的生效
国省代码
山西省 太原市
引用
下载
收藏
共 50 条
[1]
一种基于扩散模型的离线强化学习方法 [P]. 
谭俊波 ;
何龙祥 ;
郭冠求 ;
王学谦 ;
梁斌 .
中国专利 :CN117669689A ,2024-03-08
[2]
一种基于逆扩散引导策略的离线强化学习方法 [P]. 
王雪松 ;
张佳志 ;
程玉虎 ;
李会军 ;
赵忠祥 .
中国专利 :CN117952186B ,2024-07-12
[3]
一种基于逆扩散引导策略的离线强化学习方法 [P]. 
王雪松 ;
张佳志 ;
程玉虎 ;
李会军 ;
赵忠祥 .
中国专利 :CN117952186A ,2024-04-30
[4]
一种基于扩散状态规划的决策Transformer离线强化学习方法 [P]. 
王雪松 ;
张恒瑞 ;
程玉虎 ;
万红 .
中国专利 :CN120181138B ,2025-08-12
[5]
一种基于扩散状态规划的决策Transformer离线强化学习方法 [P]. 
王雪松 ;
张恒瑞 ;
程玉虎 ;
万红 .
中国专利 :CN120181138A ,2025-06-20
[6]
一种基于扩散的双生成回放的持续离线强化学习方法 [P]. 
王志 ;
刘金梅 ;
李文斌 ;
魏婧雯 ;
陈春林 ;
王博 ;
李华雄 ;
辛博 ;
朱张青 .
中国专利 :CN117634647A ,2024-03-01
[7]
一种基于分数模型的离线强化学习方法 [P]. 
李秀 ;
刘泽源 ;
方智睿 ;
吕加飞 .
中国专利 :CN120087446A ,2025-06-03
[8]
一种基于行为动作生成的离线强化学习方法 [P]. 
张永爱 ;
李海峰 ;
吴朝兴 ;
周雄图 ;
郭太良 .
中国专利 :CN119514639A ,2025-02-25
[9]
一种基于扩散模型的微电网能源管理强化学习方法 [P]. 
张震宇 ;
项超 ;
曾志刚 .
中国专利 :CN120471485A ,2025-08-12
[10]
一种基于双向模型的强化学习方法 [P]. 
张伟楠 ;
赖行 ;
沈键 .
中国专利 :CN111950735A ,2020-11-17