一种基于扩散状态规划的决策Transformer离线强化学习方法

被引:0
专利类型
发明
申请号
CN202510655213.6
申请日
2025-05-21
公开(公告)号
CN120181138A
公开(公告)日
2025-06-20
发明(设计)人
王雪松 张恒瑞 程玉虎 万红
申请人
中国矿业大学
申请人地址
221148 江苏省徐州市铜山区大学路1号
IPC主分类号
G06N3/045
IPC分类号
G06N3/084 G06N3/092
代理机构
南京千语知识产权代理事务所(普通合伙) 32394
代理人
任志艳
法律状态
公开
国省代码
江苏省 徐州市
引用
下载
收藏
共 50 条
[1]
一种基于扩散状态规划的决策Transformer离线强化学习方法 [P]. 
王雪松 ;
张恒瑞 ;
程玉虎 ;
万红 .
中国专利 :CN120181138B ,2025-08-12
[2]
一种基于扩散模型的离线强化学习方法 [P]. 
谭俊波 ;
何龙祥 ;
郭冠求 ;
王学谦 ;
梁斌 .
中国专利 :CN117669689A ,2024-03-08
[3]
一种基于条件扩散模型的安全离线强化学习方法 [P]. 
王丽芳 ;
李沛聪 ;
王晋光 ;
秦品乐 ;
柴锐 ;
于一 .
中国专利 :CN120317317A ,2025-07-15
[4]
一种基于逆扩散引导策略的离线强化学习方法 [P]. 
王雪松 ;
张佳志 ;
程玉虎 ;
李会军 ;
赵忠祥 .
中国专利 :CN117952186B ,2024-07-12
[5]
一种基于逆扩散引导策略的离线强化学习方法 [P]. 
王雪松 ;
张佳志 ;
程玉虎 ;
李会军 ;
赵忠祥 .
中国专利 :CN117952186A ,2024-04-30
[6]
一种基于扩散的双生成回放的持续离线强化学习方法 [P]. 
王志 ;
刘金梅 ;
李文斌 ;
魏婧雯 ;
陈春林 ;
王博 ;
李华雄 ;
辛博 ;
朱张青 .
中国专利 :CN117634647A ,2024-03-01
[7]
基于状态偏移矫正的离线强化学习方法及装置 [P]. 
季向阳 ;
张宏昌 ;
邵键准 .
中国专利 :CN114781248A ,2022-07-22
[8]
一种基于行为动作生成的离线强化学习方法 [P]. 
张永爱 ;
李海峰 ;
吴朝兴 ;
周雄图 ;
郭太良 .
中国专利 :CN119514639A ,2025-02-25
[9]
一种基于状态引导策略的离线强化学习方法及系统 [P]. 
詹仙园 .
中国专利 :CN115577766A ,2023-01-06
[10]
一种基于动力学增强的离线强化学习扩散轨迹规划方法 [P]. 
王子豪 ;
蒋科 ;
谭晓阳 .
中国专利 :CN120972965A ,2025-11-18