一种基于扩散状态规划的决策Transformer离线强化学习方法

被引：0

专利类型：

发明

申请号：

CN202510655213.6

申请日：

2025-05-21

公开(公告)号：

CN120181138A

公开(公告)日：

2025-06-20

发明(设计)人：

王雪松张恒瑞程玉虎万红

申请人：

中国矿业大学

申请人地址：

221148 江苏省徐州市铜山区大学路1号

IPC主分类号：

G06N3/045

IPC分类号：

G06N3/084 G06N3/092

代理机构：

南京千语知识产权代理事务所(普通合伙) 32394

代理人：

任志艳

法律状态：

公开

国省代码：

江苏省徐州市

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2025-06-20	公开	公开
2025-07-08	实质审查的生效	实质审查的生效IPC(主分类):G06N 3/045申请日:20250521
2025-08-12	授权	授权

共 50 条

[1]

一种基于扩散状态规划的决策Transformer离线强化学习方法 [P].

王雪松 ;

张恒瑞 ;

程玉虎 ;

万红 .

中国专利 :CN120181138B ,2025-08-12

[2]

一种基于扩散模型的离线强化学习方法 [P].

谭俊波 ;

何龙祥 ;

郭冠求 ;

王学谦 ;

梁斌 .

中国专利 :CN117669689A ,2024-03-08

[3]

一种基于条件扩散模型的安全离线强化学习方法 [P].

王丽芳 ;

李沛聪 ;

王晋光 ;

秦品乐 ;

柴锐 ;

于一 .

中国专利 :CN120317317A ,2025-07-15

[4]

一种基于逆扩散引导策略的离线强化学习方法 [P].

王雪松 ;

张佳志 ;

程玉虎 ;

李会军 ;

赵忠祥 .

中国专利 :CN117952186B ,2024-07-12

[5]

一种基于逆扩散引导策略的离线强化学习方法 [P].

王雪松 ;

张佳志 ;

程玉虎 ;

李会军 ;

赵忠祥 .

中国专利 :CN117952186A ,2024-04-30

[6]

一种基于扩散的双生成回放的持续离线强化学习方法 [P].

王志 ;

刘金梅 ;

李文斌 ;

魏婧雯 ;

陈春林 ;

王博 ;

李华雄 ;

辛博 ;

朱张青 .

中国专利 :CN117634647A ,2024-03-01

[7]

基于状态偏移矫正的离线强化学习方法及装置 [P].

季向阳 ;

张宏昌 ;

邵键准 .

中国专利 :CN114781248A ,2022-07-22

[8]

一种基于行为动作生成的离线强化学习方法 [P].

张永爱 ;

李海峰 ;

吴朝兴 ;

周雄图 ;

郭太良 .

中国专利 :CN119514639A ,2025-02-25

[9]

一种基于状态引导策略的离线强化学习方法及系统 [P].

詹仙园 .

中国专利 :CN115577766A ,2023-01-06

[10]

一种基于动力学增强的离线强化学习扩散轨迹规划方法 [P].

王子豪 ;

蒋科 ;

谭晓阳 .

中国专利 :CN120972965A ,2025-11-18

← 1 2 3 4 5 →