学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种基于扩散状态规划的决策Transformer离线强化学习方法
被引:0
专利类型
:
发明
申请号
:
CN202510655213.6
申请日
:
2025-05-21
公开(公告)号
:
CN120181138A
公开(公告)日
:
2025-06-20
发明(设计)人
:
王雪松
张恒瑞
程玉虎
万红
申请人
:
中国矿业大学
申请人地址
:
221148 江苏省徐州市铜山区大学路1号
IPC主分类号
:
G06N3/045
IPC分类号
:
G06N3/084
G06N3/092
代理机构
:
南京千语知识产权代理事务所(普通合伙) 32394
代理人
:
任志艳
法律状态
:
公开
国省代码
:
江苏省 徐州市
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2025-06-20
公开
公开
2025-07-08
实质审查的生效
实质审查的生效IPC(主分类):G06N 3/045申请日:20250521
2025-08-12
授权
授权
共 50 条
[1]
一种基于扩散状态规划的决策Transformer离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
王雪松
;
张恒瑞
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学
中国矿业大学
张恒瑞
;
论文数:
引用数:
h-index:
机构:
程玉虎
;
论文数:
引用数:
h-index:
机构:
万红
.
中国专利
:CN120181138B
,2025-08-12
[2]
一种基于扩散模型的离线强化学习方法
[P].
谭俊波
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
谭俊波
;
何龙祥
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
何龙祥
;
郭冠求
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
郭冠求
;
论文数:
引用数:
h-index:
机构:
王学谦
;
论文数:
引用数:
h-index:
机构:
梁斌
.
中国专利
:CN117669689A
,2024-03-08
[3]
一种基于条件扩散模型的安全离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
王丽芳
;
李沛聪
论文数:
0
引用数:
0
h-index:
0
机构:
中北大学
中北大学
李沛聪
;
论文数:
引用数:
h-index:
机构:
王晋光
;
论文数:
引用数:
h-index:
机构:
秦品乐
;
论文数:
引用数:
h-index:
机构:
柴锐
;
论文数:
引用数:
h-index:
机构:
于一
.
中国专利
:CN120317317A
,2025-07-15
[4]
一种基于逆扩散引导策略的离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
王雪松
;
论文数:
引用数:
h-index:
机构:
张佳志
;
论文数:
引用数:
h-index:
机构:
程玉虎
;
论文数:
引用数:
h-index:
机构:
李会军
;
论文数:
引用数:
h-index:
机构:
赵忠祥
.
中国专利
:CN117952186B
,2024-07-12
[5]
一种基于逆扩散引导策略的离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
王雪松
;
论文数:
引用数:
h-index:
机构:
张佳志
;
论文数:
引用数:
h-index:
机构:
程玉虎
;
论文数:
引用数:
h-index:
机构:
李会军
;
论文数:
引用数:
h-index:
机构:
赵忠祥
.
中国专利
:CN117952186A
,2024-04-30
[6]
一种基于扩散的双生成回放的持续离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
王志
;
论文数:
引用数:
h-index:
机构:
刘金梅
;
论文数:
引用数:
h-index:
机构:
李文斌
;
魏婧雯
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学
南京大学
魏婧雯
;
论文数:
引用数:
h-index:
机构:
陈春林
;
论文数:
引用数:
h-index:
机构:
王博
;
论文数:
引用数:
h-index:
机构:
李华雄
;
论文数:
引用数:
h-index:
机构:
辛博
;
论文数:
引用数:
h-index:
机构:
朱张青
.
中国专利
:CN117634647A
,2024-03-01
[7]
基于状态偏移矫正的离线强化学习方法及装置
[P].
季向阳
论文数:
0
引用数:
0
h-index:
0
季向阳
;
张宏昌
论文数:
0
引用数:
0
h-index:
0
张宏昌
;
邵键准
论文数:
0
引用数:
0
h-index:
0
邵键准
.
中国专利
:CN114781248A
,2022-07-22
[8]
一种基于行为动作生成的离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
张永爱
;
李海峰
论文数:
0
引用数:
0
h-index:
0
机构:
福州大学
福州大学
李海峰
;
论文数:
引用数:
h-index:
机构:
吴朝兴
;
论文数:
引用数:
h-index:
机构:
周雄图
;
论文数:
引用数:
h-index:
机构:
郭太良
.
中国专利
:CN119514639A
,2025-02-25
[9]
一种基于状态引导策略的离线强化学习方法及系统
[P].
詹仙园
论文数:
0
引用数:
0
h-index:
0
詹仙园
.
中国专利
:CN115577766A
,2023-01-06
[10]
一种基于动力学增强的离线强化学习扩散轨迹规划方法
[P].
论文数:
引用数:
h-index:
机构:
王子豪
;
论文数:
引用数:
h-index:
机构:
蒋科
;
论文数:
引用数:
h-index:
机构:
谭晓阳
.
中国专利
:CN120972965A
,2025-11-18
←
1
2
3
4
5
→