学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种基于条件扩散模型的安全离线强化学习方法
被引:0
专利类型
:
发明
申请号
:
CN202510471171.0
申请日
:
2025-04-15
公开(公告)号
:
CN120317317A
公开(公告)日
:
2025-07-15
发明(设计)人
:
王丽芳
李沛聪
王晋光
秦品乐
柴锐
于一
申请人
:
中北大学
申请人地址
:
030051 山西省太原市学院路3号
IPC主分类号
:
G06N3/092
IPC分类号
:
G06N3/0455
G06N3/0464
G06N3/0475
G06N7/01
代理机构
:
太原申立德知识产权代理事务所(特殊普通合伙) 14115
代理人
:
王芳
法律状态
:
实质审查的生效
国省代码
:
山西省 太原市
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2025-08-01
实质审查的生效
实质审查的生效IPC(主分类):G06N 3/092申请日:20250415
2025-07-15
公开
公开
共 50 条
[1]
一种基于扩散模型的离线强化学习方法
[P].
谭俊波
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
谭俊波
;
何龙祥
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
何龙祥
;
郭冠求
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
郭冠求
;
论文数:
引用数:
h-index:
机构:
王学谦
;
论文数:
引用数:
h-index:
机构:
梁斌
.
中国专利
:CN117669689A
,2024-03-08
[2]
一种基于逆扩散引导策略的离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
王雪松
;
论文数:
引用数:
h-index:
机构:
张佳志
;
论文数:
引用数:
h-index:
机构:
程玉虎
;
论文数:
引用数:
h-index:
机构:
李会军
;
论文数:
引用数:
h-index:
机构:
赵忠祥
.
中国专利
:CN117952186B
,2024-07-12
[3]
一种基于逆扩散引导策略的离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
王雪松
;
论文数:
引用数:
h-index:
机构:
张佳志
;
论文数:
引用数:
h-index:
机构:
程玉虎
;
论文数:
引用数:
h-index:
机构:
李会军
;
论文数:
引用数:
h-index:
机构:
赵忠祥
.
中国专利
:CN117952186A
,2024-04-30
[4]
一种基于扩散状态规划的决策Transformer离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
王雪松
;
张恒瑞
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学
中国矿业大学
张恒瑞
;
论文数:
引用数:
h-index:
机构:
程玉虎
;
论文数:
引用数:
h-index:
机构:
万红
.
中国专利
:CN120181138B
,2025-08-12
[5]
一种基于扩散状态规划的决策Transformer离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
王雪松
;
张恒瑞
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学
中国矿业大学
张恒瑞
;
论文数:
引用数:
h-index:
机构:
程玉虎
;
论文数:
引用数:
h-index:
机构:
万红
.
中国专利
:CN120181138A
,2025-06-20
[6]
一种基于扩散的双生成回放的持续离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
王志
;
论文数:
引用数:
h-index:
机构:
刘金梅
;
论文数:
引用数:
h-index:
机构:
李文斌
;
魏婧雯
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学
南京大学
魏婧雯
;
论文数:
引用数:
h-index:
机构:
陈春林
;
论文数:
引用数:
h-index:
机构:
王博
;
论文数:
引用数:
h-index:
机构:
李华雄
;
论文数:
引用数:
h-index:
机构:
辛博
;
论文数:
引用数:
h-index:
机构:
朱张青
.
中国专利
:CN117634647A
,2024-03-01
[7]
一种基于分数模型的离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
李秀
;
刘泽源
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
刘泽源
;
方智睿
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
方智睿
;
吕加飞
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
吕加飞
.
中国专利
:CN120087446A
,2025-06-03
[8]
一种基于行为动作生成的离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
张永爱
;
李海峰
论文数:
0
引用数:
0
h-index:
0
机构:
福州大学
福州大学
李海峰
;
论文数:
引用数:
h-index:
机构:
吴朝兴
;
论文数:
引用数:
h-index:
机构:
周雄图
;
论文数:
引用数:
h-index:
机构:
郭太良
.
中国专利
:CN119514639A
,2025-02-25
[9]
一种基于扩散模型的微电网能源管理强化学习方法
[P].
张震宇
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学
华中科技大学
张震宇
;
项超
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学
华中科技大学
项超
;
论文数:
引用数:
h-index:
机构:
曾志刚
.
中国专利
:CN120471485A
,2025-08-12
[10]
一种基于双向模型的强化学习方法
[P].
张伟楠
论文数:
0
引用数:
0
h-index:
0
张伟楠
;
赖行
论文数:
0
引用数:
0
h-index:
0
赖行
;
沈键
论文数:
0
引用数:
0
h-index:
0
沈键
.
中国专利
:CN111950735A
,2020-11-17
←
1
2
3
4
5
→