学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
多方联合更新的离线强化学习方法
被引:0
申请号
:
CN202210462517.7
申请日
:
2022-04-27
公开(公告)号
:
CN114997410A
公开(公告)日
:
2022-09-02
发明(设计)人
:
冯黎明
马煜翔
裴阳
刘文博
邢冰
王玥
申请人
:
申请人地址
:
311121 浙江省杭州市余杭区仓前街道鼎创财富中心2幢3012室
IPC主分类号
:
G06N2000
IPC分类号
:
代理机构
:
北京知果之信知识产权代理有限公司 11541
代理人
:
高科
法律状态
:
实质审查的生效
国省代码
:
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2022-09-20
实质审查的生效
实质审查的生效 IPC(主分类):G06N 20/00 申请日:20220427
2022-09-02
公开
公开
共 50 条
[1]
基于轨迹邻域信息序列优化的离线强化学习方法
[P].
刘全
论文数:
0
引用数:
0
h-index:
0
机构:
喀什大学
喀什大学
刘全
;
颜洁
论文数:
0
引用数:
0
h-index:
0
机构:
喀什大学
喀什大学
颜洁
;
尤任阳
论文数:
0
引用数:
0
h-index:
0
机构:
喀什大学
喀什大学
尤任阳
;
曹玉康
论文数:
0
引用数:
0
h-index:
0
机构:
喀什大学
喀什大学
曹玉康
;
乌兰
论文数:
0
引用数:
0
h-index:
0
机构:
喀什大学
喀什大学
乌兰
;
张军
论文数:
0
引用数:
0
h-index:
0
机构:
喀什大学
喀什大学
张军
;
冯是乐
论文数:
0
引用数:
0
h-index:
0
机构:
喀什大学
喀什大学
冯是乐
.
中国专利
:CN121072657A
,2025-12-05
[2]
基于状态偏移矫正的离线强化学习方法及装置
[P].
季向阳
论文数:
0
引用数:
0
h-index:
0
季向阳
;
张宏昌
论文数:
0
引用数:
0
h-index:
0
张宏昌
;
邵键准
论文数:
0
引用数:
0
h-index:
0
邵键准
.
中国专利
:CN114781248A
,2022-07-22
[3]
用于目标控制的离线强化学习方法、装置和设备
[P].
詹仙园
论文数:
0
引用数:
0
h-index:
0
詹仙园
;
徐浩然
论文数:
0
引用数:
0
h-index:
0
徐浩然
;
李健雄
论文数:
0
引用数:
0
h-index:
0
李健雄
.
中国专利
:CN114186474A
,2022-03-15
[4]
一种基于扩散模型的离线强化学习方法
[P].
谭俊波
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
谭俊波
;
何龙祥
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
何龙祥
;
郭冠求
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
郭冠求
;
论文数:
引用数:
h-index:
机构:
王学谦
;
论文数:
引用数:
h-index:
机构:
梁斌
.
中国专利
:CN117669689A
,2024-03-08
[5]
一种有效泛化的离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
冯涣婷
;
王雪松
论文数:
0
引用数:
0
h-index:
0
机构:
江苏信息职业技术学院
江苏信息职业技术学院
王雪松
;
程玉虎
论文数:
0
引用数:
0
h-index:
0
机构:
江苏信息职业技术学院
江苏信息职业技术学院
程玉虎
;
祝强
论文数:
0
引用数:
0
h-index:
0
机构:
江苏信息职业技术学院
江苏信息职业技术学院
祝强
.
中国专利
:CN118378689A
,2024-07-23
[6]
用于目标控制的离线强化学习方法、装置和设备
[P].
论文数:
引用数:
h-index:
机构:
詹仙园
;
论文数:
引用数:
h-index:
机构:
徐浩然
;
李健雄
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
清华大学
李健雄
.
中国专利
:CN114186474B
,2025-05-09
[7]
迁移强化学习方法及装置、多任务强化学习方法及装置
[P].
张海超
论文数:
0
引用数:
0
h-index:
0
机构:
地平线机器人有限公司
地平线机器人有限公司
张海超
;
孙凌峰
论文数:
0
引用数:
0
h-index:
0
机构:
地平线机器人有限公司
地平线机器人有限公司
孙凌峰
;
徐伟
论文数:
0
引用数:
0
h-index:
0
机构:
地平线机器人有限公司
地平线机器人有限公司
徐伟
.
美国专利
:CN118171752A
,2024-06-11
[8]
基于双重正则化的离线联邦强化学习方法及装置
[P].
论文数:
引用数:
h-index:
机构:
任炬
;
岳晟
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
清华大学
岳晟
;
论文数:
引用数:
h-index:
机构:
张尧学
.
中国专利
:CN118211678A
,2024-06-18
[9]
一种基于行为动作生成的离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
张永爱
;
李海峰
论文数:
0
引用数:
0
h-index:
0
机构:
福州大学
福州大学
李海峰
;
论文数:
引用数:
h-index:
机构:
吴朝兴
;
论文数:
引用数:
h-index:
机构:
周雄图
;
论文数:
引用数:
h-index:
机构:
郭太良
.
中国专利
:CN119514639A
,2025-02-25
[10]
一种基于分数模型的离线强化学习方法
[P].
论文数:
引用数:
h-index:
机构:
李秀
;
刘泽源
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
刘泽源
;
方智睿
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
方智睿
;
吕加飞
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学深圳国际研究生院
清华大学深圳国际研究生院
吕加飞
.
中国专利
:CN120087446A
,2025-06-03
←
1
2
3
4
5
→