一种基于专家状态学习的机械臂无奖励强化学习方法

被引：0

专利类型：

发明

申请号：

CN202411417122.0

申请日：

2024-10-11

公开(公告)号：

CN119526382B

公开(公告)日：

2025-12-26

发明(设计)人：

杨杰龙闫平黄道缘钟石峰

申请人：

江南大学

申请人地址：

214000 江苏省无锡市梁溪区通沙路898号南楼七层

IPC主分类号：

B25J9/16

IPC分类号：

代理机构：

南京禹为知识产权代理事务所(特殊普通合伙) 32272

代理人：

张台玉

法律状态：

实质审查的生效

国省代码：

江苏省无锡市

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2025-03-18	实质审查的生效	实质审查的生效IPC(主分类):B25J 9/16申请日:20241011
2025-02-28	公开	公开
2025-12-26	授权	授权

共 50 条

[1]

一种基于专家状态学习的机械臂无奖励强化学习方法 [P].

杨杰龙 ;

闫平 ;

黄道缘 ;

钟石峰 .

中国专利 :CN119526382A ,2025-02-28

[2]

基于专家经验的强化学习方法 [P].

曹江 ;

杨思明 ;

高原 ;

郭洋 ;

王平 ;

王景 ;

王晓楠 .

中国专利 :CN115511099A ,2022-12-23

[3]

基于并行架构的内在奖励强化学习方法 [P].

杨思明 ;

曹江 ;

高原 ;

郭洋 ;

王平 ;

王景 ;

王晓楠 .

中国专利 :CN114266360A ,2022-04-01

[4]

一种基于状态语义表征学习内在奖励的强化学习方法 [P].

王学谦 ;

余建慧 ;

姜加红 ;

尹奇跃 ;

常永哲 ;

冯渭春 .

中国专利 :CN118886476A ,2024-11-01

[5]

一种基于状态语义表征学习内在奖励的强化学习方法 [P].

王学谦 ;

余建慧 ;

姜加红 ;

尹奇跃 ;

常永哲 ;

冯渭春 .

中国专利 :CN118886476B ,2024-11-29

[6]

一种基于强化学习的机械臂动态物体抓取方法 [P].

张诗笛 ;

毕运波 .

中国专利 :CN116945180B ,2025-12-26

[7]

一种面向稀疏奖励的深度强化学习机械臂抓取方法 [P].

杨春雨 ;

李博论 ;

韩可可 ;

刘晓敏 ;

周林娜 ;

张鑫 ;

马磊 ;

王国庆 .

中国专利 :CN118493388A ,2024-08-16

[8]

一种面向稀疏奖励的深度强化学习机械臂抓取方法 [P].

杨春雨 ;

李博论 ;

韩可可 ;

刘晓敏 ;

周林娜 ;

张鑫 ;

马磊 ;

王国庆 .

中国专利 :CN118493388B ,2025-03-11

[9]

基于状态压缩和无标注奖励的强化学习方法和系统 [P].

石浤澔 ;

王宇航 ;

程龙恺 ;

吴文莉 .

中国专利 :CN120494034A ,2025-08-15

[10]

基于状态压缩和无标注奖励的强化学习方法和系统 [P].

石浤澔 ;

王宇航 ;

程龙恺 ;

吴文莉 .

中国专利 :CN120494034B ,2025-10-03

← 1 2 3 4 5 →