一种基于专家状态学习的机械臂无奖励强化学习方法

被引:0
专利类型
发明
申请号
CN202411417122.0
申请日
2024-10-11
公开(公告)号
CN119526382B
公开(公告)日
2025-12-26
发明(设计)人
杨杰龙 闫平 黄道缘 钟石峰
申请人
江南大学
申请人地址
214000 江苏省无锡市梁溪区通沙路898号南楼七层
IPC主分类号
B25J9/16
IPC分类号
代理机构
南京禹为知识产权代理事务所(特殊普通合伙) 32272
代理人
张台玉
法律状态
实质审查的生效
国省代码
江苏省 无锡市
引用
下载
收藏
共 50 条
[1]
一种基于专家状态学习的机械臂无奖励强化学习方法 [P]. 
杨杰龙 ;
闫平 ;
黄道缘 ;
钟石峰 .
中国专利 :CN119526382A ,2025-02-28
[2]
基于专家经验的强化学习方法 [P]. 
曹江 ;
杨思明 ;
高原 ;
郭洋 ;
王平 ;
王景 ;
王晓楠 .
中国专利 :CN115511099A ,2022-12-23
[3]
基于并行架构的内在奖励强化学习方法 [P]. 
杨思明 ;
曹江 ;
高原 ;
郭洋 ;
王平 ;
王景 ;
王晓楠 .
中国专利 :CN114266360A ,2022-04-01
[4]
一种基于状态语义表征学习内在奖励的强化学习方法 [P]. 
王学谦 ;
余建慧 ;
姜加红 ;
尹奇跃 ;
常永哲 ;
冯渭春 .
中国专利 :CN118886476A ,2024-11-01
[5]
一种基于状态语义表征学习内在奖励的强化学习方法 [P]. 
王学谦 ;
余建慧 ;
姜加红 ;
尹奇跃 ;
常永哲 ;
冯渭春 .
中国专利 :CN118886476B ,2024-11-29
[6]
一种基于强化学习的机械臂动态物体抓取方法 [P]. 
张诗笛 ;
毕运波 .
中国专利 :CN116945180B ,2025-12-26
[7]
一种面向稀疏奖励的深度强化学习机械臂抓取方法 [P]. 
杨春雨 ;
李博论 ;
韩可可 ;
刘晓敏 ;
周林娜 ;
张鑫 ;
马磊 ;
王国庆 .
中国专利 :CN118493388A ,2024-08-16
[8]
一种面向稀疏奖励的深度强化学习机械臂抓取方法 [P]. 
杨春雨 ;
李博论 ;
韩可可 ;
刘晓敏 ;
周林娜 ;
张鑫 ;
马磊 ;
王国庆 .
中国专利 :CN118493388B ,2025-03-11
[9]
基于状态压缩和无标注奖励的强化学习方法和系统 [P]. 
石浤澔 ;
王宇航 ;
程龙恺 ;
吴文莉 .
中国专利 :CN120494034A ,2025-08-15
[10]
基于状态压缩和无标注奖励的强化学习方法和系统 [P]. 
石浤澔 ;
王宇航 ;
程龙恺 ;
吴文莉 .
中国专利 :CN120494034B ,2025-10-03