机械臂强化学习奖励确定方法及存储介质

被引:0
专利类型
发明
申请号
CN202510394932.7
申请日
2025-03-31
公开(公告)号
CN119952727B
公开(公告)日
2025-07-22
发明(设计)人
赵一诺 徐志远 车正平 伍堃 唐剑
申请人
北京人形机器人创新中心有限公司
申请人地址
101100 北京市通州区北京经济技术开发区(通州)经海五路3号院13号楼6层610
IPC主分类号
B25J9/16
IPC分类号
代理机构
北京超凡宏宇知识产权代理有限公司 11463
代理人
王思楠
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
机械臂强化学习奖励确定方法及存储介质 [P]. 
赵一诺 ;
徐志远 ;
车正平 ;
伍堃 ;
唐剑 .
中国专利 :CN119952727A ,2025-05-09
[2]
基于强化学习的机械臂控制方法、装置、电子设备及存储介质 [P]. 
关沛峰 .
中国专利 :CN115972186B ,2025-09-30
[3]
基于平均奖励强化学习的机械臂装配方法及系统 [P]. 
李衍杰 ;
牟涌金 ;
翁悦阳 ;
翟艺伟 ;
张潇鹏 .
中国专利 :CN121018563A ,2025-11-28
[4]
一种基于专家状态学习的机械臂无奖励强化学习方法 [P]. 
杨杰龙 ;
闫平 ;
黄道缘 ;
钟石峰 .
中国专利 :CN119526382A ,2025-02-28
[5]
一种基于专家状态学习的机械臂无奖励强化学习方法 [P]. 
杨杰龙 ;
闫平 ;
黄道缘 ;
钟石峰 .
中国专利 :CN119526382B ,2025-12-26
[6]
一种面向稀疏奖励的深度强化学习机械臂抓取方法 [P]. 
杨春雨 ;
李博论 ;
韩可可 ;
刘晓敏 ;
周林娜 ;
张鑫 ;
马磊 ;
王国庆 .
中国专利 :CN118493388A ,2024-08-16
[7]
用于机械臂强化学习运动规划的启发式奖励函数设计方法 [P]. 
白成超 ;
张家维 ;
郭继峰 .
中国专利 :CN113894787B ,2022-01-07
[8]
一种适用于移动机械臂的强化学习奖励方法 [P]. 
辛博 ;
朱冰清 ;
程旭 ;
陈春林 ;
马晶 .
中国专利 :CN111515961B ,2020-08-11
[9]
一种面向稀疏奖励的深度强化学习机械臂抓取方法 [P]. 
杨春雨 ;
李博论 ;
韩可可 ;
刘晓敏 ;
周林娜 ;
张鑫 ;
马磊 ;
王国庆 .
中国专利 :CN118493388B ,2025-03-11
[10]
基于强化学习的机械臂轨迹规划方法、装置、设备及介质 [P]. 
王硕 ;
刘磊 ;
薛浩田 ;
容潇伟 ;
吴文斌 ;
潘斌 ;
段正旭 .
中国专利 :CN120962646A ,2025-11-18