学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种基于专家状态学习的机械臂无奖励强化学习方法
被引:0
专利类型
:
发明
申请号
:
CN202411417122.0
申请日
:
2024-10-11
公开(公告)号
:
CN119526382B
公开(公告)日
:
2025-12-26
发明(设计)人
:
杨杰龙
闫平
黄道缘
钟石峰
申请人
:
江南大学
申请人地址
:
214000 江苏省无锡市梁溪区通沙路898号南楼七层
IPC主分类号
:
B25J9/16
IPC分类号
:
代理机构
:
南京禹为知识产权代理事务所(特殊普通合伙) 32272
代理人
:
张台玉
法律状态
:
实质审查的生效
国省代码
:
江苏省 无锡市
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2025-03-18
实质审查的生效
实质审查的生效IPC(主分类):B25J 9/16申请日:20241011
2025-02-28
公开
公开
2025-12-26
授权
授权
共 50 条
[1]
一种基于专家状态学习的机械臂无奖励强化学习方法
[P].
杨杰龙
论文数:
0
引用数:
0
h-index:
0
机构:
江南大学
江南大学
杨杰龙
;
论文数:
引用数:
h-index:
机构:
闫平
;
黄道缘
论文数:
0
引用数:
0
h-index:
0
机构:
江南大学
江南大学
黄道缘
;
钟石峰
论文数:
0
引用数:
0
h-index:
0
机构:
江南大学
江南大学
钟石峰
.
中国专利
:CN119526382A
,2025-02-28
[2]
基于专家经验的强化学习方法
[P].
曹江
论文数:
0
引用数:
0
h-index:
0
曹江
;
杨思明
论文数:
0
引用数:
0
h-index:
0
杨思明
;
高原
论文数:
0
引用数:
0
h-index:
0
高原
;
郭洋
论文数:
0
引用数:
0
h-index:
0
郭洋
;
王平
论文数:
0
引用数:
0
h-index:
0
王平
;
王景
论文数:
0
引用数:
0
h-index:
0
王景
;
王晓楠
论文数:
0
引用数:
0
h-index:
0
王晓楠
.
中国专利
:CN115511099A
,2022-12-23
[3]
基于并行架构的内在奖励强化学习方法
[P].
杨思明
论文数:
0
引用数:
0
h-index:
0
杨思明
;
曹江
论文数:
0
引用数:
0
h-index:
0
曹江
;
高原
论文数:
0
引用数:
0
h-index:
0
高原
;
郭洋
论文数:
0
引用数:
0
h-index:
0
郭洋
;
王平
论文数:
0
引用数:
0
h-index:
0
王平
;
王景
论文数:
0
引用数:
0
h-index:
0
王景
;
王晓楠
论文数:
0
引用数:
0
h-index:
0
王晓楠
.
中国专利
:CN114266360A
,2022-04-01
[4]
一种基于状态语义表征学习内在奖励的强化学习方法
[P].
王学谦
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
王学谦
;
余建慧
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
余建慧
;
姜加红
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
姜加红
;
尹奇跃
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
尹奇跃
;
常永哲
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
常永哲
;
冯渭春
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
冯渭春
.
中国专利
:CN118886476A
,2024-11-01
[5]
一种基于状态语义表征学习内在奖励的强化学习方法
[P].
王学谦
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
王学谦
;
余建慧
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
余建慧
;
姜加红
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
姜加红
;
尹奇跃
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
尹奇跃
;
常永哲
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
常永哲
;
冯渭春
论文数:
0
引用数:
0
h-index:
0
机构:
深圳清华大学研究院
深圳清华大学研究院
冯渭春
.
中国专利
:CN118886476B
,2024-11-29
[6]
一种基于强化学习的机械臂动态物体抓取方法
[P].
张诗笛
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
张诗笛
;
论文数:
引用数:
h-index:
机构:
毕运波
.
中国专利
:CN116945180B
,2025-12-26
[7]
一种面向稀疏奖励的深度强化学习机械臂抓取方法
[P].
论文数:
引用数:
h-index:
机构:
杨春雨
;
李博论
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学
中国矿业大学
李博论
;
韩可可
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学
中国矿业大学
韩可可
;
论文数:
引用数:
h-index:
机构:
刘晓敏
;
论文数:
引用数:
h-index:
机构:
周林娜
;
论文数:
引用数:
h-index:
机构:
张鑫
;
论文数:
引用数:
h-index:
机构:
马磊
;
论文数:
引用数:
h-index:
机构:
王国庆
.
中国专利
:CN118493388A
,2024-08-16
[8]
一种面向稀疏奖励的深度强化学习机械臂抓取方法
[P].
论文数:
引用数:
h-index:
机构:
杨春雨
;
李博论
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学
中国矿业大学
李博论
;
韩可可
论文数:
0
引用数:
0
h-index:
0
机构:
中国矿业大学
中国矿业大学
韩可可
;
论文数:
引用数:
h-index:
机构:
刘晓敏
;
论文数:
引用数:
h-index:
机构:
周林娜
;
论文数:
引用数:
h-index:
机构:
张鑫
;
论文数:
引用数:
h-index:
机构:
马磊
;
论文数:
引用数:
h-index:
机构:
王国庆
.
中国专利
:CN118493388B
,2025-03-11
[9]
基于状态压缩和无标注奖励的强化学习方法和系统
[P].
石浤澔
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
石浤澔
;
王宇航
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
王宇航
;
程龙恺
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
程龙恺
;
吴文莉
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
吴文莉
.
中国专利
:CN120494034A
,2025-08-15
[10]
基于状态压缩和无标注奖励的强化学习方法和系统
[P].
石浤澔
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
石浤澔
;
王宇航
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
王宇航
;
程龙恺
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
程龙恺
;
吴文莉
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
吴文莉
.
中国专利
:CN120494034B
,2025-10-03
←
1
2
3
4
5
→