学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于大语言模型的辅助分层强化学习训练方法及系统
被引:0
专利类型
:
发明
申请号
:
CN202411684419.3
申请日
:
2024-11-22
公开(公告)号
:
CN119514640B
公开(公告)日
:
2025-10-28
发明(设计)人
:
庞豹
李千溪
王江
宋勇
傅洪泽
许庆阳
袁宪锋
徐小龙
申请人
:
山东大学
申请人地址
:
264209 山东省威海市环翠区文化西路180
IPC主分类号
:
G06N3/092
IPC分类号
:
G06F18/214
代理机构
:
济南圣达知识产权代理有限公司 37221
代理人
:
李圣梅
法律状态
:
公开
国省代码
:
江苏省 常州市
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2025-02-25
公开
公开
2025-03-14
实质审查的生效
实质审查的生效IPC(主分类):G06N 3/092申请日:20241122
2025-10-28
授权
授权
共 50 条
[1]
基于大语言模型的辅助分层强化学习训练方法及系统
[P].
论文数:
引用数:
h-index:
机构:
庞豹
;
李千溪
论文数:
0
引用数:
0
h-index:
0
机构:
山东大学
山东大学
李千溪
;
论文数:
引用数:
h-index:
机构:
王江
;
论文数:
引用数:
h-index:
机构:
宋勇
;
傅洪泽
论文数:
0
引用数:
0
h-index:
0
机构:
山东大学
山东大学
傅洪泽
;
论文数:
引用数:
h-index:
机构:
许庆阳
;
论文数:
引用数:
h-index:
机构:
袁宪锋
;
论文数:
引用数:
h-index:
机构:
徐小龙
.
中国专利
:CN119514640A
,2025-02-25
[2]
基于强化学习策略的大语言模型训练方法、装置和设备
[P].
文祎琳
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
文祎琳
;
吕中厚
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
吕中厚
;
陈沐晗
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
陈沐晗
;
包沉浮
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
包沉浮
;
王国秋
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
王国秋
;
田伟娟
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
田伟娟
;
颜廷玉
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
颜廷玉
.
中国专利
:CN121031780A
,2025-11-28
[3]
基于强化学习的行业大语言模型训练方法及装置
[P].
论文数:
引用数:
h-index:
机构:
陈舟
;
论文数:
引用数:
h-index:
机构:
白玉琪
.
中国专利
:CN120278270A
,2025-07-08
[4]
大语言模型的强化学习训练方法、装置、设备及存储介质
[P].
赵鑫
论文数:
0
引用数:
0
h-index:
0
机构:
北京达佳互联信息技术有限公司
北京达佳互联信息技术有限公司
赵鑫
;
陈志朋
论文数:
0
引用数:
0
h-index:
0
机构:
北京达佳互联信息技术有限公司
北京达佳互联信息技术有限公司
陈志朋
;
张鸿志
论文数:
0
引用数:
0
h-index:
0
机构:
北京达佳互联信息技术有限公司
北京达佳互联信息技术有限公司
张鸿志
;
张富峥
论文数:
0
引用数:
0
h-index:
0
机构:
北京达佳互联信息技术有限公司
北京达佳互联信息技术有限公司
张富峥
.
中国专利
:CN120387495A
,2025-07-29
[5]
一种大语言模型的强化学习训练方法及装置
[P].
周璟
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
周璟
;
应缜哲
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
应缜哲
;
鲍孝慈
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
鲍孝慈
;
陈华
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
陈华
;
孟昌华
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
孟昌华
;
王维强
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
王维强
.
中国专利
:CN121168564A
,2025-12-19
[6]
一种大语言模型的强化学习训练方法及相关设备
[P].
霍亮宇
论文数:
0
引用数:
0
h-index:
0
机构:
度小满科技(北京)有限公司
度小满科技(北京)有限公司
霍亮宇
;
杨青
论文数:
0
引用数:
0
h-index:
0
机构:
度小满科技(北京)有限公司
度小满科技(北京)有限公司
杨青
.
中国专利
:CN119990303A
,2025-05-13
[7]
基于大语言模型及强化学习的智能客服系统
[P].
朱一琪
论文数:
0
引用数:
0
h-index:
0
机构:
上海汇付支付有限公司
上海汇付支付有限公司
朱一琪
;
周晔
论文数:
0
引用数:
0
h-index:
0
机构:
上海汇付支付有限公司
上海汇付支付有限公司
周晔
;
穆海洁
论文数:
0
引用数:
0
h-index:
0
机构:
上海汇付支付有限公司
上海汇付支付有限公司
穆海洁
;
石英伦
论文数:
0
引用数:
0
h-index:
0
机构:
上海汇付支付有限公司
上海汇付支付有限公司
石英伦
.
中国专利
:CN121051202A
,2025-12-02
[8]
基于因果大语言模型的强化学习决策优化方法、系统及设备
[P].
论文数:
引用数:
h-index:
机构:
陈薇
;
张家豪
论文数:
0
引用数:
0
h-index:
0
机构:
广东工业大学
广东工业大学
张家豪
;
论文数:
引用数:
h-index:
机构:
蔡瑞初
;
论文数:
引用数:
h-index:
机构:
郝志峰
;
论文数:
引用数:
h-index:
机构:
陈炳丰
;
论文数:
引用数:
h-index:
机构:
王丽娟
.
中国专利
:CN120911539A
,2025-11-07
[9]
基于强化学习训练语言模型的方法及装置
[P].
李佳晖
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
李佳晖
;
张翰林
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
张翰林
;
张凤达
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
张凤达
;
张泰维
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
张泰维
;
况琨
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
况琨
;
陈隆
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
陈隆
;
周俊
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
周俊
;
薛思乔
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
薛思乔
.
中国专利
:CN119558428A
,2025-03-04
[10]
基于大模型的强化学习模型训练方法、设备及存储介质
[P].
严俊杰
论文数:
0
引用数:
0
h-index:
0
机构:
上海阶跃星辰智能科技有限公司
上海阶跃星辰智能科技有限公司
严俊杰
;
高华佐
论文数:
0
引用数:
0
h-index:
0
机构:
上海阶跃星辰智能科技有限公司
上海阶跃星辰智能科技有限公司
高华佐
;
周亦庄
论文数:
0
引用数:
0
h-index:
0
机构:
上海阶跃星辰智能科技有限公司
上海阶跃星辰智能科技有限公司
周亦庄
.
中国专利
:CN117764202A
,2024-03-26
←
1
2
3
4
5
→