基于大语言模型的辅助分层强化学习训练方法及系统

被引:0
专利类型
发明
申请号
CN202411684419.3
申请日
2024-11-22
公开(公告)号
CN119514640B
公开(公告)日
2025-10-28
发明(设计)人
庞豹 李千溪 王江 宋勇 傅洪泽 许庆阳 袁宪锋 徐小龙
申请人
山东大学
申请人地址
264209 山东省威海市环翠区文化西路180
IPC主分类号
G06N3/092
IPC分类号
G06F18/214
代理机构
济南圣达知识产权代理有限公司 37221
代理人
李圣梅
法律状态
公开
国省代码
江苏省 常州市
引用
下载
收藏
共 50 条
[1]
基于大语言模型的辅助分层强化学习训练方法及系统 [P]. 
庞豹 ;
李千溪 ;
王江 ;
宋勇 ;
傅洪泽 ;
许庆阳 ;
袁宪锋 ;
徐小龙 .
中国专利 :CN119514640A ,2025-02-25
[2]
基于强化学习策略的大语言模型训练方法、装置和设备 [P]. 
文祎琳 ;
吕中厚 ;
陈沐晗 ;
包沉浮 ;
王国秋 ;
田伟娟 ;
颜廷玉 .
中国专利 :CN121031780A ,2025-11-28
[3]
基于强化学习的行业大语言模型训练方法及装置 [P]. 
陈舟 ;
白玉琪 .
中国专利 :CN120278270A ,2025-07-08
[4]
大语言模型的强化学习训练方法、装置、设备及存储介质 [P]. 
赵鑫 ;
陈志朋 ;
张鸿志 ;
张富峥 .
中国专利 :CN120387495A ,2025-07-29
[5]
一种大语言模型的强化学习训练方法及装置 [P]. 
周璟 ;
应缜哲 ;
鲍孝慈 ;
陈华 ;
孟昌华 ;
王维强 .
中国专利 :CN121168564A ,2025-12-19
[6]
一种大语言模型的强化学习训练方法及相关设备 [P]. 
霍亮宇 ;
杨青 .
中国专利 :CN119990303A ,2025-05-13
[7]
基于大语言模型及强化学习的智能客服系统 [P]. 
朱一琪 ;
周晔 ;
穆海洁 ;
石英伦 .
中国专利 :CN121051202A ,2025-12-02
[8]
基于因果大语言模型的强化学习决策优化方法、系统及设备 [P]. 
陈薇 ;
张家豪 ;
蔡瑞初 ;
郝志峰 ;
陈炳丰 ;
王丽娟 .
中国专利 :CN120911539A ,2025-11-07
[9]
基于强化学习训练语言模型的方法及装置 [P]. 
李佳晖 ;
张翰林 ;
张凤达 ;
张泰维 ;
况琨 ;
陈隆 ;
周俊 ;
薛思乔 .
中国专利 :CN119558428A ,2025-03-04
[10]
基于大模型的强化学习模型训练方法、设备及存储介质 [P]. 
严俊杰 ;
高华佐 ;
周亦庄 .
中国专利 :CN117764202A ,2024-03-26