奖励模型的训练方法、装置、电子设备及存储介质

被引:0
专利类型
发明
申请号
CN202410658642.4
申请日
2024-05-24
公开(公告)号
CN118656607A
公开(公告)日
2024-09-17
发明(设计)人
胡羽蓝 李卿阳 陈凯辉 张富峥
申请人
北京达佳互联信息技术有限公司
申请人地址
100085 北京市海淀区西二旗西路16号院12号楼8层101
IPC主分类号
G06F18/21
IPC分类号
G06F18/214 G06F18/25
代理机构
北京三高永信知识产权代理有限责任公司 11138
代理人
陈芝
法律状态
实质审查的生效
国省代码
北京市 市辖区
引用
下载
收藏
共 50 条
[1]
模型训练方法、装置、电子设备及存储介质 [P]. 
李方圆 .
中国专利 :CN116821324B ,2025-11-04
[2]
语言模型训练方法、奖励模型训练方法、装置及电子设备 [P]. 
柴业坤 ;
王硕寰 ;
孙宇 .
中国专利 :CN117273117B ,2025-08-22
[3]
模型训练方法、装置、电子设备及存储介质 [P]. 
许靳昌 .
中国专利 :CN118098274A ,2024-05-28
[4]
模型训练方法、装置、电子设备及存储介质 [P]. 
许靳昌 .
中国专利 :CN118098274B ,2024-07-23
[5]
大语言模型的训练方法、装置、电子设备以及存储介质 [P]. 
霍亮宇 .
中国专利 :CN120851106A ,2025-10-28
[6]
大语言模型的训练方法、装置、电子设备及存储介质 [P]. 
李涓子 ;
齐韵嘉 ;
彭皓 ;
王晓智 ;
许斌 ;
侯磊 .
中国专利 :CN119647586B ,2025-11-28
[7]
大语言模型的训练方法、装置、电子设备及存储介质 [P]. 
李涓子 ;
齐韵嘉 ;
彭皓 ;
王晓智 ;
许斌 ;
侯磊 .
中国专利 :CN119647586A ,2025-03-18
[8]
大语言模型的训练方法、装置、电子设备及存储介质 [P]. 
郑露静 ;
刘汀 ;
方泽阳 ;
贺思俊 ;
刘毅 ;
陈泽裕 ;
于佃海 ;
马艳军 .
中国专利 :CN118673324A ,2024-09-20
[9]
语言模型训练方法、装置、电子设备及存储介质 [P]. 
田鑫 ;
陈泽裕 ;
熊昊一 ;
王雅晴 .
中国专利 :CN115062718A ,2022-09-16
[10]
网络模型的训练方法及装置、存储介质、电子设备 [P]. 
梁燕 ;
梁伟 .
中国专利 :CN119761460A ,2025-04-04