用于大语言模型的强化学习的方法和装置

被引:0
专利类型
发明
申请号
CN202311866241.X
申请日
2023-12-29
公开(公告)号
CN117808120A
公开(公告)日
2024-04-02
发明(设计)人
阎栋 李佳莲
申请人
北京百川智能科技有限公司
申请人地址
100086 北京市海淀区中关村东路1号院8号楼15层B1701
IPC主分类号
G06N20/00
IPC分类号
G06F18/214
代理机构
北京市柳沈律师事务所 11105
代理人
张贵东
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
一种大语言模型的强化学习训练方法及相关设备 [P]. 
霍亮宇 ;
杨青 .
中国专利 :CN119990303A ,2025-05-13
[2]
大语言模型和强化学习模型的协同方法和装置 [P]. 
代季峰 .
中国专利 :CN118377848A ,2024-07-23
[3]
大语言模型和强化学习模型的协同方法和装置 [P]. 
代季峰 .
中国专利 :CN118377848B ,2024-10-11
[4]
大语言模型的强化学习训练方法、装置、设备及存储介质 [P]. 
赵鑫 ;
陈志朋 ;
张鸿志 ;
张富峥 .
中国专利 :CN120387495A ,2025-07-29
[5]
一种大语言模型的强化学习训练方法及装置 [P]. 
周璟 ;
应缜哲 ;
鲍孝慈 ;
陈华 ;
孟昌华 ;
王维强 .
中国专利 :CN121168564A ,2025-12-19
[6]
基于大语言模型和强化学习的决策方法、装置及设备 [P]. 
徐泽来 ;
于超 ;
汪玉 ;
吴翼 .
中国专利 :CN118260681A ,2024-06-28
[7]
基于强化学习的大语言模型安全保护防御方法和装置 [P]. 
何柯阳 ;
韩蒙 ;
孔德章 ;
林昶廷 ;
邢文鹏 ;
许海涛 ;
谢珍真 ;
马治国 .
中国专利 :CN120974512A ,2025-11-18
[8]
基于大语言模型和强化学习的多模态数据处理方法和装置 [P]. 
郝东林 ;
潘腾飞 .
中国专利 :CN119338011B ,2025-04-04
[9]
用于提升大语言模型数学能力的强化学习方法及相关装置 [P]. 
丁宁 ;
曾梓南 ;
王浩颖 ;
丁贞煜 ;
梁益铭 .
中国专利 :CN120832930A ,2025-10-24
[10]
基于大语言模型和强化学习的多模态数据处理方法和装置 [P]. 
郝东林 ;
潘腾飞 .
中国专利 :CN119338011A ,2025-01-21