大语言模型和强化学习模型的协同方法和装置

被引:0
专利类型
发明
申请号
CN202410798640.5
申请日
2024-06-20
公开(公告)号
CN118377848B
公开(公告)日
2024-10-11
发明(设计)人
代季峰
申请人
清华大学
申请人地址
100084 北京市海淀区清华园1号
IPC主分类号
G06F16/33
IPC分类号
G06F16/48 G06N3/092
代理机构
北京林达刘知识产权代理事务所(普通合伙) 11277
代理人
李茂家;周蕾
法律状态
实质审查的生效
国省代码
北京市 市辖区
引用
下载
收藏
共 50 条
[1]
大语言模型和强化学习模型的协同方法和装置 [P]. 
代季峰 .
中国专利 :CN118377848A ,2024-07-23
[2]
用于大语言模型的强化学习的方法和装置 [P]. 
阎栋 ;
李佳莲 .
中国专利 :CN117808120A ,2024-04-02
[3]
基于大语言模型和强化学习的决策方法、装置及设备 [P]. 
徐泽来 ;
于超 ;
汪玉 ;
吴翼 .
中国专利 :CN118260681A ,2024-06-28
[4]
基于强化学习的大语言模型安全保护防御方法和装置 [P]. 
何柯阳 ;
韩蒙 ;
孔德章 ;
林昶廷 ;
邢文鹏 ;
许海涛 ;
谢珍真 ;
马治国 .
中国专利 :CN120974512A ,2025-11-18
[5]
基于强化学习策略的大语言模型训练方法、装置和设备 [P]. 
文祎琳 ;
吕中厚 ;
陈沐晗 ;
包沉浮 ;
王国秋 ;
田伟娟 ;
颜廷玉 .
中国专利 :CN121031780A ,2025-11-28
[6]
基于大语言模型和深度强化学习的虚拟电厂调度方法 [P]. 
金俊安 ;
付蓉 ;
丁逸文 .
中国专利 :CN120671983A ,2025-09-19
[7]
基于大语言模型和强化学习算法的配方工艺优化方法 [P]. 
刘雨阳 ;
郭权玮 .
中国专利 :CN121072473A ,2025-12-05
[8]
基于大语言模型和强化学习的多模态数据处理方法和装置 [P]. 
郝东林 ;
潘腾飞 .
中国专利 :CN119338011B ,2025-04-04
[9]
基于大语言模型和强化学习的多模态数据处理方法和装置 [P]. 
郝东林 ;
潘腾飞 .
中国专利 :CN119338011A ,2025-01-21
[10]
基于多模态反馈与强化学习的大语言模型优化方法和装置 [P]. 
张逸伦 .
中国专利 :CN120386849A ,2025-07-29