大语言模型和强化学习模型的协同方法和装置

被引：0

专利类型：

发明

申请号：

CN202410798640.5

申请日：

2024-06-20

公开(公告)号：

CN118377848B

公开(公告)日：

2024-10-11

发明(设计)人：

代季峰

申请人：

清华大学

申请人地址：

100084 北京市海淀区清华园1号

IPC主分类号：

G06F16/33

IPC分类号：

G06F16/48 G06N3/092

代理机构：

北京林达刘知识产权代理事务所(普通合伙) 11277

代理人：

李茂家;周蕾

法律状态：

实质审查的生效

国省代码：

北京市市辖区

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2024-08-09	实质审查的生效	实质审查的生效IPC(主分类):G06F 16/33申请日:20240620
2024-10-11	授权	授权
2024-07-23	公开	公开

共 50 条

[1]

大语言模型和强化学习模型的协同方法和装置 [P].

代季峰 .

中国专利 :CN118377848A ,2024-07-23

[2]

用于大语言模型的强化学习的方法和装置 [P].

阎栋 ;

李佳莲 .

中国专利 :CN117808120A ,2024-04-02

[3]

基于大语言模型和强化学习的决策方法、装置及设备 [P].

徐泽来 ;

于超 ;

汪玉 ;

吴翼 .

中国专利 :CN118260681A ,2024-06-28

[4]

基于强化学习的大语言模型安全保护防御方法和装置 [P].

何柯阳 ;

韩蒙 ;

孔德章 ;

林昶廷 ;

邢文鹏 ;

许海涛 ;

谢珍真 ;

马治国 .

中国专利 :CN120974512A ,2025-11-18

[5]

基于强化学习策略的大语言模型训练方法、装置和设备 [P].

文祎琳 ;

吕中厚 ;

陈沐晗 ;

包沉浮 ;

王国秋 ;

田伟娟 ;

颜廷玉 .

中国专利 :CN121031780A ,2025-11-28

[6]

基于大语言模型和深度强化学习的虚拟电厂调度方法 [P].

金俊安 ;

付蓉 ;

丁逸文 .

中国专利 :CN120671983A ,2025-09-19

[7]

基于大语言模型和强化学习算法的配方工艺优化方法 [P].

刘雨阳 ;

郭权玮 .

中国专利 :CN121072473A ,2025-12-05

[8]

基于大语言模型和强化学习的多模态数据处理方法和装置 [P].

郝东林 ;

潘腾飞 .

中国专利 :CN119338011B ,2025-04-04

[9]

基于大语言模型和强化学习的多模态数据处理方法和装置 [P].

郝东林 ;

潘腾飞 .

中国专利 :CN119338011A ,2025-01-21

[10]

基于多模态反馈与强化学习的大语言模型优化方法和装置 [P].

张逸伦 .

中国专利 :CN120386849A ,2025-07-29

← 1 2 3 4 5 →