基于多模态反馈与强化学习的大语言模型优化方法和装置

被引:0
专利类型
发明
申请号
CN202510885917.2
申请日
2025-06-30
公开(公告)号
CN120386849A
公开(公告)日
2025-07-29
发明(设计)人
张逸伦
申请人
海盐县南北湖医学人工智能研究院 提示词科技(杭州)有限责任公司
申请人地址
314399 浙江省嘉兴市海盐县武原街道谢家路1479号7楼
IPC主分类号
G06F16/3329
IPC分类号
G06F16/334 G06F18/214 G06F18/23 G06N3/092
代理机构
北京唯智勤实知识产权代理事务所(普通合伙) 11557
代理人
鲍斌
法律状态
实质审查的生效
国省代码
引用
下载
收藏
共 50 条
[1]
基于多模态反馈与强化学习的大语言模型优化方法和装置 [P]. 
张逸伦 .
中国专利 :CN120386849B ,2025-09-12
[2]
基于大语言模型和强化学习的多模态数据处理方法和装置 [P]. 
郝东林 ;
潘腾飞 .
中国专利 :CN119338011B ,2025-04-04
[3]
基于大语言模型和强化学习的多模态数据处理方法和装置 [P]. 
郝东林 ;
潘腾飞 .
中国专利 :CN119338011A ,2025-01-21
[4]
基于大语言模型和强化学习算法的配方工艺优化方法 [P]. 
刘雨阳 ;
郭权玮 .
中国专利 :CN121072473A ,2025-12-05
[5]
用于大语言模型的强化学习的方法和装置 [P]. 
阎栋 ;
李佳莲 .
中国专利 :CN117808120A ,2024-04-02
[6]
大语言模型和强化学习模型的协同方法和装置 [P]. 
代季峰 .
中国专利 :CN118377848A ,2024-07-23
[7]
大语言模型和强化学习模型的协同方法和装置 [P]. 
代季峰 .
中国专利 :CN118377848B ,2024-10-11
[8]
基于大语言模型和强化学习的决策方法、装置及设备 [P]. 
徐泽来 ;
于超 ;
汪玉 ;
吴翼 .
中国专利 :CN118260681A ,2024-06-28
[9]
基于强化学习的大语言模型安全保护防御方法和装置 [P]. 
何柯阳 ;
韩蒙 ;
孔德章 ;
林昶廷 ;
邢文鹏 ;
许海涛 ;
谢珍真 ;
马治国 .
中国专利 :CN120974512A ,2025-11-18
[10]
基于大语言模型的多智能体强化学习探索方法及装置 [P]. 
季向阳 ;
曲云 ;
王博源 ;
蒋雨航 ;
邵键准 ;
刘畅 ;
王琦 .
中国专利 :CN118333183A ,2024-07-12