键值缓存数据的调度方法、大模型推理方法及装置

被引:0
专利类型
发明
申请号
CN202510219153.3
申请日
2025-02-26
公开(公告)号
CN120276667B
公开(公告)日
2025-12-05
发明(设计)人
朱帅
申请人
上海芷锐电子科技有限公司
申请人地址
200100 上海市闵行区苏召路1628号
IPC主分类号
G06F3/06
IPC分类号
G06N5/04 G06N3/092
代理机构
北京超凡宏宇知识产权代理有限公司 11463
代理人
李光霞
法律状态
实质审查的生效
国省代码
上海市 市辖区
引用
下载
收藏
共 50 条
[1]
键值缓存数据的调度方法、大模型推理方法及装置 [P]. 
朱帅 .
中国专利 :CN120276667A ,2025-07-08
[2]
基于键值矩阵缓存的模型推理方法及装置、介质 [P]. 
汪玉 ;
洪可 ;
毛秋力 .
中国专利 :CN118036754B ,2024-06-18
[3]
基于键值矩阵缓存的模型推理方法及装置、介质 [P]. 
汪玉 ;
洪可 ;
毛秋力 .
中国专利 :CN118036754A ,2024-05-14
[4]
大语言模型的键值缓存管理、模型推理和数据处理方法及装置 [P]. 
张锐 ;
赵军平 .
中国专利 :CN118860573A ,2024-10-29
[5]
基于大模型推理的缓存清理方法及装置 [P]. 
鄂梅 ;
刘汉亮 ;
鲁海荣 .
中国专利 :CN120540583A ,2025-08-26
[6]
大模型推理中的缓存优化方法及装置 [P]. 
秦子然 ;
曹雨晨 ;
胡文 ;
李建国 .
中国专利 :CN119847437A ,2025-04-18
[7]
大模型推理集群的推理性能数据获取方法、装置及设备 [P]. 
钟日成 .
中国专利 :CN119718878A ,2025-03-28
[8]
大模型推理资源调度方法及调度器 [P]. 
王云浩 ;
郭青霄 .
中国专利 :CN120973517A ,2025-11-18
[9]
大模型的推理业务调度方法、装置、设备、介质及产品 [P]. 
郭振宇 .
中国专利 :CN120892197A ,2025-11-04
[10]
大模型推理方法、装置、设备及程序产品 [P]. 
姚凯 ;
李威 ;
余红亮 ;
李永超 ;
吴重亮 .
中国专利 :CN119416823B ,2025-04-11