基于异构推理的模型推理加速方法、装置、设备及介质

被引:0
专利类型
发明
申请号
CN202510310399.1
申请日
2025-03-17
公开(公告)号
CN120197700A
公开(公告)日
2025-06-24
发明(设计)人
张钊宁 张立博 梅松竹 乔林波 田植良 李荣春 赖志权 黄震 李东升
申请人
中国人民解放军国防科技大学
申请人地址
410073 湖南省长沙市开福区德雅路109号
IPC主分类号
G06N5/04
IPC分类号
G06N3/0455 G06N3/084 G06F9/50
代理机构
北京集佳知识产权代理有限公司 11227
代理人
于蒙恩
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[21]
大模型推理加速的方法、装置及设备 [P]. 
陈昕 ;
高翔 ;
张宏 .
中国专利 :CN120952186A ,2025-11-14
[22]
推理模型的训练方法、推理方法及装置 [P]. 
庞超 ;
王硕寰 ;
孙宇 ;
李芝 .
中国专利 :CN113590782B ,2024-02-09
[23]
推理模型的训练方法、推理方法及装置 [P]. 
庞超 ;
王硕寰 ;
孙宇 ;
李芝 .
中国专利 :CN113590782A ,2021-11-02
[24]
推理板卡、基于推理板卡的推理方法、设备、介质和产品 [P]. 
郑路宽 ;
袁悦 ;
王辰 .
中国专利 :CN119047584A ,2024-11-29
[25]
推理板卡、基于推理板卡的推理方法、设备、介质和产品 [P]. 
郑路宽 ;
袁悦 ;
王辰 .
中国专利 :CN119047584B ,2025-02-28
[26]
模型推理方法、装置、设备以及存储介质 [P]. 
汪博筠 ;
张祥国 ;
吕梦思 ;
邓凯鹏 ;
党青青 ;
沙燕霖 ;
于佃海 ;
马艳军 .
中国专利 :CN121168627A ,2025-12-19
[27]
基于键值矩阵缓存的模型推理方法及装置、介质 [P]. 
汪玉 ;
洪可 ;
毛秋力 .
中国专利 :CN118036754B ,2024-06-18
[28]
基于键值矩阵缓存的模型推理方法及装置、介质 [P]. 
汪玉 ;
洪可 ;
毛秋力 .
中国专利 :CN118036754A ,2024-05-14
[29]
模型推理请求的调度方法及装置、设备和介质 [P]. 
任洪林 ;
胡鸣人 ;
袁正雄 ;
戴欣 ;
谢永康 ;
钱正宇 ;
施恩 .
中国专利 :CN120832232A ,2025-10-24
[30]
模型训练推理方法、装置、设备、介质及程序产品 [P]. 
郭爱鹏 ;
王路 ;
杨艳松 ;
李彤 ;
徐瑞杰 ;
陈少凡 .
中国专利 :CN119539075A ,2025-02-28