基于动态稀疏性的大语言模型推理加速方法及系统

被引:0
专利类型
发明
申请号
CN202511794494.X
申请日
2025-12-02
公开(公告)号
CN121235130A
公开(公告)日
2025-12-30
发明(设计)人
蹇松雷 杨莹 余杰 李宝 张建锋 丁滟 谭霜 王怡琦 郭勇 王晓川
申请人
中国人民解放军国防科技大学
申请人地址
410073 湖南省长沙市开福区德雅路109号
IPC主分类号
G06N5/04
IPC分类号
G06N3/045 G06N3/0495 G06N3/0499 G06N3/082
代理机构
湖南兆弘专利事务所(普通合伙) 43008
代理人
谭武艺
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
基于稀疏滑动窗口的大语言模型推理加速方法及装置 [P]. 
刘玉国 ;
陈其宾 ;
姜凯 .
中国专利 :CN118132682A ,2024-06-04
[2]
基于大语言模型的推理加速方法、装置、介质及设备 [P]. 
梁成栋 ;
陈晓宇 .
:CN120764681A ,2025-10-10
[3]
基于大语言模型的智能推理方法及系统 [P]. 
刘辉 ;
朱伟杰 ;
刘军 ;
王晓晨 ;
徐晟 ;
邵贺 .
中国专利 :CN120106215A ,2025-06-06
[4]
基于大语言模型的智能推理方法及系统 [P]. 
刘辉 ;
朱伟杰 ;
刘军 ;
王晓晨 ;
徐晟 ;
邵贺 .
中国专利 :CN120106215B ,2025-10-28
[5]
基于动态显存压缩与内存异构的大语言模型推理加速方法及系统 [P]. 
蔡少敏 .
中国专利 :CN120371524A ,2025-07-25
[6]
一种基于参考的大语言模型推理加速方法及系统 [P]. 
仝其胜 ;
陈其宾 ;
姜凯 ;
李锐 .
中国专利 :CN118211649A ,2024-06-18
[7]
一种大语言模型推理加速方法及系统 [P]. 
赵策 ;
王亚 ;
屠静 ;
李伟伟 ;
周勤民 ;
张玥 ;
雷媛媛 ;
孙岩 ;
潘亮亮 .
中国专利 :CN118133969B ,2024-07-09
[8]
一种大语言模型推理加速方法及系统 [P]. 
赵策 ;
王亚 ;
屠静 ;
李伟伟 ;
周勤民 ;
张玥 ;
雷媛媛 ;
孙岩 ;
潘亮亮 .
中国专利 :CN118133969A ,2024-06-04
[9]
基于预测解码的大语言模型的推理加速方法及装置 [P]. 
段丽娟 ;
王叶 ;
毛润 ;
赵媛媛 ;
姜雨彤 ;
陈姝 ;
韩震 ;
李婧 ;
罗寅 .
中国专利 :CN118886511A ,2024-11-01
[10]
基于大语言模型投机采样推理的加速器硬件及加速方法 [P]. 
孙广宇 ;
李聪 .
中国专利 :CN117933401B ,2024-06-07