基于动态显存压缩与内存异构的大语言模型推理加速方法及系统

被引:0
专利类型
发明
申请号
CN202510494275.3
申请日
2025-04-20
公开(公告)号
CN120371524A
公开(公告)日
2025-07-25
发明(设计)人
蔡少敏
申请人
杭州尚乘英港数字科技有限公司
申请人地址
310000 浙江省杭州市上城区紫金观巷26号304室
IPC主分类号
G06F9/50
IPC分类号
G06N5/04 G06N3/0495 G06N3/0455 G06N3/08
代理机构
代理人
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
基于动态稀疏性的大语言模型推理加速方法及系统 [P]. 
蹇松雷 ;
杨莹 ;
余杰 ;
李宝 ;
张建锋 ;
丁滟 ;
谭霜 ;
王怡琦 ;
郭勇 ;
王晓川 .
中国专利 :CN121235130A ,2025-12-30
[2]
一种大语言模型推理加速方法及系统 [P]. 
赵策 ;
王亚 ;
屠静 ;
李伟伟 ;
周勤民 ;
张玥 ;
雷媛媛 ;
孙岩 ;
潘亮亮 .
中国专利 :CN118133969B ,2024-07-09
[3]
一种大语言模型推理加速方法及系统 [P]. 
赵策 ;
王亚 ;
屠静 ;
李伟伟 ;
周勤民 ;
张玥 ;
雷媛媛 ;
孙岩 ;
潘亮亮 .
中国专利 :CN118133969A ,2024-06-04
[4]
基于大语言模型的推理加速方法、装置、介质及设备 [P]. 
梁成栋 ;
陈晓宇 .
:CN120764681A ,2025-10-10
[5]
基于大语言模型的智能推理方法及系统 [P]. 
刘辉 ;
朱伟杰 ;
刘军 ;
王晓晨 ;
徐晟 ;
邵贺 .
中国专利 :CN120106215A ,2025-06-06
[6]
基于大语言模型的智能推理方法及系统 [P]. 
刘辉 ;
朱伟杰 ;
刘军 ;
王晓晨 ;
徐晟 ;
邵贺 .
中国专利 :CN120106215B ,2025-10-28
[7]
一种基于参考的大语言模型推理加速方法及系统 [P]. 
仝其胜 ;
陈其宾 ;
姜凯 ;
李锐 .
中国专利 :CN118211649A ,2024-06-18
[8]
基于预测解码的大语言模型的推理加速方法及装置 [P]. 
段丽娟 ;
王叶 ;
毛润 ;
赵媛媛 ;
姜雨彤 ;
陈姝 ;
韩震 ;
李婧 ;
罗寅 .
中国专利 :CN118886511A ,2024-11-01
[9]
基于动态管理模型参数的大模型推理加速方法及系统 [P]. 
况首旭 ;
程丽敏 ;
李玲 ;
陈睿智 .
中国专利 :CN119883593A ,2025-04-25
[10]
基于动态管理模型参数的大模型推理加速方法及系统 [P]. 
况首旭 ;
程丽敏 ;
李玲 ;
陈睿智 .
中国专利 :CN119883593B ,2025-12-16