大模型推理效能动态优化与硬件感知压缩方法

被引:0
专利类型
发明
申请号
CN202510983404.5
申请日
2025-07-17
公开(公告)号
CN120494006B
公开(公告)日
2025-09-12
发明(设计)人
何芳 随倩轶 张伟 王照亭 杨帆 吴金凤 王迎雪 吴琨
申请人
红有软件股份有限公司
申请人地址
834099 新疆维吾尔自治区克拉玛依市克拉玛依区吉云路197-2号
IPC主分类号
G06N3/0495
IPC分类号
G06N3/0455 G06N3/042 G06N3/0464 G06N3/0442 G06N3/084 G06N3/092 G06N3/096 G06N3/063 G06N5/04 G06F9/50 G06F18/25 G06F18/2415 G06N3/048 G06F11/30
代理机构
合肥正嘉知识产权代理事务所(普通合伙) 34412
代理人
曲志强
法律状态
实质审查的生效
国省代码
新疆维吾尔自治区 克拉玛依市
引用
下载
收藏
共 50 条
[1]
大模型推理效能动态优化与硬件感知压缩方法 [P]. 
何芳 ;
随倩轶 ;
张伟 ;
王照亭 ;
杨帆 ;
吴金凤 ;
王迎雪 ;
吴琨 .
中国专利 :CN120494006A ,2025-08-15
[2]
异构硬件环境大模型推理引擎装置 [P]. 
翟士丹 ;
万澎江 ;
周同生 ;
邓德亮 .
中国专利 :CN120069057A ,2025-05-30
[3]
一种硬件感知的动态模型压缩方法及系统 [P]. 
郝虹 ;
刘敏 ;
郝运凯 .
中国专利 :CN120579593A ,2025-09-02
[4]
面向大模型推理的GPU资源调度与优化方法 [P]. 
李肯立 ;
吴伟俊 ;
刘楚波 ;
周旭 ;
肖国庆 ;
丁岩 ;
王昊天 ;
张靖 ;
纪生义 ;
阳王东 ;
唐卓 .
中国专利 :CN120780480A ,2025-10-14
[5]
基于稀疏化剪枝的大模型动态压缩优化方法及系统 [P]. 
沈寓实 ;
郭哲滔 ;
兰健 ;
刘星妍 .
中国专利 :CN121119020A ,2025-12-12
[6]
基于令牌感知与李雅普诺夫优化的分布式大模型推理方法 [P]. 
王方鑫 ;
钟奕菲 ;
吴攀龙 ;
崔曙光 .
中国专利 :CN121031801A ,2025-11-28
[7]
时序稀疏与动态反馈的多模态大模型推理方法 [P]. 
李少杰 ;
施钧辉 ;
郝永富 ;
王若凡 ;
赵嘉琪 .
中国专利 :CN120599384A ,2025-09-05
[8]
时序稀疏与动态反馈的多模态大模型推理方法 [P]. 
李少杰 ;
施钧辉 ;
郝永富 ;
王若凡 ;
赵嘉琪 .
中国专利 :CN120599384B ,2025-10-21
[9]
一种支持碎片感知与弹性分块的大语言模型动态推理系统 [P]. 
赵敬轩 ;
才振功 ;
丁宇 ;
施凯 ;
张振 ;
曾凡松 ;
杨波威 .
中国专利 :CN121092302A ,2025-12-09
[10]
基于专家模块动态调度的MoE大模型推理优化方法及装置 [P]. 
李渝 ;
周游 ;
卓成 ;
尹勋钊 .
中国专利 :CN120996204A ,2025-11-21