基于动态管理模型参数的大模型推理加速方法及系统

被引:0
专利类型
发明
申请号
CN202411712814.8
申请日
2024-11-27
公开(公告)号
CN119883593A
公开(公告)日
2025-04-25
发明(设计)人
况首旭 程丽敏 李玲 陈睿智
申请人
中国科学院软件研究所
申请人地址
100190 北京市海淀区中关村南四街4号
IPC主分类号
G06F9/50
IPC分类号
G06F9/54 G06F9/445 G06F13/42 G06N5/04
代理机构
北京君尚知识产权代理有限公司 11200
代理人
余功勋
法律状态
公开
国省代码
北京市
引用
下载
收藏
共 50 条
[1]
基于动态管理模型参数的大模型推理加速方法及系统 [P]. 
况首旭 ;
程丽敏 ;
李玲 ;
陈睿智 .
中国专利 :CN119883593B ,2025-12-16
[2]
大模型推理加速的方法和系统 [P]. 
肖汉松 ;
郭春晓 ;
蒋佳弟 ;
岳赟 ;
魏鹏 ;
李嘉威 ;
赵洪文 ;
王国威 ;
张锐 ;
李金金 .
中国专利 :CN120087476A ,2025-06-03
[3]
边缘端大模型加速器和大模型推理系统 [P]. 
请求不公布姓名 ;
请求不公布姓名 ;
请求不公布姓名 .
中国专利 :CN121051331A ,2025-12-02
[4]
一种大语言模型推理加速方法及系统 [P]. 
赵策 ;
王亚 ;
屠静 ;
李伟伟 ;
周勤民 ;
张玥 ;
雷媛媛 ;
孙岩 ;
潘亮亮 .
中国专利 :CN118133969B ,2024-07-09
[5]
一种大语言模型推理加速方法及系统 [P]. 
赵策 ;
王亚 ;
屠静 ;
李伟伟 ;
周勤民 ;
张玥 ;
雷媛媛 ;
孙岩 ;
潘亮亮 .
中国专利 :CN118133969A ,2024-06-04
[6]
大模型推理加速的方法、装置及设备 [P]. 
陈昕 ;
高翔 ;
张宏 .
中国专利 :CN120952186A ,2025-11-14
[7]
一种大模型推理方法及基于大模型的推理设备 [P]. 
刘礼萍 ;
何明 ;
尹从丽 .
中国专利 :CN120338094A ,2025-07-18
[8]
基于自适应跳层的大模型推理加速系统及方法 [P]. 
郑臻哲 ;
姚以真 ;
何卓旻 ;
李沁雅 ;
吴帆 ;
陈贵海 .
中国专利 :CN119962666A ,2025-05-09
[9]
基于电力运检业务的大模型推理加速方法及系统 [P]. 
赵常威 ;
王署东 ;
柯艳国 ;
李坚林 ;
钱宇骋 ;
施雯 ;
潘超 ;
张强 ;
黄伟民 ;
谢铖 ;
甄超 ;
刘同阳 ;
李森林 .
中国专利 :CN117611133A ,2024-02-27
[10]
一种Serverless大模型推理服务加速方法 [P]. 
吴全旺 ;
刘昊文 ;
曾洁 ;
余树坤 ;
郭桃林 ;
陈超 ;
黄宏宇 ;
许金 ;
孙天昊 ;
夏云霓 .
中国专利 :CN121233257A ,2025-12-30