学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于动态稀疏性的大语言模型推理加速方法及系统
被引:0
专利类型
:
发明
申请号
:
CN202511794494.X
申请日
:
2025-12-02
公开(公告)号
:
CN121235130A
公开(公告)日
:
2025-12-30
发明(设计)人
:
蹇松雷
杨莹
余杰
李宝
张建锋
丁滟
谭霜
王怡琦
郭勇
王晓川
申请人
:
中国人民解放军国防科技大学
申请人地址
:
410073 湖南省长沙市开福区德雅路109号
IPC主分类号
:
G06N5/04
IPC分类号
:
G06N3/045
G06N3/0495
G06N3/0499
G06N3/082
代理机构
:
湖南兆弘专利事务所(普通合伙) 43008
代理人
:
谭武艺
法律状态
:
公开
国省代码
:
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2025-12-30
公开
公开
共 50 条
[1]
基于稀疏滑动窗口的大语言模型推理加速方法及装置
[P].
刘玉国
论文数:
0
引用数:
0
h-index:
0
机构:
山东浪潮科学研究院有限公司
山东浪潮科学研究院有限公司
刘玉国
;
陈其宾
论文数:
0
引用数:
0
h-index:
0
机构:
山东浪潮科学研究院有限公司
山东浪潮科学研究院有限公司
陈其宾
;
姜凯
论文数:
0
引用数:
0
h-index:
0
机构:
山东浪潮科学研究院有限公司
山东浪潮科学研究院有限公司
姜凯
.
中国专利
:CN118132682A
,2024-06-04
[2]
基于大语言模型的推理加速方法、装置、介质及设备
[P].
梁成栋
论文数:
0
引用数:
0
h-index:
0
机构:
XG科技私人有限公司
XG科技私人有限公司
梁成栋
;
陈晓宇
论文数:
0
引用数:
0
h-index:
0
机构:
XG科技私人有限公司
XG科技私人有限公司
陈晓宇
.
:CN120764681A
,2025-10-10
[3]
基于大语言模型的智能推理方法及系统
[P].
刘辉
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
刘辉
;
朱伟杰
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
朱伟杰
;
刘军
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
刘军
;
王晓晨
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
王晓晨
;
徐晟
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
徐晟
;
邵贺
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
邵贺
.
中国专利
:CN120106215A
,2025-06-06
[4]
基于大语言模型的智能推理方法及系统
[P].
刘辉
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
刘辉
;
朱伟杰
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
朱伟杰
;
刘军
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
刘军
;
王晓晨
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
王晓晨
;
徐晟
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
徐晟
;
邵贺
论文数:
0
引用数:
0
h-index:
0
机构:
苏州网信信息科技股份有限公司
苏州网信信息科技股份有限公司
邵贺
.
中国专利
:CN120106215B
,2025-10-28
[5]
基于动态显存压缩与内存异构的大语言模型推理加速方法及系统
[P].
蔡少敏
论文数:
0
引用数:
0
h-index:
0
机构:
杭州尚乘英港数字科技有限公司
杭州尚乘英港数字科技有限公司
蔡少敏
.
中国专利
:CN120371524A
,2025-07-25
[6]
一种基于参考的大语言模型推理加速方法及系统
[P].
仝其胜
论文数:
0
引用数:
0
h-index:
0
机构:
山东浪潮科学研究院有限公司
山东浪潮科学研究院有限公司
仝其胜
;
陈其宾
论文数:
0
引用数:
0
h-index:
0
机构:
山东浪潮科学研究院有限公司
山东浪潮科学研究院有限公司
陈其宾
;
姜凯
论文数:
0
引用数:
0
h-index:
0
机构:
山东浪潮科学研究院有限公司
山东浪潮科学研究院有限公司
姜凯
;
李锐
论文数:
0
引用数:
0
h-index:
0
机构:
山东浪潮科学研究院有限公司
山东浪潮科学研究院有限公司
李锐
.
中国专利
:CN118211649A
,2024-06-18
[7]
一种大语言模型推理加速方法及系统
[P].
赵策
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
赵策
;
王亚
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
王亚
;
屠静
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
屠静
;
李伟伟
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
李伟伟
;
周勤民
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
周勤民
;
张玥
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
张玥
;
雷媛媛
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
雷媛媛
;
孙岩
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
孙岩
;
潘亮亮
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
潘亮亮
.
中国专利
:CN118133969B
,2024-07-09
[8]
一种大语言模型推理加速方法及系统
[P].
赵策
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
赵策
;
王亚
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
王亚
;
屠静
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
屠静
;
李伟伟
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
李伟伟
;
周勤民
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
周勤民
;
张玥
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
张玥
;
雷媛媛
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
雷媛媛
;
孙岩
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
孙岩
;
潘亮亮
论文数:
0
引用数:
0
h-index:
0
机构:
卓世未来(天津)科技有限公司
卓世未来(天津)科技有限公司
潘亮亮
.
中国专利
:CN118133969A
,2024-06-04
[9]
基于预测解码的大语言模型的推理加速方法及装置
[P].
段丽娟
论文数:
0
引用数:
0
h-index:
0
机构:
中国北方车辆研究所
中国北方车辆研究所
段丽娟
;
王叶
论文数:
0
引用数:
0
h-index:
0
机构:
中国北方车辆研究所
中国北方车辆研究所
王叶
;
毛润
论文数:
0
引用数:
0
h-index:
0
机构:
中国北方车辆研究所
中国北方车辆研究所
毛润
;
赵媛媛
论文数:
0
引用数:
0
h-index:
0
机构:
中国北方车辆研究所
中国北方车辆研究所
赵媛媛
;
姜雨彤
论文数:
0
引用数:
0
h-index:
0
机构:
中国北方车辆研究所
中国北方车辆研究所
姜雨彤
;
陈姝
论文数:
0
引用数:
0
h-index:
0
机构:
中国北方车辆研究所
中国北方车辆研究所
陈姝
;
韩震
论文数:
0
引用数:
0
h-index:
0
机构:
中国北方车辆研究所
中国北方车辆研究所
韩震
;
李婧
论文数:
0
引用数:
0
h-index:
0
机构:
中国北方车辆研究所
中国北方车辆研究所
李婧
;
罗寅
论文数:
0
引用数:
0
h-index:
0
机构:
中国北方车辆研究所
中国北方车辆研究所
罗寅
.
中国专利
:CN118886511A
,2024-11-01
[10]
基于大语言模型投机采样推理的加速器硬件及加速方法
[P].
论文数:
引用数:
h-index:
机构:
孙广宇
;
论文数:
引用数:
h-index:
机构:
李聪
.
中国专利
:CN117933401B
,2024-06-07
←
1
2
3
4
5
→