学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
大模型推理效能动态优化与硬件感知压缩方法
被引:0
专利类型
:
发明
申请号
:
CN202510983404.5
申请日
:
2025-07-17
公开(公告)号
:
CN120494006B
公开(公告)日
:
2025-09-12
发明(设计)人
:
何芳
随倩轶
张伟
王照亭
杨帆
吴金凤
王迎雪
吴琨
申请人
:
红有软件股份有限公司
申请人地址
:
834099 新疆维吾尔自治区克拉玛依市克拉玛依区吉云路197-2号
IPC主分类号
:
G06N3/0495
IPC分类号
:
G06N3/0455
G06N3/042
G06N3/0464
G06N3/0442
G06N3/084
G06N3/092
G06N3/096
G06N3/063
G06N5/04
G06F9/50
G06F18/25
G06F18/2415
G06N3/048
G06F11/30
代理机构
:
合肥正嘉知识产权代理事务所(普通合伙) 34412
代理人
:
曲志强
法律状态
:
实质审查的生效
国省代码
:
新疆维吾尔自治区 克拉玛依市
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2025-09-02
实质审查的生效
实质审查的生效IPC(主分类):G06N 3/0495申请日:20250717
2025-09-12
授权
授权
2025-08-15
公开
公开
共 50 条
[1]
大模型推理效能动态优化与硬件感知压缩方法
[P].
何芳
论文数:
0
引用数:
0
h-index:
0
机构:
红有软件股份有限公司
红有软件股份有限公司
何芳
;
随倩轶
论文数:
0
引用数:
0
h-index:
0
机构:
红有软件股份有限公司
红有软件股份有限公司
随倩轶
;
张伟
论文数:
0
引用数:
0
h-index:
0
机构:
红有软件股份有限公司
红有软件股份有限公司
张伟
;
王照亭
论文数:
0
引用数:
0
h-index:
0
机构:
红有软件股份有限公司
红有软件股份有限公司
王照亭
;
杨帆
论文数:
0
引用数:
0
h-index:
0
机构:
红有软件股份有限公司
红有软件股份有限公司
杨帆
;
吴金凤
论文数:
0
引用数:
0
h-index:
0
机构:
红有软件股份有限公司
红有软件股份有限公司
吴金凤
;
王迎雪
论文数:
0
引用数:
0
h-index:
0
机构:
红有软件股份有限公司
红有软件股份有限公司
王迎雪
;
吴琨
论文数:
0
引用数:
0
h-index:
0
机构:
红有软件股份有限公司
红有软件股份有限公司
吴琨
.
中国专利
:CN120494006A
,2025-08-15
[2]
异构硬件环境大模型推理引擎装置
[P].
翟士丹
论文数:
0
引用数:
0
h-index:
0
机构:
北京海致科技集团股份有限公司
北京海致科技集团股份有限公司
翟士丹
;
万澎江
论文数:
0
引用数:
0
h-index:
0
机构:
北京海致科技集团股份有限公司
北京海致科技集团股份有限公司
万澎江
;
周同生
论文数:
0
引用数:
0
h-index:
0
机构:
北京海致科技集团股份有限公司
北京海致科技集团股份有限公司
周同生
;
邓德亮
论文数:
0
引用数:
0
h-index:
0
机构:
北京海致科技集团股份有限公司
北京海致科技集团股份有限公司
邓德亮
.
中国专利
:CN120069057A
,2025-05-30
[3]
一种硬件感知的动态模型压缩方法及系统
[P].
郝虹
论文数:
0
引用数:
0
h-index:
0
机构:
山东浪潮科学研究院有限公司
山东浪潮科学研究院有限公司
郝虹
;
刘敏
论文数:
0
引用数:
0
h-index:
0
机构:
山东浪潮科学研究院有限公司
山东浪潮科学研究院有限公司
刘敏
;
郝运凯
论文数:
0
引用数:
0
h-index:
0
机构:
山东浪潮科学研究院有限公司
山东浪潮科学研究院有限公司
郝运凯
.
中国专利
:CN120579593A
,2025-09-02
[4]
面向大模型推理的GPU资源调度与优化方法
[P].
论文数:
引用数:
h-index:
机构:
李肯立
;
吴伟俊
论文数:
0
引用数:
0
h-index:
0
机构:
湖南大学
湖南大学
吴伟俊
;
论文数:
引用数:
h-index:
机构:
刘楚波
;
论文数:
引用数:
h-index:
机构:
周旭
;
论文数:
引用数:
h-index:
机构:
肖国庆
;
论文数:
引用数:
h-index:
机构:
丁岩
;
论文数:
引用数:
h-index:
机构:
王昊天
;
论文数:
引用数:
h-index:
机构:
张靖
;
纪生义
论文数:
0
引用数:
0
h-index:
0
机构:
湖南大学
湖南大学
纪生义
;
论文数:
引用数:
h-index:
机构:
阳王东
;
论文数:
引用数:
h-index:
机构:
唐卓
.
中国专利
:CN120780480A
,2025-10-14
[5]
基于稀疏化剪枝的大模型动态压缩优化方法及系统
[P].
沈寓实
论文数:
0
引用数:
0
h-index:
0
机构:
飞诺门阵(北京)科技有限公司
飞诺门阵(北京)科技有限公司
沈寓实
;
郭哲滔
论文数:
0
引用数:
0
h-index:
0
机构:
飞诺门阵(北京)科技有限公司
飞诺门阵(北京)科技有限公司
郭哲滔
;
兰健
论文数:
0
引用数:
0
h-index:
0
机构:
飞诺门阵(北京)科技有限公司
飞诺门阵(北京)科技有限公司
兰健
;
刘星妍
论文数:
0
引用数:
0
h-index:
0
机构:
飞诺门阵(北京)科技有限公司
飞诺门阵(北京)科技有限公司
刘星妍
.
中国专利
:CN121119020A
,2025-12-12
[6]
基于令牌感知与李雅普诺夫优化的分布式大模型推理方法
[P].
王方鑫
论文数:
0
引用数:
0
h-index:
0
机构:
深圳市未来智联网络研究院
深圳市未来智联网络研究院
王方鑫
;
钟奕菲
论文数:
0
引用数:
0
h-index:
0
机构:
深圳市未来智联网络研究院
深圳市未来智联网络研究院
钟奕菲
;
吴攀龙
论文数:
0
引用数:
0
h-index:
0
机构:
深圳市未来智联网络研究院
深圳市未来智联网络研究院
吴攀龙
;
崔曙光
论文数:
0
引用数:
0
h-index:
0
机构:
深圳市未来智联网络研究院
深圳市未来智联网络研究院
崔曙光
.
中国专利
:CN121031801A
,2025-11-28
[7]
时序稀疏与动态反馈的多模态大模型推理方法
[P].
李少杰
论文数:
0
引用数:
0
h-index:
0
机构:
之江实验室
之江实验室
李少杰
;
施钧辉
论文数:
0
引用数:
0
h-index:
0
机构:
之江实验室
之江实验室
施钧辉
;
郝永富
论文数:
0
引用数:
0
h-index:
0
机构:
之江实验室
之江实验室
郝永富
;
王若凡
论文数:
0
引用数:
0
h-index:
0
机构:
之江实验室
之江实验室
王若凡
;
赵嘉琪
论文数:
0
引用数:
0
h-index:
0
机构:
之江实验室
之江实验室
赵嘉琪
.
中国专利
:CN120599384A
,2025-09-05
[8]
时序稀疏与动态反馈的多模态大模型推理方法
[P].
李少杰
论文数:
0
引用数:
0
h-index:
0
机构:
之江实验室
之江实验室
李少杰
;
施钧辉
论文数:
0
引用数:
0
h-index:
0
机构:
之江实验室
之江实验室
施钧辉
;
郝永富
论文数:
0
引用数:
0
h-index:
0
机构:
之江实验室
之江实验室
郝永富
;
王若凡
论文数:
0
引用数:
0
h-index:
0
机构:
之江实验室
之江实验室
王若凡
;
赵嘉琪
论文数:
0
引用数:
0
h-index:
0
机构:
之江实验室
之江实验室
赵嘉琪
.
中国专利
:CN120599384B
,2025-10-21
[9]
一种支持碎片感知与弹性分块的大语言模型动态推理系统
[P].
赵敬轩
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
赵敬轩
;
论文数:
引用数:
h-index:
机构:
才振功
;
丁宇
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
丁宇
;
施凯
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
施凯
;
论文数:
引用数:
h-index:
机构:
张振
;
曾凡松
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
曾凡松
;
论文数:
引用数:
h-index:
机构:
杨波威
.
中国专利
:CN121092302A
,2025-12-09
[10]
基于专家模块动态调度的MoE大模型推理优化方法及装置
[P].
李渝
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
李渝
;
论文数:
引用数:
h-index:
机构:
周游
;
论文数:
引用数:
h-index:
机构:
卓成
;
论文数:
引用数:
h-index:
机构:
尹勋钊
.
中国专利
:CN120996204A
,2025-11-21
←
1
2
3
4
5
→