一种稀疏混合专家大语言模型推理任务的卸载方法及装置

被引:0
专利类型
发明
申请号
CN202411334431.1
申请日
2024-09-24
公开(公告)号
CN119440654A
公开(公告)日
2025-02-14
发明(设计)人
张燕咏 陶子扬
申请人
中国科学技术大学
申请人地址
230026 安徽省合肥市金寨路96号
IPC主分类号
G06F9/445
IPC分类号
G06N5/04 G06N3/0442 G06N3/045 G06N3/08 G06F9/50
代理机构
北京中知法苑知识产权代理有限公司 11226
代理人
赵吉阳
法律状态
实质审查的生效
国省代码
安徽省 六安市
引用
下载
收藏
共 50 条
[1]
一种稀疏混合专家大语言模型推理任务的卸载方法及装置 [P]. 
张燕咏 ;
陶子扬 .
中国专利 :CN119440654B ,2025-11-07
[2]
混合专家大语言模型的融合问答方法、装置、设备及介质 [P]. 
韩伟 ;
王建圣 ;
张健 ;
王子豪 ;
王子 ;
马天明 ;
沈君宇 ;
卞乐明 .
中国专利 :CN119692477A ,2025-03-25
[3]
一种大语言模型的推理加速方法、装置、设备及介质 [P]. 
刘纹石 .
中国专利 :CN119440817A ,2025-02-14
[4]
大语言模型的推理方法、大语言模型的训练方法 [P]. 
马占宇 ;
周涵 ;
吴文权 .
中国专利 :CN120450050A ,2025-08-08
[5]
基于稀疏滑动窗口的大语言模型推理加速方法及装置 [P]. 
刘玉国 ;
陈其宾 ;
姜凯 .
中国专利 :CN118132682A ,2024-06-04
[6]
一种大语言模型的推理方法以及装置 [P]. 
陈旭升 ;
单一舟 ;
冯浩 ;
张秦 ;
邓晓阳 ;
但庚元 .
中国专利 :CN120338090A ,2025-07-18
[7]
大语言模型的推理方法和装置、设备及存储介质 [P]. 
吴建汉 ;
王健宗 .
中国专利 :CN120930799A ,2025-11-11
[8]
基于动态稀疏性的大语言模型推理加速方法及系统 [P]. 
蹇松雷 ;
杨莹 ;
余杰 ;
李宝 ;
张建锋 ;
丁滟 ;
谭霜 ;
王怡琦 ;
郭勇 ;
王晓川 .
中国专利 :CN121235130A ,2025-12-30
[9]
一种基于卸载流水线的大语言模型推理方法 [P]. 
李武军 ;
刘阳依健 ;
李俊 .
中国专利 :CN120146191A ,2025-06-13
[10]
一种基于混合专家架构的大语言模型自适应多偏好对齐方法及系统 [P]. 
徐冰 ;
刘东旭 ;
杨沐昀 ;
曹海龙 ;
朱聪慧 ;
赵铁军 .
中国专利 :CN119783748A ,2025-04-08