一种基于AI芯片的多模型并行推理方法

被引:0
专利类型
发明
申请号
CN202110075174.4
申请日
2021-01-20
公开(公告)号
CN112783650B
公开(公告)日
2024-01-16
发明(设计)人
郁善金 施佩琦 高丰 杨涛 梁松涛 郑欢欢 汪明军 王晓江
申请人
之江实验室
申请人地址
310023 浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼
IPC主分类号
G06F9/50
IPC分类号
G06F15/78
代理机构
杭州浙科专利事务所(普通合伙) 33213
代理人
陈包杰
法律状态
授权
国省代码
浙江省 杭州市
引用
下载
收藏
共 50 条
[1]
一种基于AI芯片的多模型并行推理方法 [P]. 
郁善金 ;
施佩琦 ;
高丰 ;
杨涛 ;
梁松涛 ;
郑欢欢 ;
汪明军 ;
王晓江 .
中国专利 :CN112783650A ,2021-05-11
[2]
AI模型推理方法 [P]. 
叶萌 .
中国专利 :CN114706518A ,2022-07-05
[3]
AI模型推理方法 [P]. 
叶萌 .
中国专利 :CN114706518B ,2025-03-28
[4]
一种基于图形处理器的深度神经网络多模型并行推理方法 [P]. 
张楠 ;
李明喜 .
中国专利 :CN114004730A ,2022-02-01
[5]
一种基于图形处理器的深度神经网络多模型并行推理方法 [P]. 
张楠 ;
李明喜 .
中国专利 :CN114004730B ,2024-09-17
[6]
一种基于缓存辅助并行推测解码的大模型推理方法及系统 [P]. 
何鑫 ;
周恩宇 ;
卜伟锋 ;
李燊裕 ;
蔡玉树 ;
盛凯 .
中国专利 :CN120654818A ,2025-09-16
[7]
一种基于多模型并行推理的可交互问答系统及问答方法 [P]. 
舒舸 ;
李雪瑶 ;
谭笑 ;
池胜强 ;
周天舒 ;
李劲松 .
中国专利 :CN120144724A ,2025-06-13
[8]
一种基于多模型并行推理的可交互问答系统及问答方法 [P]. 
舒舸 ;
李雪瑶 ;
谭笑 ;
池胜强 ;
周天舒 ;
李劲松 .
中国专利 :CN120144724B ,2025-09-30
[9]
一种多领域微调大模型并行推理系统及其方法 [P]. 
刘建志 ;
牛红星 ;
孙兆群 .
中国专利 :CN117474102A ,2024-01-30
[10]
一种Serverless架构下的AI模型并行加载和串行推理方法及系统 [P]. 
刘宇 .
中国专利 :CN119129752A ,2024-12-13