一种Serverless架构下的AI模型并行加载和串行推理方法及系统

被引:0
专利类型
发明
申请号
CN202411364164.2
申请日
2024-09-28
公开(公告)号
CN119129752A
公开(公告)日
2024-12-13
发明(设计)人
刘宇
申请人
刘宇
申请人地址
518000 广东省深圳市龙华新区观澜街道人民路191号和富工业园2栋3楼
IPC主分类号
G06N5/04
IPC分类号
G06N20/00 G06F9/50 G06F9/48 G06F9/445
代理机构
代理人
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
一种面向Serverless的高效AI模型管理和安全加载系统及方法 [P]. 
刘宇 .
中国专利 :CN119149134A ,2024-12-17
[2]
一种AI模型的并行训练及推理方法、相关系统 [P]. 
林禛 ;
黄江乐 ;
端启航 .
中国专利 :CN120688654A ,2025-09-23
[3]
一种基于AI芯片的多模型并行推理方法 [P]. 
郁善金 ;
施佩琦 ;
高丰 ;
杨涛 ;
梁松涛 ;
郑欢欢 ;
汪明军 ;
王晓江 .
中国专利 :CN112783650A ,2021-05-11
[4]
一种边缘AI推理场景下的模型缓存调度方法和系统 [P]. 
赵昱 ;
习霖 ;
刘峰 .
中国专利 :CN118113442A ,2024-05-31
[5]
一种基于AI芯片的多模型并行推理方法 [P]. 
郁善金 ;
施佩琦 ;
高丰 ;
杨涛 ;
梁松涛 ;
郑欢欢 ;
汪明军 ;
王晓江 .
中国专利 :CN112783650B ,2024-01-16
[6]
人工智能AI模型的量化推理方法、推理系统和计算设备 [P]. 
林禛 ;
黄江乐 ;
胡天驰 .
中国专利 :CN119204103A ,2024-12-27
[7]
一种AI模型推理的方法及其装置 [P]. 
牟勤 .
中国专利 :CN117651954A ,2024-03-05
[8]
一种AI模型的推理方法及装置 [P]. 
唐业辉 ;
秦浩晨 ;
韩凯 ;
周航 ;
李琳 ;
龙子超 ;
芮祥麟 ;
王云鹤 ;
廖恒 .
中国专利 :CN121212318A ,2025-12-26
[9]
一种Serverless大模型推理服务系统、方法、设备及介质 [P]. 
朱天琦 ;
蒋仕龙 .
中国专利 :CN119440739A ,2025-02-14
[10]
一种模型推理和训练的方法、装置及系统 [P]. 
李向阳 ;
乔子卿 ;
肖朝军 ;
刘知远 .
中国专利 :CN120234467A ,2025-07-01