基于混合整数规划的GPU集群下LLM模型资源分配方法和装置

被引:0
专利类型
发明
申请号
CN202510474851.8
申请日
2025-04-16
公开(公告)号
CN119988043A
公开(公告)日
2025-05-13
发明(设计)人
张天成 范智博 胡诗曦 葛思涵 荆成旺 伍健 兰程昊 罗小渠 王曦 毕辰阳
申请人
杉数科技(北京)有限公司 上海杉数网络科技有限公司 广州杉数科技有限公司 杉数科技(南京)有限公司 第五范式(深圳)科技有限公司 杉数科技(苏州)有限公司
申请人地址
100102 北京市朝阳区利泽中园106号楼1层C101
IPC主分类号
G06F9/50
IPC分类号
G06N3/045
代理机构
北京中微知著知识产权代理事务所(特殊普通合伙) 16136
代理人
郭士超
法律状态
实质审查的生效
国省代码
北京市 市辖区
引用
下载
收藏
共 50 条
[1]
基于大规模整数规划的资源分配方法和系统 [P]. 
刘凯 ;
陈然 ;
刘子奇 ;
华致刚 ;
周俊 .
中国专利 :CN114638549A ,2022-06-17
[2]
适用于CPU-GPU异构集群的计算卸载和资源分配方法 [P]. 
巩宸宇 ;
吴连涛 ;
周勇 .
中国专利 :CN115442851A ,2022-12-06
[3]
适用于CPU-GPU异构集群的计算卸载和资源分配方法 [P]. 
巩宸宇 ;
吴连涛 ;
周勇 .
中国专利 :CN115442851B ,2025-07-29
[4]
一种基于GPU集群资源分配的方法和装置 [P]. 
姬贵阳 .
中国专利 :CN110413412B ,2019-11-05
[5]
GPU的资源分配方法和装置 [P]. 
金捲植 ;
安泳禹 ;
宋正翼 ;
吕寅春 .
中国专利 :CN104137075A ,2014-11-05
[6]
基于量化混合整数多级优化的电网线路防御资源分配方法 [P]. 
陈凡 ;
王瑞驰 ;
赵美莲 ;
刘海涛 ;
朱方博 ;
王曼 .
中国专利 :CN115545442A ,2022-12-30
[7]
虚拟资源分配方法和装置 [P]. 
汪崇儒 .
中国专利 :CN105511959A ,2016-04-20
[8]
集群资源动态规划的方法和装置 [P]. 
梁宝彬 .
中国专利 :CN118377620A ,2024-07-23
[9]
基于改进PSO算法的容器资源分配方法和设备 [P]. 
胡钊 ;
曹小龙 ;
周文杰 ;
余胜 .
中国专利 :CN119938229A ,2025-05-06
[10]
获取资源分配模型的方法、资源分配方法及对应装置 [P]. 
屈超 ;
詹姆士·张 ;
胡韵 ;
郑洋飞 ;
熊君武 ;
雷磊 .
中国专利 :CN115118780A ,2022-09-27