基于层级分组注意力的大语言模型加速方法、装置、设备及介质

被引:0
专利类型
发明
申请号
CN202411964485.6
申请日
2024-12-30
公开(公告)号
CN119940433A
公开(公告)日
2025-05-06
发明(设计)人
谭明奎 黎浩坤 陈耀佛 游增 许守恺 杜卿
申请人
华南理工大学 超级机器人研究院(黄埔)
申请人地址
510641 广东省广州市天河区五山路381号
IPC主分类号
G06N3/063
IPC分类号
G06F9/50 G06N3/0455 G06N5/04
代理机构
广州嘉权专利商标事务所有限公司 44205
代理人
郑宏谋
法律状态
公开
国省代码
广东省 广州市
引用
下载
收藏
共 50 条
[1]
基于大语言模型的推理加速方法、装置、介质及设备 [P]. 
梁成栋 ;
陈晓宇 .
:CN120764681A ,2025-10-10
[2]
基于分层协同注意力和大语言模型的推荐方法及系统 [P]. 
张镇 ;
方佳琪 ;
卢晓建 ;
张博嵛 ;
朱本行 ;
刘伟 .
中国专利 :CN120563210A ,2025-08-29
[3]
基于分层协同注意力和大语言模型的推荐方法及系统 [P]. 
张镇 ;
方佳琪 ;
卢晓建 ;
张博嵛 ;
朱本行 ;
刘伟 .
中国专利 :CN120563210B ,2025-10-31
[4]
基于注意力头的大语言模型功能分区探测方法及系统 [P]. 
俞凯 ;
陈露 ;
韩森宇 .
中国专利 :CN120317284A ,2025-07-15
[5]
基于注意力引导的大语言模型的主观试题批改方法及系统 [P]. 
许达成 ;
纪俊杰 ;
魏钰尧 ;
李方 ;
贺衍豪 .
中国专利 :CN118839685A ,2024-10-25
[6]
大语言模型推理加速方法、装置、设备及介质 [P]. 
赵欣昊 ;
薛思皓 ;
姜上维 .
中国专利 :CN121031794A ,2025-11-28
[7]
一种基于时空注意力机制的大语言模型预测方法及装置 [P]. 
吴迪 ;
胡汉一 ;
卢冰洁 ;
刘天蒙 ;
那崇宁 .
中国专利 :CN117786061B ,2024-06-04
[8]
一种基于时空注意力机制的大语言模型预测方法及装置 [P]. 
吴迪 ;
胡汉一 ;
卢冰洁 ;
刘天蒙 ;
那崇宁 .
中国专利 :CN117786061A ,2024-03-29
[9]
大语言模型运算装置、大语言模型加速装置及大语言模型运算方法 [P]. 
李彦军 ;
尹潇锐 ;
吴国增 ;
韩海跃 ;
杨越 .
中国专利 :CN120597961A ,2025-09-05
[10]
大语言模型运算装置、大语言模型加速装置及大语言模型运算方法 [P]. 
李彦军 ;
尹潇锐 ;
吴国增 ;
韩海跃 .
中国专利 :CN119990215A ,2025-05-13