基于注意力头的大语言模型功能分区探测方法及系统

被引:0
专利类型
发明
申请号
CN202510424728.5
申请日
2025-04-07
公开(公告)号
CN120317284A
公开(公告)日
2025-07-15
发明(设计)人
俞凯 陈露 韩森宇
申请人
思必驰科技股份有限公司
申请人地址
215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
IPC主分类号
G06N3/045
IPC分类号
G06N3/084 G06N5/045 G06F40/16
代理机构
北京商专永信知识产权代理事务所(普通合伙) 11400
代理人
黄谦;侯晓艳
法律状态
实质审查的生效
国省代码
江苏省 苏州市
引用
下载
收藏
共 50 条
[1]
基于分层协同注意力和大语言模型的推荐方法及系统 [P]. 
张镇 ;
方佳琪 ;
卢晓建 ;
张博嵛 ;
朱本行 ;
刘伟 .
中国专利 :CN120563210A ,2025-08-29
[2]
基于分层协同注意力和大语言模型的推荐方法及系统 [P]. 
张镇 ;
方佳琪 ;
卢晓建 ;
张博嵛 ;
朱本行 ;
刘伟 .
中国专利 :CN120563210B ,2025-10-31
[3]
基于注意力引导的大语言模型的主观试题批改方法及系统 [P]. 
许达成 ;
纪俊杰 ;
魏钰尧 ;
李方 ;
贺衍豪 .
中国专利 :CN118839685A ,2024-10-25
[4]
基于层级分组注意力的大语言模型加速方法、装置、设备及介质 [P]. 
谭明奎 ;
黎浩坤 ;
陈耀佛 ;
游增 ;
许守恺 ;
杜卿 .
中国专利 :CN119940433A ,2025-05-06
[5]
一种基于时空注意力机制的大语言模型预测方法及装置 [P]. 
吴迪 ;
胡汉一 ;
卢冰洁 ;
刘天蒙 ;
那崇宁 .
中国专利 :CN117786061B ,2024-06-04
[6]
一种基于时空注意力机制的大语言模型预测方法及装置 [P]. 
吴迪 ;
胡汉一 ;
卢冰洁 ;
刘天蒙 ;
那崇宁 .
中国专利 :CN117786061A ,2024-03-29
[7]
基于注意力引导机制的预训练语言模型的微调方法及系统 [P]. 
陈竹敏 ;
王闪闪 ;
任鹏杰 ;
任昭春 ;
梁华盛 .
中国专利 :CN114925814B ,2024-08-02
[8]
基于注意力引导机制的预训练语言模型的微调方法及系统 [P]. 
陈竹敏 ;
王闪闪 ;
任鹏杰 ;
任昭春 ;
梁华盛 .
中国专利 :CN114925814A ,2022-08-19
[9]
自注意力机制中键值压缩方法、大语言模型及电子设备 [P]. 
王宁 ;
白童心 .
中国专利 :CN120106150B ,2025-10-03
[10]
自注意力机制中键值压缩方法、大语言模型及电子设备 [P]. 
王宁 ;
白童心 .
中国专利 :CN120106150A ,2025-06-06