一种用于大语言模型安全防御的自动红队演练方法

被引:0
专利类型
发明
申请号
CN202410973625.X
申请日
2024-07-19
公开(公告)号
CN119089974A
公开(公告)日
2024-12-06
发明(设计)人
邓达臻 郑华伟 张楚涵 巫英才
申请人
浙江大学
申请人地址
310058 浙江省杭州市西湖区余杭塘路866号
IPC主分类号
G06N3/094
IPC分类号
G06N3/045 G06N3/0475 G06N5/04 G06F16/332 G06F16/34
代理机构
杭州天勤知识产权代理有限公司 33224
代理人
曹兆霞
法律状态
公开
国省代码
浙江省 杭州市
引用
下载
收藏
共 50 条
[1]
一种面向大语言模型红队演练的多层次可视分析系统 [P]. 
邓达臻 ;
张楚涵 ;
郑华伟 ;
巫英才 .
中国专利 :CN119088951A ,2024-12-06
[2]
一种大语言模型对恶意查询的安全防御方法、装置及设备 [P]. 
张燕咏 ;
杨卓然 .
中国专利 :CN119442242B ,2025-09-30
[3]
一种大语言模型对恶意查询的安全防御方法、装置及设备 [P]. 
张燕咏 ;
杨卓然 .
中国专利 :CN119442242A ,2025-02-14
[4]
业务大模型的安全防御方法及装置 [P]. 
王健 ;
王弋尘 ;
薛泓涛 .
中国专利 :CN120316828B ,2025-10-24
[5]
一种基于大语言模型和防御算法的数据安全分析方法 [P]. 
车静文 ;
陆吕健 ;
顾子轩 ;
孙龙 ;
范秋枫 ;
曹祥 ;
刘洋 .
中国专利 :CN119203231A ,2024-12-27
[6]
一种基于大语言模型和防御算法的数据安全分析方法 [P]. 
车静文 ;
陆吕健 ;
顾子轩 ;
孙龙 ;
范秋枫 ;
曹祥 ;
刘洋 .
中国专利 :CN119203231B ,2025-09-16
[7]
业务大模型的安全防御方法及装置 [P]. 
王健 ;
王弋尘 ;
薛泓涛 .
中国专利 :CN120316828A ,2025-07-15
[8]
一种大语言模型安全防护机制的检测方法及系统 [P]. 
尚煜茗 ;
索攀 ;
罗伟 ;
张熙 ;
郭三川 ;
李朝卓 .
中国专利 :CN120316781A ,2025-07-15
[9]
基于表情符号的大语言模型红队测试方法以及装置 [P]. 
黄民烈 ;
崔诗尧 ;
邱寒 .
中国专利 :CN120951999A ,2025-11-14
[10]
一种基于多轮红队攻击的大模型安全对齐方法及装置 [P]. 
李晶 ;
郭葳杨 ;
张民 .
中国专利 :CN120146199A ,2025-06-13