一种用于大语言模型安全防御的自动红队演练方法

被引：0

专利类型：

发明

申请号：

CN202410973625.X

申请日：

2024-07-19

公开(公告)号：

CN119089974A

公开(公告)日：

2024-12-06

发明(设计)人：

邓达臻郑华伟张楚涵巫英才

申请人：

浙江大学

申请人地址：

310058 浙江省杭州市西湖区余杭塘路866号

IPC主分类号：

G06N3/094

IPC分类号：

G06N3/045 G06N3/0475 G06N5/04 G06F16/332 G06F16/34

代理机构：

杭州天勤知识产权代理有限公司 33224

代理人：

曹兆霞

法律状态：

公开

国省代码：

浙江省杭州市

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2024-12-06	公开	公开
2024-12-24	实质审查的生效	实质审查的生效IPC(主分类):G06N 3/094申请日:20240719

共 50 条

[1]

一种面向大语言模型红队演练的多层次可视分析系统 [P].

邓达臻 ;

张楚涵 ;

郑华伟 ;

巫英才 .

中国专利 :CN119088951A ,2024-12-06

[2]

一种大语言模型对恶意查询的安全防御方法、装置及设备 [P].

张燕咏 ;

杨卓然 .

中国专利 :CN119442242B ,2025-09-30

[3]

一种大语言模型对恶意查询的安全防御方法、装置及设备 [P].

张燕咏 ;

杨卓然 .

中国专利 :CN119442242A ,2025-02-14

[4]

业务大模型的安全防御方法及装置 [P].

王健 ;

王弋尘 ;

薛泓涛 .

中国专利 :CN120316828B ,2025-10-24

[5]

一种基于大语言模型和防御算法的数据安全分析方法 [P].

车静文 ;

陆吕健 ;

顾子轩 ;

孙龙 ;

范秋枫 ;

曹祥 ;

刘洋 .

中国专利 :CN119203231A ,2024-12-27

[6]

一种基于大语言模型和防御算法的数据安全分析方法 [P].

车静文 ;

陆吕健 ;

顾子轩 ;

孙龙 ;

范秋枫 ;

曹祥 ;

刘洋 .

中国专利 :CN119203231B ,2025-09-16

[7]

业务大模型的安全防御方法及装置 [P].

王健 ;

王弋尘 ;

薛泓涛 .

中国专利 :CN120316828A ,2025-07-15

[8]

一种大语言模型安全防护机制的检测方法及系统 [P].

尚煜茗 ;

索攀 ;

罗伟 ;

张熙 ;

郭三川 ;

李朝卓 .

中国专利 :CN120316781A ,2025-07-15

[9]

基于表情符号的大语言模型红队测试方法以及装置 [P].

黄民烈 ;

崔诗尧 ;

邱寒 .

中国专利 :CN120951999A ,2025-11-14

[10]

一种基于多轮红队攻击的大模型安全对齐方法及装置 [P].

李晶 ;

郭葳杨 ;

张民 .

中国专利 :CN120146199A ,2025-06-13

← 1 2 3 4 5 →