基于正向语境嵌入越狱攻击提示词的大模型安全检测方法

被引：0

专利类型：

发明

申请号：

CN202511217851.6

申请日：

2025-08-28

公开(公告)号：

CN120744915A

公开(公告)日：

2025-10-03

发明(设计)人：

杨静远倪王泽秦湛任奎

申请人：

浙江大学杭州高新区（滨江）区块链与数据安全研究院

申请人地址：

310058 浙江省杭州市西湖区余杭塘路866号

IPC主分类号：

G06F21/55

IPC分类号：

G06F40/30 G06F40/284 G06F40/247 G06F18/214 G06F18/241

代理机构：

杭州求是专利事务所有限公司 33200

代理人：

邱启旺

法律状态：

实质审查的生效

国省代码：

浙江省杭州市

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2025-10-24	实质审查的生效	实质审查的生效IPC(主分类):G06F 21/55申请日:20250828
2025-10-03	公开	公开
2025-11-28	授权	授权

共 50 条

[1]

基于正向语境嵌入越狱攻击提示词的大模型安全检测方法 [P].

杨静远 ;

倪王泽 ;

秦湛 ;

任奎 .

中国专利 :CN120744915B ,2025-11-28

[2]

一种大语言模型越狱提示词的检测方法 [P].

尚煜茗 ;

冷骏 ;

张熙 ;

郭三川 ;

李朝卓 .

中国专利 :CN120409461A ,2025-08-01

[3]

一种大语言模型越狱提示词的检测方法 [P].

尚煜茗 ;

冷骏 ;

张熙 ;

郭三川 ;

李朝卓 .

中国专利 :CN120409461B ,2025-12-16

[4]

基于越狱攻击的大模型检测方法及系统 [P].

姚忠将 ;

汤学海 ;

张潇丹 ;

韩冀中 ;

虎嵩林 .

中国专利 :CN120297358A ,2025-07-11

[5]

一种大模型越狱攻击检测方法 [P].

胡为民 ;

袁吉 ;

郑喜 ;

谢丽慧 .

中国专利 :CN119377802B ,2025-03-25

[6]

一种大模型越狱攻击检测方法 [P].

胡为民 ;

袁吉 ;

郑喜 ;

谢丽慧 .

中国专利 :CN119377802A ,2025-01-28

[7]

一种大语言模型的提示词攻击检测方法和装置 [P].

路致平 ;

黄喆 ;

刘学 ;

高芷乔 ;

孙佳宾 ;

阮秭威 .

中国专利 :CN118445815A ,2024-08-06

[8]

一种大语言模型的提示词攻击检测方法和装置 [P].

路致平 ;

黄喆 ;

刘学 ;

高芷乔 ;

孙佳宾 ;

阮秭威 .

中国专利 :CN118445815B ,2024-10-25

[9]

一种大模型提示词攻击检测方法、系统、终端及介质 [P].

白浩良 ;

李聪 ;

王禹博 ;

臧汕倡 ;

李承林 .

中国专利 :CN121217372A ,2025-12-26

[10]

基于上下文学习的大语言模型提示词注入攻击检测方法和装置 [P].

韩蒙 ;

林石 ;

林昶廷 ;

王勋 ;

高岩 ;

王滨 ;

李晓波 ;

杨波 .

中国专利 :CN118734314A ,2024-10-01

← 1 2 3 4 5 →