基于正向语境嵌入越狱攻击提示词的大模型安全检测方法

被引:0
专利类型
发明
申请号
CN202511217851.6
申请日
2025-08-28
公开(公告)号
CN120744915A
公开(公告)日
2025-10-03
发明(设计)人
杨静远 倪王泽 秦湛 任奎
申请人
浙江大学 杭州高新区(滨江)区块链与数据安全研究院
申请人地址
310058 浙江省杭州市西湖区余杭塘路866号
IPC主分类号
G06F21/55
IPC分类号
G06F40/30 G06F40/284 G06F40/247 G06F18/214 G06F18/241
代理机构
杭州求是专利事务所有限公司 33200
代理人
邱启旺
法律状态
实质审查的生效
国省代码
浙江省 杭州市
引用
下载
收藏
共 50 条
[1]
基于正向语境嵌入越狱攻击提示词的大模型安全检测方法 [P]. 
杨静远 ;
倪王泽 ;
秦湛 ;
任奎 .
中国专利 :CN120744915B ,2025-11-28
[2]
一种大语言模型越狱提示词的检测方法 [P]. 
尚煜茗 ;
冷骏 ;
张熙 ;
郭三川 ;
李朝卓 .
中国专利 :CN120409461A ,2025-08-01
[3]
一种大语言模型越狱提示词的检测方法 [P]. 
尚煜茗 ;
冷骏 ;
张熙 ;
郭三川 ;
李朝卓 .
中国专利 :CN120409461B ,2025-12-16
[4]
基于越狱攻击的大模型检测方法及系统 [P]. 
姚忠将 ;
汤学海 ;
张潇丹 ;
韩冀中 ;
虎嵩林 .
中国专利 :CN120297358A ,2025-07-11
[5]
一种大模型越狱攻击检测方法 [P]. 
胡为民 ;
袁吉 ;
郑喜 ;
谢丽慧 .
中国专利 :CN119377802B ,2025-03-25
[6]
一种大模型越狱攻击检测方法 [P]. 
胡为民 ;
袁吉 ;
郑喜 ;
谢丽慧 .
中国专利 :CN119377802A ,2025-01-28
[7]
一种大语言模型的提示词攻击检测方法和装置 [P]. 
路致平 ;
黄喆 ;
刘学 ;
高芷乔 ;
孙佳宾 ;
阮秭威 .
中国专利 :CN118445815A ,2024-08-06
[8]
一种大语言模型的提示词攻击检测方法和装置 [P]. 
路致平 ;
黄喆 ;
刘学 ;
高芷乔 ;
孙佳宾 ;
阮秭威 .
中国专利 :CN118445815B ,2024-10-25
[9]
一种大模型提示词攻击检测方法、系统、终端及介质 [P]. 
白浩良 ;
李聪 ;
王禹博 ;
臧汕倡 ;
李承林 .
中国专利 :CN121217372A ,2025-12-26
[10]
基于上下文学习的大语言模型提示词注入攻击检测方法和装置 [P]. 
韩蒙 ;
林石 ;
林昶廷 ;
王勋 ;
高岩 ;
王滨 ;
李晓波 ;
杨波 .
中国专利 :CN118734314A ,2024-10-01