基于越狱攻击的大模型检测方法及系统

被引:0
专利类型
发明
申请号
CN202510203998.3
申请日
2025-02-24
公开(公告)号
CN120297358A
公开(公告)日
2025-07-11
发明(设计)人
姚忠将 汤学海 张潇丹 韩冀中 虎嵩林
申请人
中国科学院信息工程研究所
申请人地址
100085 北京市海淀区树村路19号
IPC主分类号
G06N3/094
IPC分类号
G06N3/092 G06N3/045 G06N3/0475 G06N5/01 G06F21/57
代理机构
北京君尚知识产权代理有限公司 11200
代理人
余长江
法律状态
公开
国省代码
北京市
引用
下载
收藏
共 50 条
[1]
针对大语言模型的越狱攻击方法及装置 [P]. 
马兴军 ;
张家豪 .
中国专利 :CN118862074A ,2024-10-29
[2]
大语言模型越狱攻击的风险防御方法及装置 [P]. 
张诚 ;
但孝磊 ;
贾铮 ;
陶丽雯 ;
范贵甫 ;
邹世斌 ;
王燕 ;
杨帆 ;
王晓炜 ;
郭晓兵 ;
胡曦翔 ;
张芷若 ;
付扬 ;
竹思佳 ;
张彦彦 ;
刘晓丽 .
中国专利 :CN119808883B ,2025-06-03
[3]
一种大模型越狱攻击检测方法 [P]. 
胡为民 ;
袁吉 ;
郑喜 ;
谢丽慧 .
中国专利 :CN119377802B ,2025-03-25
[4]
一种大模型越狱攻击检测方法 [P]. 
胡为民 ;
袁吉 ;
郑喜 ;
谢丽慧 .
中国专利 :CN119377802A ,2025-01-28
[5]
一种大语言模型越狱攻击防御方法及系统 [P]. 
王灿 ;
杨彤 ;
李雪 ;
张吉臣 .
中国专利 :CN120930718A ,2025-11-11
[6]
大语言模型越狱攻击的风险防御方法及装置 [P]. 
张诚 ;
但孝磊 ;
贾铮 ;
陶丽雯 ;
范贵甫 ;
邹世斌 ;
王燕 ;
杨帆 ;
王晓炜 ;
郭晓兵 ;
胡曦翔 ;
张芷若 ;
付扬 ;
竹思佳 ;
张彦彦 ;
刘晓丽 .
中国专利 :CN119808883A ,2025-04-11
[7]
基于视频模态的多模态大语言模型越狱攻击方法 [P]. 
胡文波 ;
顾士燊 ;
洪日昌 ;
闪墨涵 ;
范语蝶 .
中国专利 :CN121037009A ,2025-11-28
[8]
大语言模型越狱攻击的防御方法、系统、设备和存储介质 [P]. 
郑诗雨 ;
王以良 ;
徐子超 ;
周鹏 ;
戚伟强 ;
卢新岱 ;
陈逍潇 ;
钱经玮 ;
胡云龙 ;
陈婧楠 ;
王臻 ;
陈超 ;
王嘉琦 ;
陈昭昀 ;
江昊 .
中国专利 :CN120408608B ,2025-08-26
[9]
大模型越狱攻击评测语料的智能衍变生成方法及系统 [P]. 
金昱珂 ;
陈凯平 ;
郑非 ;
林华兴 ;
吴郑霞 .
中国专利 :CN121051739A ,2025-12-02
[10]
基于正向语境嵌入越狱攻击提示词的大模型安全检测方法 [P]. 
杨静远 ;
倪王泽 ;
秦湛 ;
任奎 .
中国专利 :CN120744915A ,2025-10-03