针对大语言模型的越狱攻击方法及装置

被引:0
专利类型
发明
申请号
CN202411028436.1
申请日
2024-07-30
公开(公告)号
CN118862074A
公开(公告)日
2024-10-29
发明(设计)人
马兴军 张家豪
申请人
复旦大学
申请人地址
200433 上海市杨浦区邯郸路220号
IPC主分类号
G06F21/56
IPC分类号
G06F40/186 G06N3/045 G06F16/332 G06N3/08
代理机构
上海德昭知识产权代理有限公司 31204
代理人
陆乾
法律状态
实质审查的生效
国省代码
上海市 市辖区
引用
下载
收藏
共 50 条
[1]
大语言模型越狱攻击的风险防御方法及装置 [P]. 
张诚 ;
但孝磊 ;
贾铮 ;
陶丽雯 ;
范贵甫 ;
邹世斌 ;
王燕 ;
杨帆 ;
王晓炜 ;
郭晓兵 ;
胡曦翔 ;
张芷若 ;
付扬 ;
竹思佳 ;
张彦彦 ;
刘晓丽 .
中国专利 :CN119808883B ,2025-06-03
[2]
大语言模型越狱攻击的风险防御方法及装置 [P]. 
张诚 ;
但孝磊 ;
贾铮 ;
陶丽雯 ;
范贵甫 ;
邹世斌 ;
王燕 ;
杨帆 ;
王晓炜 ;
郭晓兵 ;
胡曦翔 ;
张芷若 ;
付扬 ;
竹思佳 ;
张彦彦 ;
刘晓丽 .
中国专利 :CN119808883A ,2025-04-11
[3]
针对视觉语言模型的多模态越狱攻击方法及装置 [P]. 
马兴军 ;
王若凡 .
中国专利 :CN118550941A ,2024-08-27
[4]
一种大语言模型越狱攻击防御方法及系统 [P]. 
王灿 ;
杨彤 ;
李雪 ;
张吉臣 .
中国专利 :CN120930718A ,2025-11-11
[5]
可拓展的大语言模型越狱攻击方法、装置、介质和产品 [P]. 
杨亦齐 ;
王庆龙 ;
巴钟杰 ;
程鹏 ;
任奎 .
中国专利 :CN119884311A ,2025-04-25
[6]
基于视频模态的多模态大语言模型越狱攻击方法 [P]. 
胡文波 ;
顾士燊 ;
洪日昌 ;
闪墨涵 ;
范语蝶 .
中国专利 :CN121037009A ,2025-11-28
[7]
大语言模型越狱攻击的防御方法、系统、设备和存储介质 [P]. 
郑诗雨 ;
王以良 ;
徐子超 ;
周鹏 ;
戚伟强 ;
卢新岱 ;
陈逍潇 ;
钱经玮 ;
胡云龙 ;
陈婧楠 ;
王臻 ;
陈超 ;
王嘉琦 ;
陈昭昀 ;
江昊 .
中国专利 :CN120408608B ,2025-08-26
[8]
基于越狱攻击的大模型检测方法及系统 [P]. 
姚忠将 ;
汤学海 ;
张潇丹 ;
韩冀中 ;
虎嵩林 .
中国专利 :CN120297358A ,2025-07-11
[9]
大语言模型越狱攻击的防御方法、系统、设备和存储介质 [P]. 
郑诗雨 ;
王以良 ;
徐子超 ;
周鹏 ;
戚伟强 ;
卢新岱 ;
陈逍潇 ;
钱经玮 ;
胡云龙 ;
陈婧楠 ;
王臻 ;
陈超 ;
王嘉琦 ;
陈昭昀 ;
江昊 .
中国专利 :CN120408608A ,2025-08-01
[10]
一种基于对齐机制干扰的大语言模型越狱攻击方法 [P]. 
任孜初 ;
刘羿阳 ;
洪海波 .
中国专利 :CN121211439A ,2025-12-26