学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种基于动态约束强化学习的大模型安全对齐方法
被引:0
专利类型
:
发明
申请号
:
CN202411688975.8
申请日
:
2024-11-25
公开(公告)号
:
CN119539057A
公开(公告)日
:
2025-02-28
发明(设计)人
:
孟繁宇
白志欣
王砚铭
霍静
王博岩
杨希
高阳
申请人
:
中国移动通信有限公司研究院
中国移动通信集团有限公司
中国移动通信集团江苏有限公司
南京大学
申请人地址
:
100053 北京市西城区宣武门西大街32号
IPC主分类号
:
G06N5/022
IPC分类号
:
G06N5/04
G06N20/00
G06N3/048
G06N3/092
G06N3/084
G06N3/0455
代理机构
:
北京银龙知识产权代理有限公司 11243
代理人
:
汤明明
法律状态
:
公开
国省代码
:
江苏省 南京市
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2025-02-28
公开
公开
2025-03-18
实质审查的生效
实质审查的生效IPC(主分类):G06N 5/022申请日:20241125
共 50 条
[1]
一种大语言模型的安全对齐方法及装置
[P].
王岱鑫
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
王岱鑫
;
陈岑
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
陈岑
;
周广浩
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)信息技术有限公司
支付宝(杭州)信息技术有限公司
周广浩
.
中国专利
:CN120910391A
,2025-11-07
[2]
一种针对大语言模型的安全对齐测试方法及系统
[P].
刘小垒
论文数:
0
引用数:
0
h-index:
0
机构:
中国工程物理研究院计算机应用研究所
中国工程物理研究院计算机应用研究所
刘小垒
;
刘成
论文数:
0
引用数:
0
h-index:
0
机构:
中国工程物理研究院计算机应用研究所
中国工程物理研究院计算机应用研究所
刘成
;
李星煜
论文数:
0
引用数:
0
h-index:
0
机构:
中国工程物理研究院计算机应用研究所
中国工程物理研究院计算机应用研究所
李星煜
;
张峰
论文数:
0
引用数:
0
h-index:
0
机构:
中国工程物理研究院计算机应用研究所
中国工程物理研究院计算机应用研究所
张峰
;
丁康一
论文数:
0
引用数:
0
h-index:
0
机构:
中国工程物理研究院计算机应用研究所
中国工程物理研究院计算机应用研究所
丁康一
;
辛邦洲
论文数:
0
引用数:
0
h-index:
0
机构:
中国工程物理研究院计算机应用研究所
中国工程物理研究院计算机应用研究所
辛邦洲
.
中国专利
:CN120670557A
,2025-09-19
[3]
基于强化学习的大语言模型安全保护防御方法和装置
[P].
何柯阳
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
何柯阳
;
论文数:
引用数:
h-index:
机构:
韩蒙
;
孔德章
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
孔德章
;
林昶廷
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
林昶廷
;
邢文鹏
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
邢文鹏
;
论文数:
引用数:
h-index:
机构:
许海涛
;
谢珍真
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
谢珍真
;
马治国
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
马治国
.
中国专利
:CN120974512A
,2025-11-18
[4]
一种基于大语言模型和强化学习的文本去毒方法
[P].
李翔
论文数:
0
引用数:
0
h-index:
0
机构:
华东师范大学
华东师范大学
李翔
;
余婧
论文数:
0
引用数:
0
h-index:
0
机构:
华东师范大学
华东师范大学
余婧
;
赵艺博
论文数:
0
引用数:
0
h-index:
0
机构:
华东师范大学
华东师范大学
赵艺博
;
朱嘉鹏
论文数:
0
引用数:
0
h-index:
0
机构:
华东师范大学
华东师范大学
朱嘉鹏
;
张召
论文数:
0
引用数:
0
h-index:
0
机构:
华东师范大学
华东师范大学
张召
;
邵文明
论文数:
0
引用数:
0
h-index:
0
机构:
华东师范大学
华东师范大学
邵文明
;
庞博
论文数:
0
引用数:
0
h-index:
0
机构:
华东师范大学
华东师范大学
庞博
.
中国专利
:CN120671681A
,2025-09-19
[5]
用于大语言模型的强化学习的方法和装置
[P].
阎栋
论文数:
0
引用数:
0
h-index:
0
机构:
北京百川智能科技有限公司
北京百川智能科技有限公司
阎栋
;
李佳莲
论文数:
0
引用数:
0
h-index:
0
机构:
北京百川智能科技有限公司
北京百川智能科技有限公司
李佳莲
.
中国专利
:CN117808120A
,2024-04-02
[6]
一种基于多轮红队攻击的大模型安全对齐方法及装置
[P].
论文数:
引用数:
h-index:
机构:
李晶
;
郭葳杨
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
郭葳杨
;
论文数:
引用数:
h-index:
机构:
张民
.
中国专利
:CN120146199B
,2025-07-18
[7]
一种基于多轮红队攻击的大模型安全对齐方法及装置
[P].
论文数:
引用数:
h-index:
机构:
李晶
;
郭葳杨
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
郭葳杨
;
论文数:
引用数:
h-index:
机构:
张民
.
中国专利
:CN120146199A
,2025-06-13
[8]
安全强化学习驱动的大语言模型安全决策智能体
[P].
论文数:
引用数:
h-index:
机构:
邓岳
;
论文数:
引用数:
h-index:
机构:
高宁
;
论文数:
引用数:
h-index:
机构:
李洪珏
.
中国专利
:CN120688552B
,2025-12-12
[9]
安全强化学习驱动的大语言模型安全决策智能体
[P].
论文数:
引用数:
h-index:
机构:
邓岳
;
论文数:
引用数:
h-index:
机构:
高宁
;
论文数:
引用数:
h-index:
机构:
李洪珏
.
中国专利
:CN120688552A
,2025-09-23
[10]
一种基于大语言模型和强化学习的威胁狩猎方法
[P].
王俊峰
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学
四川大学
王俊峰
;
论文数:
引用数:
h-index:
机构:
崔泽源
;
论文数:
引用数:
h-index:
机构:
葛文翰
.
中国专利
:CN119728229B
,2025-09-23
←
1
2
3
4
5
→