基于因果大语言模型的强化学习决策优化方法、系统及设备

被引:0
专利类型
发明
申请号
CN202510944141.7
申请日
2025-07-09
公开(公告)号
CN120911539A
公开(公告)日
2025-11-07
发明(设计)人
陈薇 张家豪 蔡瑞初 郝志峰 陈炳丰 王丽娟
申请人
广东工业大学
申请人地址
510062 广东省广州市越秀区东风东路729号
IPC主分类号
G06N3/092
IPC分类号
G06N5/04 G06F40/211
代理机构
广州粤高专利商标代理有限公司 44102
代理人
马云鹏;翁惠珊
法律状态
公开
国省代码
广东省 广州市
引用
下载
收藏
共 50 条
[1]
基于大语言模型和强化学习的决策方法、装置及设备 [P]. 
徐泽来 ;
于超 ;
汪玉 ;
吴翼 .
中国专利 :CN118260681A ,2024-06-28
[2]
基于大语言模型增强的可解释强化学习决策系统及方法 [P]. 
曾云秀 ;
黄鹤松 ;
曾俊杰 ;
石超 ;
秦龙 ;
柴娴 ;
罗宇湘 ;
李智能 ;
何胜 .
中国专利 :CN120722758A ,2025-09-30
[3]
基于大语言模型增强的可解释强化学习决策系统及方法 [P]. 
曾云秀 ;
黄鹤松 ;
曾俊杰 ;
石超 ;
秦龙 ;
柴娴 ;
罗宇湘 ;
李智能 ;
何胜 .
中国专利 :CN120722758B ,2025-11-14
[4]
基于大语言模型和强化学习的决策支持系统及方法 [P]. 
白文松 ;
付一超 ;
张超 ;
赵涵斌 ;
钱徽 .
中国专利 :CN119150913A ,2024-12-17
[5]
基于大语言模型和强化学习算法的配方工艺优化方法 [P]. 
刘雨阳 ;
郭权玮 .
中国专利 :CN121072473A ,2025-12-05
[6]
基于大语言模型及强化学习的智能客服系统 [P]. 
朱一琪 ;
周晔 ;
穆海洁 ;
石英伦 .
中国专利 :CN121051202A ,2025-12-02
[7]
基于大语言模型的辅助分层强化学习训练方法及系统 [P]. 
庞豹 ;
李千溪 ;
王江 ;
宋勇 ;
傅洪泽 ;
许庆阳 ;
袁宪锋 ;
徐小龙 .
中国专利 :CN119514640B ,2025-10-28
[8]
基于大语言模型的辅助分层强化学习训练方法及系统 [P]. 
庞豹 ;
李千溪 ;
王江 ;
宋勇 ;
傅洪泽 ;
许庆阳 ;
袁宪锋 ;
徐小龙 .
中国专利 :CN119514640A ,2025-02-25
[9]
安全强化学习驱动的大语言模型安全决策智能体 [P]. 
邓岳 ;
高宁 ;
李洪珏 .
中国专利 :CN120688552B ,2025-12-12
[10]
安全强化学习驱动的大语言模型安全决策智能体 [P]. 
邓岳 ;
高宁 ;
李洪珏 .
中国专利 :CN120688552A ,2025-09-23