基于因果大语言模型的强化学习决策优化方法、系统及设备

被引：0

专利类型：

发明

申请号：

CN202510944141.7

申请日：

2025-07-09

公开(公告)号：

CN120911539A

公开(公告)日：

2025-11-07

发明(设计)人：

陈薇张家豪蔡瑞初郝志峰陈炳丰王丽娟

申请人：

广东工业大学

申请人地址：

510062 广东省广州市越秀区东风东路729号

IPC主分类号：

G06N3/092

IPC分类号：

G06N5/04 G06F40/211

代理机构：

广州粤高专利商标代理有限公司 44102

代理人：

马云鹏;翁惠珊

法律状态：

公开

国省代码：

广东省广州市

引用

下载

收藏

法律状态

法律状态公告日	法律状态	法律状态信息
2025-11-07	公开	公开
2025-11-25	实质审查的生效	实质审查的生效IPC(主分类):G06N 3/092申请日:20250709

共 50 条

[1]

基于大语言模型和强化学习的决策方法、装置及设备 [P].

徐泽来 ;

于超 ;

汪玉 ;

吴翼 .

中国专利 :CN118260681A ,2024-06-28

[2]

基于大语言模型增强的可解释强化学习决策系统及方法 [P].

曾云秀 ;

黄鹤松 ;

曾俊杰 ;

石超 ;

秦龙 ;

柴娴 ;

罗宇湘 ;

李智能 ;

何胜 .

中国专利 :CN120722758A ,2025-09-30

[3]

基于大语言模型增强的可解释强化学习决策系统及方法 [P].

曾云秀 ;

黄鹤松 ;

曾俊杰 ;

石超 ;

秦龙 ;

柴娴 ;

罗宇湘 ;

李智能 ;

何胜 .

中国专利 :CN120722758B ,2025-11-14

[4]

基于大语言模型和强化学习的决策支持系统及方法 [P].

白文松 ;

付一超 ;

张超 ;

赵涵斌 ;

钱徽 .

中国专利 :CN119150913A ,2024-12-17

[5]

基于大语言模型和强化学习算法的配方工艺优化方法 [P].

刘雨阳 ;

郭权玮 .

中国专利 :CN121072473A ,2025-12-05

[6]

基于大语言模型及强化学习的智能客服系统 [P].

朱一琪 ;

周晔 ;

穆海洁 ;

石英伦 .

中国专利 :CN121051202A ,2025-12-02

[7]

基于大语言模型的辅助分层强化学习训练方法及系统 [P].

庞豹 ;

李千溪 ;

王江 ;

宋勇 ;

傅洪泽 ;

许庆阳 ;

袁宪锋 ;

徐小龙 .

中国专利 :CN119514640B ,2025-10-28

[8]

基于大语言模型的辅助分层强化学习训练方法及系统 [P].

庞豹 ;

李千溪 ;

王江 ;

宋勇 ;

傅洪泽 ;

许庆阳 ;

袁宪锋 ;

徐小龙 .

中国专利 :CN119514640A ,2025-02-25

[9]

安全强化学习驱动的大语言模型安全决策智能体 [P].

邓岳 ;

高宁 ;

李洪珏 .

中国专利 :CN120688552B ,2025-12-12

[10]

安全强化学习驱动的大语言模型安全决策智能体 [P].

邓岳 ;

高宁 ;

李洪珏 .

中国专利 :CN120688552A ,2025-09-23

← 1 2 3 4 5 →