学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于因果大语言模型的强化学习决策优化方法、系统及设备
被引:0
专利类型
:
发明
申请号
:
CN202510944141.7
申请日
:
2025-07-09
公开(公告)号
:
CN120911539A
公开(公告)日
:
2025-11-07
发明(设计)人
:
陈薇
张家豪
蔡瑞初
郝志峰
陈炳丰
王丽娟
申请人
:
广东工业大学
申请人地址
:
510062 广东省广州市越秀区东风东路729号
IPC主分类号
:
G06N3/092
IPC分类号
:
G06N5/04
G06F40/211
代理机构
:
广州粤高专利商标代理有限公司 44102
代理人
:
马云鹏;翁惠珊
法律状态
:
公开
国省代码
:
广东省 广州市
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2025-11-07
公开
公开
2025-11-25
实质审查的生效
实质审查的生效IPC(主分类):G06N 3/092申请日:20250709
共 50 条
[1]
基于大语言模型和强化学习的决策方法、装置及设备
[P].
徐泽来
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
清华大学
徐泽来
;
论文数:
引用数:
h-index:
机构:
于超
;
论文数:
引用数:
h-index:
机构:
汪玉
;
论文数:
引用数:
h-index:
机构:
吴翼
.
中国专利
:CN118260681A
,2024-06-28
[2]
基于大语言模型增强的可解释强化学习决策系统及方法
[P].
论文数:
引用数:
h-index:
机构:
曾云秀
;
论文数:
引用数:
h-index:
机构:
黄鹤松
;
论文数:
引用数:
h-index:
机构:
曾俊杰
;
石超
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民解放军国防科技大学
中国人民解放军国防科技大学
石超
;
论文数:
引用数:
h-index:
机构:
秦龙
;
柴娴
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民解放军国防科技大学
中国人民解放军国防科技大学
柴娴
;
罗宇湘
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民解放军国防科技大学
中国人民解放军国防科技大学
罗宇湘
;
李智能
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民解放军国防科技大学
中国人民解放军国防科技大学
李智能
;
何胜
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民解放军国防科技大学
中国人民解放军国防科技大学
何胜
.
中国专利
:CN120722758A
,2025-09-30
[3]
基于大语言模型增强的可解释强化学习决策系统及方法
[P].
论文数:
引用数:
h-index:
机构:
曾云秀
;
论文数:
引用数:
h-index:
机构:
黄鹤松
;
论文数:
引用数:
h-index:
机构:
曾俊杰
;
石超
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民解放军国防科技大学
中国人民解放军国防科技大学
石超
;
论文数:
引用数:
h-index:
机构:
秦龙
;
柴娴
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民解放军国防科技大学
中国人民解放军国防科技大学
柴娴
;
罗宇湘
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民解放军国防科技大学
中国人民解放军国防科技大学
罗宇湘
;
李智能
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民解放军国防科技大学
中国人民解放军国防科技大学
李智能
;
何胜
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民解放军国防科技大学
中国人民解放军国防科技大学
何胜
.
中国专利
:CN120722758B
,2025-11-14
[4]
基于大语言模型和强化学习的决策支持系统及方法
[P].
论文数:
引用数:
h-index:
机构:
白文松
;
付一超
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
付一超
;
论文数:
引用数:
h-index:
机构:
张超
;
论文数:
引用数:
h-index:
机构:
赵涵斌
;
论文数:
引用数:
h-index:
机构:
钱徽
.
中国专利
:CN119150913A
,2024-12-17
[5]
基于大语言模型和强化学习算法的配方工艺优化方法
[P].
刘雨阳
论文数:
0
引用数:
0
h-index:
0
机构:
幻量科技(上海)有限公司
幻量科技(上海)有限公司
刘雨阳
;
郭权玮
论文数:
0
引用数:
0
h-index:
0
机构:
幻量科技(上海)有限公司
幻量科技(上海)有限公司
郭权玮
.
中国专利
:CN121072473A
,2025-12-05
[6]
基于大语言模型及强化学习的智能客服系统
[P].
朱一琪
论文数:
0
引用数:
0
h-index:
0
机构:
上海汇付支付有限公司
上海汇付支付有限公司
朱一琪
;
周晔
论文数:
0
引用数:
0
h-index:
0
机构:
上海汇付支付有限公司
上海汇付支付有限公司
周晔
;
穆海洁
论文数:
0
引用数:
0
h-index:
0
机构:
上海汇付支付有限公司
上海汇付支付有限公司
穆海洁
;
石英伦
论文数:
0
引用数:
0
h-index:
0
机构:
上海汇付支付有限公司
上海汇付支付有限公司
石英伦
.
中国专利
:CN121051202A
,2025-12-02
[7]
基于大语言模型的辅助分层强化学习训练方法及系统
[P].
论文数:
引用数:
h-index:
机构:
庞豹
;
李千溪
论文数:
0
引用数:
0
h-index:
0
机构:
山东大学
山东大学
李千溪
;
论文数:
引用数:
h-index:
机构:
王江
;
论文数:
引用数:
h-index:
机构:
宋勇
;
傅洪泽
论文数:
0
引用数:
0
h-index:
0
机构:
山东大学
山东大学
傅洪泽
;
论文数:
引用数:
h-index:
机构:
许庆阳
;
论文数:
引用数:
h-index:
机构:
袁宪锋
;
论文数:
引用数:
h-index:
机构:
徐小龙
.
中国专利
:CN119514640B
,2025-10-28
[8]
基于大语言模型的辅助分层强化学习训练方法及系统
[P].
论文数:
引用数:
h-index:
机构:
庞豹
;
李千溪
论文数:
0
引用数:
0
h-index:
0
机构:
山东大学
山东大学
李千溪
;
论文数:
引用数:
h-index:
机构:
王江
;
论文数:
引用数:
h-index:
机构:
宋勇
;
傅洪泽
论文数:
0
引用数:
0
h-index:
0
机构:
山东大学
山东大学
傅洪泽
;
论文数:
引用数:
h-index:
机构:
许庆阳
;
论文数:
引用数:
h-index:
机构:
袁宪锋
;
论文数:
引用数:
h-index:
机构:
徐小龙
.
中国专利
:CN119514640A
,2025-02-25
[9]
安全强化学习驱动的大语言模型安全决策智能体
[P].
论文数:
引用数:
h-index:
机构:
邓岳
;
论文数:
引用数:
h-index:
机构:
高宁
;
论文数:
引用数:
h-index:
机构:
李洪珏
.
中国专利
:CN120688552B
,2025-12-12
[10]
安全强化学习驱动的大语言模型安全决策智能体
[P].
论文数:
引用数:
h-index:
机构:
邓岳
;
论文数:
引用数:
h-index:
机构:
高宁
;
论文数:
引用数:
h-index:
机构:
李洪珏
.
中国专利
:CN120688552A
,2025-09-23
←
1
2
3
4
5
→