学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
大语言模型和强化学习模型的协同方法和装置
被引:0
专利类型
:
发明
申请号
:
CN202410798640.5
申请日
:
2024-06-20
公开(公告)号
:
CN118377848B
公开(公告)日
:
2024-10-11
发明(设计)人
:
代季峰
申请人
:
清华大学
申请人地址
:
100084 北京市海淀区清华园1号
IPC主分类号
:
G06F16/33
IPC分类号
:
G06F16/48
G06N3/092
代理机构
:
北京林达刘知识产权代理事务所(普通合伙) 11277
代理人
:
李茂家;周蕾
法律状态
:
实质审查的生效
国省代码
:
北京市 市辖区
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2024-08-09
实质审查的生效
实质审查的生效IPC(主分类):G06F 16/33申请日:20240620
2024-10-11
授权
授权
2024-07-23
公开
公开
共 50 条
[1]
大语言模型和强化学习模型的协同方法和装置
[P].
论文数:
引用数:
h-index:
机构:
代季峰
.
中国专利
:CN118377848A
,2024-07-23
[2]
用于大语言模型的强化学习的方法和装置
[P].
阎栋
论文数:
0
引用数:
0
h-index:
0
机构:
北京百川智能科技有限公司
北京百川智能科技有限公司
阎栋
;
李佳莲
论文数:
0
引用数:
0
h-index:
0
机构:
北京百川智能科技有限公司
北京百川智能科技有限公司
李佳莲
.
中国专利
:CN117808120A
,2024-04-02
[3]
基于大语言模型和强化学习的决策方法、装置及设备
[P].
徐泽来
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
清华大学
徐泽来
;
论文数:
引用数:
h-index:
机构:
于超
;
论文数:
引用数:
h-index:
机构:
汪玉
;
论文数:
引用数:
h-index:
机构:
吴翼
.
中国专利
:CN118260681A
,2024-06-28
[4]
基于强化学习的大语言模型安全保护防御方法和装置
[P].
何柯阳
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
何柯阳
;
论文数:
引用数:
h-index:
机构:
韩蒙
;
孔德章
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
孔德章
;
林昶廷
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
林昶廷
;
邢文鹏
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
邢文鹏
;
论文数:
引用数:
h-index:
机构:
许海涛
;
谢珍真
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
谢珍真
;
马治国
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
马治国
.
中国专利
:CN120974512A
,2025-11-18
[5]
基于强化学习策略的大语言模型训练方法、装置和设备
[P].
文祎琳
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
文祎琳
;
吕中厚
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
吕中厚
;
陈沐晗
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
陈沐晗
;
包沉浮
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
包沉浮
;
王国秋
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
王国秋
;
田伟娟
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
田伟娟
;
颜廷玉
论文数:
0
引用数:
0
h-index:
0
机构:
北京百度网讯科技有限公司
北京百度网讯科技有限公司
颜廷玉
.
中国专利
:CN121031780A
,2025-11-28
[6]
基于大语言模型和深度强化学习的虚拟电厂调度方法
[P].
金俊安
论文数:
0
引用数:
0
h-index:
0
机构:
南京邮电大学
南京邮电大学
金俊安
;
论文数:
引用数:
h-index:
机构:
付蓉
;
丁逸文
论文数:
0
引用数:
0
h-index:
0
机构:
南京邮电大学
南京邮电大学
丁逸文
.
中国专利
:CN120671983A
,2025-09-19
[7]
基于大语言模型和强化学习算法的配方工艺优化方法
[P].
刘雨阳
论文数:
0
引用数:
0
h-index:
0
机构:
幻量科技(上海)有限公司
幻量科技(上海)有限公司
刘雨阳
;
郭权玮
论文数:
0
引用数:
0
h-index:
0
机构:
幻量科技(上海)有限公司
幻量科技(上海)有限公司
郭权玮
.
中国专利
:CN121072473A
,2025-12-05
[8]
基于大语言模型和强化学习的多模态数据处理方法和装置
[P].
郝东林
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
郝东林
;
潘腾飞
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
潘腾飞
.
中国专利
:CN119338011B
,2025-04-04
[9]
基于大语言模型和强化学习的多模态数据处理方法和装置
[P].
郝东林
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
郝东林
;
潘腾飞
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
潘腾飞
.
中国专利
:CN119338011A
,2025-01-21
[10]
基于多模态反馈与强化学习的大语言模型优化方法和装置
[P].
张逸伦
论文数:
0
引用数:
0
h-index:
0
机构:
海盐县南北湖医学人工智能研究院
海盐县南北湖医学人工智能研究院
张逸伦
.
中国专利
:CN120386849A
,2025-07-29
←
1
2
3
4
5
→