学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于多模态反馈与强化学习的大语言模型优化方法和装置
被引:0
专利类型
:
发明
申请号
:
CN202510885917.2
申请日
:
2025-06-30
公开(公告)号
:
CN120386849A
公开(公告)日
:
2025-07-29
发明(设计)人
:
张逸伦
申请人
:
海盐县南北湖医学人工智能研究院
提示词科技(杭州)有限责任公司
申请人地址
:
314399 浙江省嘉兴市海盐县武原街道谢家路1479号7楼
IPC主分类号
:
G06F16/3329
IPC分类号
:
G06F16/334
G06F18/214
G06F18/23
G06N3/092
代理机构
:
北京唯智勤实知识产权代理事务所(普通合伙) 11557
代理人
:
鲍斌
法律状态
:
实质审查的生效
国省代码
:
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2025-08-15
实质审查的生效
实质审查的生效IPC(主分类):G06F 16/3329申请日:20250630
2025-07-29
公开
公开
2025-09-12
授权
授权
共 50 条
[1]
基于多模态反馈与强化学习的大语言模型优化方法和装置
[P].
张逸伦
论文数:
0
引用数:
0
h-index:
0
机构:
海盐县南北湖医学人工智能研究院
海盐县南北湖医学人工智能研究院
张逸伦
.
中国专利
:CN120386849B
,2025-09-12
[2]
基于大语言模型和强化学习的多模态数据处理方法和装置
[P].
郝东林
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
郝东林
;
潘腾飞
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
潘腾飞
.
中国专利
:CN119338011B
,2025-04-04
[3]
基于大语言模型和强化学习的多模态数据处理方法和装置
[P].
郝东林
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
郝东林
;
潘腾飞
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
潘腾飞
.
中国专利
:CN119338011A
,2025-01-21
[4]
基于大语言模型和强化学习算法的配方工艺优化方法
[P].
刘雨阳
论文数:
0
引用数:
0
h-index:
0
机构:
幻量科技(上海)有限公司
幻量科技(上海)有限公司
刘雨阳
;
郭权玮
论文数:
0
引用数:
0
h-index:
0
机构:
幻量科技(上海)有限公司
幻量科技(上海)有限公司
郭权玮
.
中国专利
:CN121072473A
,2025-12-05
[5]
用于大语言模型的强化学习的方法和装置
[P].
阎栋
论文数:
0
引用数:
0
h-index:
0
机构:
北京百川智能科技有限公司
北京百川智能科技有限公司
阎栋
;
李佳莲
论文数:
0
引用数:
0
h-index:
0
机构:
北京百川智能科技有限公司
北京百川智能科技有限公司
李佳莲
.
中国专利
:CN117808120A
,2024-04-02
[6]
大语言模型和强化学习模型的协同方法和装置
[P].
论文数:
引用数:
h-index:
机构:
代季峰
.
中国专利
:CN118377848A
,2024-07-23
[7]
大语言模型和强化学习模型的协同方法和装置
[P].
论文数:
引用数:
h-index:
机构:
代季峰
.
中国专利
:CN118377848B
,2024-10-11
[8]
基于大语言模型和强化学习的决策方法、装置及设备
[P].
徐泽来
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
清华大学
徐泽来
;
论文数:
引用数:
h-index:
机构:
于超
;
论文数:
引用数:
h-index:
机构:
汪玉
;
论文数:
引用数:
h-index:
机构:
吴翼
.
中国专利
:CN118260681A
,2024-06-28
[9]
基于强化学习的大语言模型安全保护防御方法和装置
[P].
何柯阳
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
何柯阳
;
论文数:
引用数:
h-index:
机构:
韩蒙
;
孔德章
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
孔德章
;
林昶廷
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
林昶廷
;
邢文鹏
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
邢文鹏
;
论文数:
引用数:
h-index:
机构:
许海涛
;
谢珍真
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
谢珍真
;
马治国
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
马治国
.
中国专利
:CN120974512A
,2025-11-18
[10]
基于大语言模型的多智能体强化学习探索方法及装置
[P].
论文数:
引用数:
h-index:
机构:
季向阳
;
曲云
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
清华大学
曲云
;
王博源
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
清华大学
王博源
;
蒋雨航
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
清华大学
蒋雨航
;
邵键准
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
清华大学
邵键准
;
论文数:
引用数:
h-index:
机构:
刘畅
;
论文数:
引用数:
h-index:
机构:
王琦
.
中国专利
:CN118333183A
,2024-07-12
←
1
2
3
4
5
→