学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
用于大语言模型的强化学习的方法和装置
被引:0
专利类型
:
发明
申请号
:
CN202311866241.X
申请日
:
2023-12-29
公开(公告)号
:
CN117808120A
公开(公告)日
:
2024-04-02
发明(设计)人
:
阎栋
李佳莲
申请人
:
北京百川智能科技有限公司
申请人地址
:
100086 北京市海淀区中关村东路1号院8号楼15层B1701
IPC主分类号
:
G06N20/00
IPC分类号
:
G06F18/214
代理机构
:
北京市柳沈律师事务所 11105
代理人
:
张贵东
法律状态
:
公开
国省代码
:
引用
下载
收藏
法律状态
法律状态公告日
法律状态
法律状态信息
2024-04-02
公开
公开
2024-04-19
实质审查的生效
实质审查的生效IPC(主分类):G06N 20/00申请日:20231229
共 50 条
[1]
一种大语言模型的强化学习训练方法及相关设备
[P].
霍亮宇
论文数:
0
引用数:
0
h-index:
0
机构:
度小满科技(北京)有限公司
度小满科技(北京)有限公司
霍亮宇
;
杨青
论文数:
0
引用数:
0
h-index:
0
机构:
度小满科技(北京)有限公司
度小满科技(北京)有限公司
杨青
.
中国专利
:CN119990303A
,2025-05-13
[2]
大语言模型和强化学习模型的协同方法和装置
[P].
论文数:
引用数:
h-index:
机构:
代季峰
.
中国专利
:CN118377848A
,2024-07-23
[3]
大语言模型和强化学习模型的协同方法和装置
[P].
论文数:
引用数:
h-index:
机构:
代季峰
.
中国专利
:CN118377848B
,2024-10-11
[4]
大语言模型的强化学习训练方法、装置、设备及存储介质
[P].
赵鑫
论文数:
0
引用数:
0
h-index:
0
机构:
北京达佳互联信息技术有限公司
北京达佳互联信息技术有限公司
赵鑫
;
陈志朋
论文数:
0
引用数:
0
h-index:
0
机构:
北京达佳互联信息技术有限公司
北京达佳互联信息技术有限公司
陈志朋
;
张鸿志
论文数:
0
引用数:
0
h-index:
0
机构:
北京达佳互联信息技术有限公司
北京达佳互联信息技术有限公司
张鸿志
;
张富峥
论文数:
0
引用数:
0
h-index:
0
机构:
北京达佳互联信息技术有限公司
北京达佳互联信息技术有限公司
张富峥
.
中国专利
:CN120387495A
,2025-07-29
[5]
一种大语言模型的强化学习训练方法及装置
[P].
周璟
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
周璟
;
应缜哲
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
应缜哲
;
鲍孝慈
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
鲍孝慈
;
陈华
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
陈华
;
孟昌华
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
孟昌华
;
王维强
论文数:
0
引用数:
0
h-index:
0
机构:
支付宝(杭州)数字服务技术有限公司
支付宝(杭州)数字服务技术有限公司
王维强
.
中国专利
:CN121168564A
,2025-12-19
[6]
基于大语言模型和强化学习的决策方法、装置及设备
[P].
徐泽来
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
清华大学
徐泽来
;
论文数:
引用数:
h-index:
机构:
于超
;
论文数:
引用数:
h-index:
机构:
汪玉
;
论文数:
引用数:
h-index:
机构:
吴翼
.
中国专利
:CN118260681A
,2024-06-28
[7]
基于强化学习的大语言模型安全保护防御方法和装置
[P].
何柯阳
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
何柯阳
;
论文数:
引用数:
h-index:
机构:
韩蒙
;
孔德章
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
孔德章
;
林昶廷
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
林昶廷
;
邢文鹏
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
邢文鹏
;
论文数:
引用数:
h-index:
机构:
许海涛
;
谢珍真
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
谢珍真
;
马治国
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学
浙江大学
马治国
.
中国专利
:CN120974512A
,2025-11-18
[8]
基于大语言模型和强化学习的多模态数据处理方法和装置
[P].
郝东林
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
郝东林
;
潘腾飞
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
潘腾飞
.
中国专利
:CN119338011B
,2025-04-04
[9]
用于提升大语言模型数学能力的强化学习方法及相关装置
[P].
论文数:
引用数:
h-index:
机构:
丁宁
;
曾梓南
论文数:
0
引用数:
0
h-index:
0
机构:
西安交通大学
西安交通大学
曾梓南
;
王浩颖
论文数:
0
引用数:
0
h-index:
0
机构:
西安交通大学
西安交通大学
王浩颖
;
论文数:
引用数:
h-index:
机构:
丁贞煜
;
梁益铭
论文数:
0
引用数:
0
h-index:
0
机构:
西安交通大学
西安交通大学
梁益铭
.
中国专利
:CN120832930A
,2025-10-24
[10]
基于大语言模型和强化学习的多模态数据处理方法和装置
[P].
郝东林
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
郝东林
;
潘腾飞
论文数:
0
引用数:
0
h-index:
0
机构:
北京智源人工智能研究院
北京智源人工智能研究院
潘腾飞
.
中国专利
:CN119338011A
,2025-01-21
←
1
2
3
4
5
→