用于强化学习的模型训练方法及装置、电子设备、介质

被引:0
专利类型
发明
申请号
CN202410911003.4
申请日
2024-07-08
公开(公告)号
CN118821971A
公开(公告)日
2024-10-22
发明(设计)人
王昊 徐骄阳 杨明川 李伟
申请人
中国电信股份有限公司技术创新中心 中国电信股份有限公司
申请人地址
102209 北京市昌平区北七家镇未来科技城南区中国电信北京信息科技创新园11层1118室、1116室
IPC主分类号
G06N20/00
IPC分类号
G06N3/098 G06N3/0455 G06N3/0475 G06N3/047 G06F18/2321
代理机构
北京律智知识产权代理有限公司 11438
代理人
宿彦博
法律状态
实质审查的生效
国省代码
北京市 市辖区
引用
下载
收藏
共 50 条
[1]
强化学习模型训练方法、装置、电子设备及存储介质 [P]. 
谢树雷 ;
曾子胤 .
中国专利 :CN120633761B ,2025-10-31
[2]
强化学习模型训练方法、装置、电子设备及存储介质 [P]. 
谢树雷 ;
曾子胤 .
中国专利 :CN120633761A ,2025-09-12
[3]
基于强化学习的模型训练方法和装置、电子设备及介质 [P]. 
王文 ;
王健宗 ;
黄章成 .
中国专利 :CN114974424B ,2025-03-11
[4]
用于构建强化学习模型的方法、装置、电子设备及介质 [P]. 
刘颖 ;
解鑫 ;
许铭 ;
齐月震 ;
李瑞锋 ;
白璐 .
中国专利 :CN112100916A ,2020-12-18
[5]
深度强化学习模型训练方法、装置、电子设备及存储介质 [P]. 
杜梦雪 ;
暴宇健 .
中国专利 :CN116596060B ,2024-03-15
[6]
强化学习模型训练方法、决策方法、装置、设备及介质 [P]. 
刘建林 ;
解鑫 ;
袁晓敏 ;
许铭 ;
刘颖 .
中国专利 :CN113962362A ,2022-01-21
[7]
多任务学习模型训练方法、装置、电子设备及存储介质 [P]. 
刘继宇 .
中国专利 :CN115146792A ,2022-10-04
[8]
多任务学习模型训练方法、装置、电子设备及存储介质 [P]. 
刘羲 ;
舒畅 ;
陈又新 .
中国专利 :CN114913371A ,2022-08-16
[9]
多任务学习模型训练方法、装置、电子设备及存储介质 [P]. 
刘羲 ;
舒畅 ;
陈又新 .
中国专利 :CN114913371B ,2024-10-22
[10]
多任务学习模型训练方法、装置、电子设备及存储介质 [P]. 
刘继宇 .
中国专利 :CN115146792B ,2025-08-19