组件化的强化学习模型处理方法、系统、设备和存储介质

被引:0
专利类型
发明
申请号
CN202110171433.3
申请日
2021-02-07
公开(公告)号
CN112862108A
公开(公告)日
2021-05-28
发明(设计)人
朱恒满 周正 张正生 刘永升
申请人
申请人地址
518000 广东省深圳市南山区粤海街道高新区社区高新南九道10号深圳湾科技生态园10栋A2404
IPC主分类号
G06N2000
IPC分类号
代理机构
广州华进联合专利商标代理有限公司 44224
代理人
谢曲曲
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
组件化的强化学习模型处理方法、系统、设备和存储介质 [P]. 
朱恒满 ;
周正 ;
张正生 ;
刘永升 .
中国专利 :CN112862108B ,2024-05-07
[2]
强化学习模型处理方法、装置、计算机设备和存储介质 [P]. 
杨少杰 ;
郭仁杰 ;
杨正云 ;
杨木 ;
武建芳 ;
王善意 ;
邓志弘 ;
朱恒满 ;
张正生 ;
刘永升 .
中国专利 :CN112933604A ,2021-06-11
[3]
用于训练强化学习系统的系统、方法和存储介质 [P]. 
普拉温·迪帕克·斯里尼瓦桑 ;
罗里·费伦 ;
恰达什·阿尔奇切克 ;
阿伦·萨拉·奈尔 ;
塞缪尔·布莱克威尔 ;
维达维亚斯·潘尼尔谢尔万 ;
亚历山德罗·德玛丽亚 ;
沃洛季米尔·姆尼赫 ;
科拉伊·卡武克曲奥卢 ;
大卫·西尔韦 ;
穆斯塔法·苏莱曼 .
中国专利 :CN107209872B ,2017-09-26
[4]
强化学习模型微调方法、装置、计算机设备及存储介质 [P]. 
甘家旭 ;
豆泽阳 ;
蒋阳 .
中国专利 :CN117057413B ,2024-03-15
[5]
基于强化学习的信息处理方法、装置、设备和存储介质 [P]. 
刘卓 ;
孙行智 ;
赵惟 ;
徐卓扬 .
中国专利 :CN110928936A ,2020-03-27
[6]
基于大模型的强化学习模型训练方法、设备及存储介质 [P]. 
严俊杰 ;
高华佐 ;
周亦庄 .
中国专利 :CN117764202A ,2024-03-26
[7]
基于强化学习的投诉处理方法、系统、设备和存储介质 [P]. 
邹颖 ;
李杰 ;
聂彦岭 ;
花磊 ;
赵航 ;
开祥 .
中国专利 :CN121052297A ,2025-12-02
[8]
强化学习模型的训练方法、电子设备及存储介质 [P]. 
曾召华 ;
詹勇 .
中国专利 :CN117997755A ,2024-05-07
[9]
强化学习模型的优化方法、装置、存储介质及电子设备 [P]. 
张棋 ;
杨博 ;
陈贺昌 ;
孙智孝 ;
朴海音 ;
詹光 ;
常毅 .
中国专利 :CN113435606A ,2021-09-24
[10]
基于强化学习的模型训练方法、装置、设备及存储介质 [P]. 
夏灿铭 ;
李论通 ;
彭佩玺 ;
许浩然 ;
常亦谦 ;
谭光 ;
黎文博 ;
许芬 ;
田永鸿 .
中国专利 :CN120563943A ,2025-08-29