一种基于集群节点计算梯度的分布式强化学习方法及装置

被引:0
专利类型
发明
申请号
CN202311847673.6
申请日
2023-12-28
公开(公告)号
CN117992178A
公开(公告)日
2024-05-07
发明(设计)人
赵亮 鞠鸿彬 何晓 张鹏翼 顾启佳
申请人
中国船舶集团有限公司系统工程研究院 中船智海创新研究院有限公司
申请人地址
100094 北京市海淀区丰贤东路1号
IPC主分类号
G06F9/455
IPC分类号
G06N3/092
代理机构
中国船舶专利中心 11026
代理人
董素沫
法律状态
公开
国省代码
上海市 市辖区
引用
下载
收藏
共 50 条
[1]
一种基于kubernetes容器集群的分布式强化学习方法及装置 [P]. 
叶超 ;
朴海音 ;
陈永红 ;
陶晓洋 ;
樊松源 ;
孙阳 ;
郝一行 ;
王汉 ;
于津 ;
韩玥 ;
杨晟琦 ;
彭宣淇 .
中国专利 :CN113742065A ,2021-12-03
[2]
基于深度强化学习的分布式计算卸载方法及装置 [P]. 
陆绍飞 ;
刘伸 ;
杨贯中 ;
李军义 .
中国专利 :CN114449584A ,2022-05-06
[3]
基于深度强化学习的分布式计算卸载方法及装置 [P]. 
陆绍飞 ;
刘伸 ;
杨贯中 ;
李军义 .
中国专利 :CN114449584B ,2024-06-28
[4]
一种基于Ray的分布式强化学习方法及装置 [P]. 
樊松源 ;
朴海音 ;
孙智孝 ;
孙阳 ;
于津 ;
彭宣淇 ;
韩玥 ;
杨晟琦 ;
詹光 ;
郎魁军 .
中国专利 :CN113920388A ,2022-01-11
[5]
一种基于数字孪生的分布式联邦强化学习方法 [P]. 
唐伦 ;
戴军 ;
成章超 ;
陈前斌 .
中国专利 :CN117056729B ,2025-09-02
[6]
基于异步或同步的深度强化学习分布式训练方法及系统 [P]. 
李明强 ;
唐思琦 ;
陈思 ;
高放 ;
黄彬城 .
中国专利 :CN111191728A ,2020-05-22
[7]
一种基于多智能体强化学习方法的无人机集群分布式协同制导律 [P]. 
曹向辉 ;
吴忠浩 .
中国专利 :CN116610139B ,2025-07-15
[8]
一种多智能体分布式强化学习方法 [P]. 
王勇 ;
袁利 ;
黄煌 ;
韩冬 ;
石恒 ;
王殿佑 .
中国专利 :CN113269329A ,2021-08-17
[9]
一种多智能体分布式强化学习方法 [P]. 
王勇 ;
袁利 ;
黄煌 ;
韩冬 ;
石恒 ;
王殿佑 .
中国专利 :CN113269329B ,2024-03-19
[10]
一种基于Kubernetes容器集群的分布式强化学习系统设计方法 [P]. 
叶超 ;
朴海音 ;
陈永红 ;
陶晓洋 ;
樊松源 ;
孙阳 ;
郝一行 ;
王汉 ;
于津 ;
韩玥 ;
杨晟琦 ;
彭宣淇 .
中国专利 :CN114020413A ,2022-02-08