基于强化学习的非完全信息博弈方法、系统以及电子设备

被引:0
专利类型
发明
申请号
CN202110196463.X
申请日
2021-02-22
公开(公告)号
CN112926744A
公开(公告)日
2021-06-08
发明(设计)人
余超 谭晋
申请人
申请人地址
510275 广东省广州市海珠区新港西路135号
IPC主分类号
G06N2000
IPC分类号
代理机构
广州三环专利商标代理有限公司 44202
代理人
郭浩辉;颜希文
法律状态
实质审查的生效
国省代码
引用
下载
收藏
共 50 条
[1]
基于双深度Q网络学习的非完全信息博弈策略优化方法 [P]. 
段福庆 ;
周琪斌 ;
韩云涛 .
中国专利 :CN114089627A ,2022-02-25
[2]
基于事后回顾和渐进式扩展的持续强化学习非完全信息博弈方法及装置 [P]. 
王轩 ;
张加佳 ;
漆舒汉 ;
袁昊 ;
刘洋 ;
唐琳琳 ;
夏文 ;
廖清 ;
李君一 ;
杜明欣 .
中国专利 :CN114048834B ,2022-02-15
[3]
基于安全多方计算的非完全信息博弈智能处理方法、系统、终端及存储介质 [P]. 
王轩 ;
孙小真 ;
吴宇琳 ;
任航 ;
张加佳 ;
漆舒汉 ;
施少怀 ;
王强 .
中国专利 :CN120725164B ,2025-12-05
[4]
基于安全多方计算的非完全信息博弈智能处理方法、系统、终端及存储介质 [P]. 
王轩 ;
孙小真 ;
吴宇琳 ;
任航 ;
张加佳 ;
漆舒汉 ;
施少怀 ;
王强 .
中国专利 :CN120725164A ,2025-09-30
[5]
二人零和的非完全信息博弈策略评估方法 [P]. 
段福庆 ;
周琪斌 .
中国专利 :CN114781574A ,2022-07-22
[6]
基于神经网络虚拟自我对局的多人、大规模非完全信息博弈方法及装置 [P]. 
王轩 ;
漆舒汉 ;
张加佳 ;
于梓元 ;
刘洋 ;
唐琳琳 ;
夏文 ;
廖清 ;
蒋琳 ;
张丹丹 .
中国专利 :CN114048833B ,2022-02-15
[7]
一种基于PPO-CFR算法的非完全信息博弈策略优化方法 [P]. 
朱进 ;
黄蕾 .
中国专利 :CN115456181A ,2022-12-09
[8]
不完全信息博弈的决策方法、装置、电子设备与存储介质 [P]. 
张俊格 ;
白栋栋 ;
黄凯奇 ;
郑清元 .
中国专利 :CN114429213A ,2022-05-03
[9]
基于深度强化学习的烟火检测方法、系统以及电子设备 [P]. 
蔡江潮 ;
保安 ;
李新星 .
中国专利 :CN119672639A ,2025-03-21
[10]
基于强化学习的伺服电机控制方法、系统以及电子设备 [P]. 
徐渊 ;
张韬 ;
张霞 ;
张伯强 ;
李柱勇 .
中国专利 :CN120566988A ,2025-08-29