基于知识嵌入强化学习的决策方法、装置、设备及介质

被引:0
专利类型
发明
申请号
CN202311086572.1
申请日
2023-08-28
公开(公告)号
CN117115608B
公开(公告)日
2025-05-23
发明(设计)人
王勇 解永春 李林峰 于欣欣 王敏 陈奥 王殿佑
申请人
北京控制工程研究所
申请人地址
100080 北京市海淀区中关村南三街16号
IPC主分类号
G06V10/80
IPC分类号
G06V10/774 G06F16/36
代理机构
北京格允知识产权代理有限公司 11609
代理人
周娇娇
法律状态
授权
国省代码
北京市
引用
下载
收藏
共 50 条
[1]
强化学习模型训练方法、决策方法、装置、设备及介质 [P]. 
刘建林 ;
解鑫 ;
袁晓敏 ;
许铭 ;
刘颖 .
中国专利 :CN113962362A ,2022-01-21
[2]
基于强化学习模型的疾病排序方法、装置、设备及介质 [P]. 
唐蕊 .
中国专利 :CN112017788A ,2020-12-01
[3]
基于强化学习的推理请求调度方法、装置、设备及介质 [P]. 
高丰 ;
王雪 ;
牛昊一 ;
杨耀 ;
杨建明 ;
孙铭鸽 .
中国专利 :CN120950225A ,2025-11-14
[4]
基于强化学习的临床决策支持设备及方法 [P]. 
陈晓钟 ;
王堃 ;
杜楠 ;
涂旻 ;
张尚卿 ;
谢于晟 ;
范伟 .
美国专利 :CN111916202B ,2025-11-18
[5]
基于强化学习的临床决策支持设备及方法 [P]. 
陈晓钟 ;
王堃 ;
杜楠 ;
涂旻 ;
张尚卿 ;
谢于晟 ;
范伟 .
中国专利 :CN111916202A ,2020-11-10
[6]
知识增强的强化学习车辆决策控制方法及系统 [P]. 
尹智帅 ;
张书霖 ;
曾俊源 ;
聂琳真 ;
黎谦 .
中国专利 :CN118928468A ,2024-11-12
[7]
强化学习模型的训练方法、装置、设备及介质 [P]. 
史鸿远 .
中国专利 :CN120874956A ,2025-10-31
[8]
离线元强化学习模型的训练方法、装置、设备及存储介质 [P]. 
李蓝青 ;
杨瑞 ;
罗迪君 .
中国专利 :CN112348113B ,2021-02-09
[9]
面向复杂场景的强化学习决策方法及装置 [P]. 
王勇 ;
解永春 ;
王敏 ;
李林峰 ;
于欣欣 ;
陈奥 ;
王殿佑 .
中国专利 :CN117493884B ,2025-06-20
[10]
面向复杂场景的强化学习决策方法及装置 [P]. 
王勇 ;
解永春 ;
王敏 ;
李林峰 ;
于欣欣 ;
陈奥 ;
王殿佑 .
中国专利 :CN117493884A ,2024-02-02