使用强化学习来选择内容项

被引:0
专利类型
发明
申请号
CN201780047232.4
申请日
2017-07-14
公开(公告)号
CN109643323A
公开(公告)日
2019-04-16
发明(设计)人
本杰明·肯尼斯·科潘 穆斯塔法·苏莱曼 托马斯·查德威克·沃尔特斯 蒂莫西·曼 谢-月·卡尔顿·朱 马丁·苏迈尔 路易斯·卡洛斯·科博·鲁斯 让-弗朗索瓦·克雷斯波
申请人
申请人地址
美国加利福尼亚州
IPC主分类号
G06F169535
IPC分类号
代理机构
中原信达知识产权代理有限责任公司 11219
代理人
李宝泉;周亚荣
法律状态
实质审查的生效
国省代码
引用
下载
收藏
共 50 条
[1]
使用目标和观察来选择强化学习动作 [P]. 
汤姆·绍尔 ;
丹尼尔·乔治·霍根 ;
卡罗尔·格雷戈尔 ;
大卫·西尔韦 .
中国专利 :CN106056213B ,2016-10-26
[2]
使用强化学习选择动作名单 [P]. 
彼得·戈兰·苏内哈格 .
中国专利 :CN108604314B ,2018-09-28
[3]
学习来选择类别特征的词汇 [P]. 
李聪 ;
杰伊·亚当斯 ;
马纳斯·约戈莱卡尔 ;
普拉纳夫·柯海坦 ;
国·V·勒 ;
陈媚 .
中国专利 :CN111652378A ,2020-09-11
[4]
使用优势估计强化学习 [P]. 
顾世翔 ;
蒂莫西·保罗·利利克拉普 ;
伊利亚·苏特思科韦尔 ;
谢尔盖·弗拉迪米尔·莱文 .
中国专利 :CN108701251B ,2018-10-23
[5]
使用教师退火来训练机器学习模型 [P]. 
唐·明·良 ;
国·V·勒 ;
凯文·斯特凡·克拉克 .
美国专利 :CN119378710A ,2025-01-28
[6]
使用教师退火来训练机器学习模型 [P]. 
唐·明·良 ;
国·V·勒 ;
凯文·斯特凡·克拉克 .
美国专利 :CN111598253B ,2024-10-15
[7]
使用教师退火来训练机器学习模型 [P]. 
唐·明·良 ;
国·V·勒 ;
凯文·斯特凡·克拉克 .
中国专利 :CN111598253A ,2020-08-28
[8]
从内容项集合中选择内容项的方法和系统,以及介质 [P]. 
C.弗纳德 ;
A.吉奥吉 ;
T.A.曼恩 .
英国专利 :CN112836117B ,2024-10-18
[9]
使用神经网络的用于强化学习的动作选择 [P]. 
S.奥新德罗 ;
K.卡夫库格鲁 ;
A.维兹尼韦茨 .
中国专利 :CN110546653A ,2019-12-06
[10]
使用代理课程的强化学习 [P]. 
W.恰尔内茨基 ;
S.贾亚库马尔 .
中国专利 :CN112154458A ,2020-12-29