实体关系表达的是衔接两个对象之间的某种联系,在自动问答,信息检索等领域有着非常重要的作用,关系抽取任务就是从大量无结构或者半结构数据中准确快速地抽取出这种联系,提高信息的利用率。web2.0时代开始,网络数据呈指数倍增长,包含了更多有价值的知识以及无价值的噪声,这对关系抽取任务提出了更高的要求,关系抽取研究也日益得到专家学者的重视。目前较成熟的的关系抽取研究方法需要确定研究领域,且标注训练语料,指定关系类型,选取特征,训练分类器等工作均需人工处理,众多人工操作费时费力。据此,本文提出基于远程监督(distant supervision)和强化学习的关系抽取方法致力于解决上述问题。本文研究工作包括以下三个方面:首先,利用远程监督的思想,提取不同知识库之间的冗余信息,自动标注语料。同时针对自动标注可能存在的噪声问题,使用词汇语义相似度算法进行去噪,提高抽取精度。然后,使用近年来关系抽取研究中常用特征作为初始特征,利用随机森林算法测试特征的表征能力,过滤掉表征能力弱的特征。最后,使用Adaboost强化学习方法,构建多个弱分类器,训练得到最终的强分类器,并完成对实体关系的抽取。本文提出的方法使关系抽取的性能明显提高。在测试实验中,取得了71.6%的准确率和76.8%的召回率。