维基百科中的实体关系抽取研究

被引:4
作者
李斌
马宁
蒋平
郭玉良
机构
[1] 安徽广播电视大学开放教育学院
关键词
实体识别; 关系抽取; 维基百科; 特征选择;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文介绍了一种在维基百科文档中进行实体关系抽取的方法。首先根据维基百科文档中的超链接特征识别相关的实体,然后抽取文档中关于实体的类别信息、消歧信息、关键词等特征,并采用向量空间模型来表示。最后通过计算待测实体对与训练实体对的相似度,得出待测实体对所属的关系类别。我们分别对实体关系抽取进行了封闭测试和开放测试实验,并取得了较好的测试结果。
引用
收藏
页码:142 / 144+146 +146
页数:4
相关论文
共 3 条
[1]  
自动抽取维基百科文本中的语义关系.[D].王刚.上海交通大学.2008, 06
[2]  
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11
[3]   实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6