基于特征选择的人物关系抽取方法

被引:21
作者
黄卫春
范少帅
熊李艳
钟茂生
机构
[1] 华东交通大学信息工程学院
关键词
关系抽取; SVM; 特征选择; 多分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
在人物关系抽取中,其特征空间维度往往非常高,会造成向量稀疏问题,从而影响关系抽取的效率。针对这一现象,首先将人物关系分为6类;然后引入了文档频率、信息增益、互信息和χ2统计这四种文本文类的特征选择算法,对特征空间进行降维。最后运用SVM分类器抽取人物的实体关系。实验结果表明这四种特征选择算法不仅能够保证抽取性能,还能有效的降低向量空间维数,极大提高关系抽取效率。其中,χ2统计算法效果最佳,信息增益次之。
引用
收藏
页码:254 / 259
页数:6
相关论文
共 7 条
[1]
Tree kernel-based semantic relation extraction with rich syntactic and semantic information.[J].Guodong Zhou;Longhua Qian;Jianxi Fan.Information Sciences.2009, 8
[2]
Exploring syntactic structured features over parse trees for relation extraction using kernel methods.[J].Min Zhang;GuoDong Zhou;Aiti Aw.Information Processing and Management.2007, 2
[3]
Kernel-Based Semantic Relation Detection and Classification via Enriched Parse Tree Structure [J].
周国栋 ;
朱巧明 .
Journal of Computer Science & Technology, 2011, 26 (01) :45-56
[4]
基于特征组合的中文实体关系抽取 [J].
黄鑫 ;
朱巧明 ;
钱龙华 ;
刘梅梅 .
微电子学与计算机, 2010, 27 (04) :198-200+204
[5]
一种改进的文本特征选择方法的研究与设计 [J].
许高建 ;
路遥 ;
胡学钢 ;
涂立静 .
苏州大学学报(工科版), 2008, (02) :18-22
[6]
BOOTSTRAPPING FOR EXTRACTING RELATIONS FROM LARGE CORPORA [J].
Li Weigang Liu Ting Li Sheng Information Retrieval Laboratory School of Computer Science and Technology Harbin Institute of Technology Harbin China .
Journal of Electronics(China), 2008, (01) :89-96
[7]
实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6