基于多分类SVM-KNN的实体关系抽取方法

被引:21
作者
刘绍毓
周杰
李弼程
席耀一
唐浩浩
机构
[1] 解放军信息工程大学信息系统工程学院
关键词
支持向量机; KNN; 双投票; 实体关系抽取;
D O I
10.16337/j.1004-9037.2015.01.020
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
实体关系抽取是信息抽取领域的重要研究课题之一。传统的实体关系抽取研究注重于从实体对出现的上下文中提取词法和语义等特征,然后利用分类器(如SVM)进行实体关系抽取,但该类方法忽略了分类器对实体抽取性能的影响。针对SVM分类器对超平面附近样本分类正确率低的问题,本文设计了一种基于双投票机制的SVM模糊样本选择方法。在此基础上,对确定区域样本直接使用SVM分类器进行分类,并利用KNN算法对模糊区域样本进行二次分类。在SemEval-2010评测任务提供的实体关系抽取数据上进行实验,实验结果表明该方法能较大提高实体关系抽取的性能。
引用
收藏
页码:202 / 210
页数:9
相关论文
共 13 条
[1]   一种基于依存文法的需求文本策略依赖关系抽取方法 [J].
李天颍 ;
刘璘 ;
赵德旺 ;
曹原 .
计算机学报, 2013, 36 (01) :54-62
[2]   基于SVM和扩展条件随机场的Web实体活动抽取 [J].
张传岩 ;
洪晓光 ;
彭朝晖 ;
李庆忠 .
软件学报, 2012, 23 (10) :2612-2627
[3]  
基于组合核的中文实体关系抽取研究[J]. 李丽双,党延忠,张婧,王敏.情报学报. 2012 (07)
[4]   基于维基百科和模式聚类的实体关系抽取方法 [J].
张苇如 ;
孙乐 ;
韩先培 .
中文信息学报, 2012, 26 (02) :75-81+127
[5]   基于语义角色的实体关系抽取 [J].
毛小丽 ;
何中市 ;
邢欣来 ;
刘莉 .
计算机工程, 2011, 37 (17) :143-145
[6]   基于信息熵的半监督领域实体关系抽取研究 [J].
郭剑毅 ;
雷春雅 ;
余正涛 ;
苏磊 ;
赵君 ;
田维 .
山东大学学报(工学版), 2011, 41 (04) :7-12
[7]   基于卷积树核的无指导中文实体关系抽取研究 [J].
黄晨 ;
钱龙华 ;
周国栋 ;
朱巧明 .
中文信息学报, 2010, (04) :11-17
[8]   汉语实体关系模式的自动获取研究 [J].
邓擘 ;
郑彦宁 ;
傅继彬 .
计算机科学, 2010, 37 (02) :183-185
[9]   多类支持向量机推广性能分析 [J].
闫志刚 ;
杜培军 .
数据采集与处理, 2009, 24 (04) :469-475
[10]  
基于信息粒度的交叠类文本分类方法[J]. 林琛,李弼程,周杰.情报学报. 2011 (04)