基于凸组合核函数的中文领域实体关系抽取

被引:8
作者
陈鹏 [1 ]
郭剑毅 [1 ,2 ]
余正涛 [1 ,2 ]
线岩团 [1 ,2 ]
严馨 [1 ,2 ]
魏斯超 [1 ]
机构
[1] 昆明理工大学信息工程与自动化学院
[2] 昆明理工大学智能信息处理重点实验室
关键词
关系抽取; 凸组合核函数; 支持向量机;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对在采用支持核函数的机器学习算法进行基于特征的中文领域实体关系抽取中,不同核函数对不同中文领域关系抽取在效果上存在差异性的问题,该文提出一种基于凸组合核函数的中文领域实体关系抽取方法。首先,选取实体上下文的词、词性等信息,短语句法树信息及依存信息作为特征,然后通过以径向基核函数,Sigmoid核函数及多项式核函数组成的不同组合比例的凸组合核函数将特征矩阵映射成为不同的高维矩阵,利用支持向量机训练这些高维矩阵构建不同分类模型后测试抽取性能,以确定最优组合比例的凸组合核函数。在收集600篇旅游领域语料上进行关系抽取,实验结果表明最优凸组合核函数能增加实体关系抽取效果,F值达到62.9。
引用
收藏
页码:144 / 148+155 +155
页数:6
相关论文
共 7 条
[1]   基于组合核的蛋白质交互关系抽取 [J].
李丽双 ;
刘洋 ;
黄德根 .
中文信息学报, 2013, (01) :86-92+128
[2]   依存信息在蛋白质关系抽取中的作用 [J].
刘兵 ;
钱龙华 ;
徐华 ;
周国栋 .
中文信息学报, 2011, (02) :21-26
[3]   基于层叠条件随机场的旅游领域命名实体识别 [J].
郭剑毅 ;
薛征山 ;
余正涛 ;
张志坤 ;
张宜浩 ;
姚贤明 .
中文信息学报, 2009, (05) :47-52
[4]   基于核方法的中文实体关系抽取研究 [J].
黄瑞红 ;
孙乐 ;
冯元勇 ;
黄云平 .
中文信息学报, 2008, (05) :102-108
[5]   语言学组合特征在语义关系抽取中的应用 [J].
奚斌 ;
钱龙华 ;
周国栋 ;
朱巧明 ;
钱培德 .
中文信息学报, 2008, (03) :44-49+63
[6]   中文实体关系抽取中的特征选择研究 [J].
董静 ;
孙乐 ;
冯元勇 ;
黄瑞红 .
中文信息学报, 2007, (04) :80-85+91
[7]   实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6