语言学组合特征在语义关系抽取中的应用

被引:36
作者
奚斌
钱龙华
周国栋
朱巧明
钱培德
机构
[1] 苏州大学计算机科学与技术学院江苏省计算机信息处理技术重点实验室
关键词
计算机应用; 中文信息处理; 语义关系抽取; 支持向量机; 组合特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; H087 [数理语言学];
学科分类号
050110 [应用语言学]; 120506 [数字人文];
摘要
语义关系抽取是信息抽取中的一个重要的研究领域。目前基于特征向量的语义关系抽取已经很难通过发掘新的特征来提高抽取的性能。本文提出了一种特征组合方法,通过在各种词法、语法、语义的基本特征内部及特征之间进行合理的组合形成组合特征,使用基于支持向量机的学习方法,使得关系抽取的准确率和召回率得到了提高。在ACE2004语料库的7个关系大类和23个关系子类抽取实验中F值分别达到了66.6%和59.50%。实验结果表明通过对基本语言学特征进行组合所得到的组合特征能够显著地提高语义关系抽取的性能。
引用
收藏
页码:44 / 49+63 +63
页数:7
相关论文
共 3 条
[1]
中文实体关系抽取中的特征选择研究 [J].
董静 ;
孙乐 ;
冯元勇 ;
黄瑞红 .
中文信息学报, 2007, (04) :80-85+91
[2]
实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[3]
信息抽取模式自动生成方法的研究 [J].
郑家恒 ;
王兴义 ;
李飞 .
中文信息学报, 2004, (01) :48-54