基于多分类器的金融领域多元关系信息抽取算法

被引:15
作者
赵小明
朱洪波
陈黎
王亚强
秦湘清
于中华
机构
[1] 四川大学计算机学院
关键词
事件抽取; 事件识别; 角色识别; 多元关系; 有监督学习;
D O I
10.16208/j.issn1000-7024.2011.07.026
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
为深入分析金融领域文本信息给投资决策提供支持,研究了从中文文本中识别收购类事件描述句及抽取事件角色(即识别关系及关系的元)相关问题。在事件句的识别上,提出了基于SVM的有监督算法。对于关系识别及关系元的抽取,针对多元关系的特点,分别设计了单分类器的算法和多分类器的算法,单分类器的算法由一个分类器负责识别多元关系的所有角色,而多分类器算法使用不同的分类器来识别具有不同语义约束的角色。实验结果表明,多分类器的算法明显优于单分类的算法,角色识别的F-Measure可以提高1.9%。
引用
收藏
页码:2348 / 2351
页数:4
相关论文
共 2 条
[1]
自由文本的信息抽取模式获取的研究 [D]. 
姜吉发 .
中国科学院研究生院(计算技术研究所),
2004
[2]
中文事件抽取中事件类别的自动识别.[A].赵妍妍;王啸吟;秦兵;车万翔;刘挺;.第三届学生计算语言学研讨会.2006,