基于核函数中文关系自动抽取系统的实现

被引:58
作者
刘克彬
李芳
刘磊
韩颖
机构
[1] 上海交通大学计算机科学与工程系
关键词
关系抽取; 核函数; 信息抽取; 语义; 机器学习;
D O I
暂无
中图分类号
TP311.52 [];
学科分类号
摘要
实体关系抽取是信息抽取的重要组成部分.基于核函数的中文实体关系自动抽取系统应用改进的语义序列核函数,结合KNN机器学习算法构造分类器来分类并标注关系的类型.通过对ACE评测定义的三大类6子类实体关系的抽取,关系抽取的平均精度可以达到88%,明显高于基于特征向量和传统的序列核函数方法,该方法适合小训练集,易于学习新的实体关系.系统由8个独立的模块构成,便于维护和升级.系统既可以独立运行,也可以嵌入在开放的文本处理平台GATE环境.为了更好地利用关系抽取的结果,系统扩展传统的二元关系,抽取关系的同时,抽取该关系的描述,形成完整的中文实体关系抽取系统.
引用
收藏
页码:1406 / 1411
页数:6
相关论文
共 3 条
  • [1] 实体关系自动抽取
    车万翔
    刘挺
    李生
    [J]. 中文信息学报, 2005, (02) : 1 - 6
  • [2] Latent Semantic Kernels
    Nello Cristianini
    John Shawe-Taylor
    Huma Lodhi
    [J]. Journal of Intelligent Information Systems, 2002, 18 : 127 - 152
  • [3] A Richardella·Kernel methods for relation extraction .2 D Zelenko,C Aone. Journal of Machine Learning Research . 2003