复杂中文文本的实体关系抽取研究

被引:1
作者
王苑
徐德智
陈建二
机构
[1] 中南大学信息科学与工程学院
基金
湖南省自然科学基金; 国家自然科学基金重点项目;
关键词
实体关系抽取; 语法特征; 启发式规则; 语义序列核;
D O I
暂无
中图分类号
TP391.1T [];
学科分类号
081203 ; 0835 ;
摘要
实体关系抽取是信息抽取研究领域中的重要研究课题之一。针对已有方法在处理复杂文本上的不足,提出了复杂中文文本的实体关系抽取方法。结合中文文本的语法特征,提出了7条抽取关系特征序列的启发式规则,并采用语义序列核和KNN机器学习算法结合的方法来分类和标注关系的类型。通过对ACE评测定义下的两个子类的实体关系抽取,关系抽取的平均F值达到了76%,明显高于传统的基于特征向量和最短依存路径核的方法。
引用
收藏
页码:208 / 211
页数:4
相关论文
共 6 条
[1]  
现代汉语补语研究.[D].李锦姬.复旦大学.2003, 03
[2]   基于核函数中文关系自动抽取系统的实现 [J].
刘克彬 ;
李芳 ;
刘磊 ;
韩颖 .
计算机研究与发展, 2007, (08) :1406-1411
[3]   中文实体关系抽取中的特征选择研究 [J].
董静 ;
孙乐 ;
冯元勇 ;
黄瑞红 .
中文信息学报, 2007, (04) :80-85+91
[4]   实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[5]   BOOTSTRAPPING FOR EXTRACTING RELATIONS FROM LARGE CORPORA [J].
Li Weigang Liu Ting Li Sheng Information Retrieval Laboratory School of Computer Science and Technology Harbin Institute of Technology Harbin China .
Journal of Electronics(China), 2008, (01) :89-96
[6]  
现代汉语介词结构位置的考察及影响其位置的句法、语义因素分析.[D].魏庭新.北京语言大学.2004, 04