面向食品安全事件新闻文本的实体关系抽取研究

被引:29
作者
郑丽敏 [1 ,2 ]
齐珊珊 [1 ]
田立军 [1 ,2 ]
杨璐 [1 ,2 ]
机构
[1] 中国农业大学信息与电气工程学院
[2] 食品质量与安全北京实验室
基金
国家重点研发计划;
关键词
食品安全事件; 实体关系抽取; 依存分析; PU学习; 文本相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
为解决从大规模网络文本中快速、准确识别食品安全事件并进行实体关系抽取受中文复杂语法特性限制的问题,提出一种基于依存分析的面向食品安全事件新闻文本的实体关系抽取方法 FSEERE (Entity relation extraction of food safety events,FSEERE)。该方法结合句子的依存分析结果和实体关系抽取模型,对非结构化中文文本进行无监督的实体关系抽取,并引入一种将文本相似度结合到PU学习(Positive and unlabeled learning)的半监督分类方法,利用改进的特征加权处理方法提高分类精度,使得FSEERE方法能够在高质量的食品安全事件新闻文本中完成实体关系抽取工作。实验结果表明,FSEERE方法在食品安全事件新闻文本数据集和多类型混合新闻文本数据集上的实体关系抽取均达到了先进的性能,F值分别达到了71.21%和67.42%,证明了FSEERE方法的有效性和可移植性。
引用
收藏
页码:244 / 253
页数:10
相关论文
共 6 条
[1]
一种基于远程监督的中文实体关系抽取方法 [D]. 
张硕望 .
南华大学,
2018
[2]
文本分类中特征提取和特征加权方法研究 [D]. 
蒋健 .
重庆大学,
2010
[3]
基于TextRank和簇过滤的林业文本关键信息抽取研究 [J].
陈志泊 ;
李钰曼 ;
许福 ;
冯国明 ;
师栋瑜 ;
崔晓晖 .
农业机械学报 , 2020, (05) :207-214+172
[4]
基于LSTM的食品安全自动问答系统方法研究 [J].
陈瑛 ;
陈昂轩 ;
董玉博 ;
赵筱钰 ;
侯文俊 .
农业机械学报, 2019, 50(S1) (S1) :380-384
[5]
基于卡方统计改进的TF-IDF的文本分类的研究 [J].
王露瑶 ;
张涛 ;
陈才 ;
朱安琥 ;
罗启明 .
电子世界, 2019, (06) :24-25+28
[6]
Chinese Open Relation Extraction and Knowledge Base Establishment [J].
Jia, Shengbin ;
Shijia, E. ;
Li, Maozhen ;
Xiang, Yang .
ACM TRANSACTIONS ON ASIAN AND LOW-RESOURCE LANGUAGE INFORMATION PROCESSING, 2018, 17 (03)