基于条件随机场的农作物病虫害及农药命名实体识别

被引:79
作者
李想 [1 ]
魏小红 [1 ]
贾璐 [1 ]
陈昕 [1 ]
刘磊 [2 ]
张彦娥 [1 ]
机构
[1] 中国农业大学信息与电气工程学院
[2] 山东老刀网络科技有限公司
基金
北京市自然科学基金;
关键词
病虫害; 农药; 知识库; 命名实体识别; 条件随机场;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
互联网农技问答平台现仅依靠人工提供答题服务,响应速度慢,回答质量难以保证。实现智能农技问题解答,构建农技知识库,需要从现有问答数据提取"农作物-病虫害-农药"命名实体三元组。现有对农业中文命名实体识别的研究较少,且准确率较低。根据农作物、病虫害及农药命名实体的特点,针对农技问答数据,提出基于条件随机场的农作物、病虫害及农药命名实体的识别方法。对数据集进行格式整理及自动分词,并对分词后的语料,针对是否包含特定界定词、是否含特定偏旁部首、是否是数量词、是否是特定左右指界词及词性等特征进行自动标注。利用标注后的数据训练CRF模型,可以对语料进行分类,包括判断语料是否属于农作物、病虫害、农药3类命名实体并识别该语料在复合命名实体中的位置,从而实现了对3类命名实体的识别,由此可自动构建关联三元组。通过试验选择特征组合和调整上下文窗口大小,提高了本方法的识别准确度,降低了模型训练时间,对农作物、病虫害、农药命名实体识别的准确度分别达97.72%、87.63%、98.05%,比现有方法有显著提高。
引用
收藏
页码:178 / 185
页数:8
相关论文
共 12 条
[1]
本体与条件随机场结合的涉农商品名称抽取与类别标注 [J].
黄念娥 ;
黄河 ;
王儒敬 .
计算机应用, 2017, 37 (01) :233-238
[2]
基于条件随机场的中文领域分词研究 [J].
朱艳辉 ;
刘璟 ;
徐叶强 ;
田海龙 ;
马进 .
计算机工程与应用 , 2016, (15) :97-100
[3]
基于词表示方法的生物医学命名实体识别 [J].
李丽双 ;
何红磊 ;
刘珊珊 ;
黄德根 .
小型微型计算机系统, 2016, 37 (02) :302-307
[4]
命名实体识别综述 [J].
陈基 .
现代计算机(专业版), 2016, (03) :24-26
[5]
基于互联网+的农业电子商务发展模式的研究 [J].
于连军 .
农业网络信息, 2015, (11) :19-21
[6]
面向军事文本的命名实体识别 [J].
冯蕴天 ;
张宏军 ;
郝文宁 .
计算机科学, 2015, 42 (07) :15-18+47
[7]
面向微博文本的命名实体识别 [J].
姜仁会 ;
王挺 ;
唐晋韬 .
计算机与数字工程, 2014, 42 (04) :647-651
[8]
基于条件随机场的农业命名实体识别研究 [J].
王春雨 ;
王芳 .
河北农业大学学报, 2014, 37 (01) :132-135
[9]
融合多特征的中文产品命名实体识别 [J].
谷川 ;
周宏宇 ;
于江德 .
科学技术与工程, 2013, 13 (31) :9417-9421+9435
[10]
基于Web的命名实体提取的研究方法 [J].
蔡爱杰 .
哈尔滨师范大学自然科学学报, 2010, 26 (02) :90-94