植物属性文本的命名实体识别方法研究

被引:16
作者
李冬梅
檀稳
机构
[1] 北京林业大学信息学院
关键词
命名实体识别; 双向长短时记忆网络(BiLSTM); 卷积神经网络(CNN); 条件随机场(CRF);
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
植物属性文本的命名实体识别对林业领域的信息抽取和知识图谱的构建起着重要的作用,针对该问题,提出了一种基于双向长短时记忆网络(BiLSTM)、卷积神经网络(CNN)和条件随机场(CRF)模型的植物属性文本命名实体识别方法 BCC-P。分析了植物属性文本的特点,并进行预处理和标注,完成数据集的构建。BCC-P方法通过BiLSTM模型对植物属性文本进行建模,有效捕捉植物属性文本中的上下文语义特征。将获得的特征传递到CNN模型,进一步提取深度特征。最后使用了CRF模型进行植物属性文本的标注,输出在句子序列上最优的标注结果。在植物属性文本语料上的实验表明,该方法的准确率达到了91.8%,因此能够有效应用于植物属性文本的命名实体识别任务。
引用
收藏
页码:2085 / 2093
页数:9
相关论文
共 13 条
[1]
命名实体识别研究综述 [J].
刘浏 ;
王东波 .
情报学报, 2018, 37 (03) :329-340
[2]
基于条件随机场的农作物病虫害及农药命名实体识别 [J].
李想 ;
魏小红 ;
贾璐 ;
陈昕 ;
刘磊 ;
张彦娥 .
农业机械学报, 2017, 48(S1) (S1) :178-185
[3]
面向互联网资源的医学命名实体识别研究 [J].
田家源 ;
杨东华 ;
王宏志 .
计算机科学与探索, 2018, 12 (06) :898-907
[4]
DBpedia Spotlight上的命名实体识别优化 [J].
付宇新 ;
王鑫 ;
冯志勇 ;
徐强 .
计算机科学与探索, 2017, 11 (07) :1044-1055
[5]
统计与规则相结合的维吾尔语人名识别方法 [J].
塔什甫拉提尼扎木丁 ;
汪昆 ;
艾斯卡尔艾木都拉 ;
帕力旦吐尔逊 .
自动化学报, 2017, 43 (04) :653-664
[6]
面向军事文本的命名实体识别 [J].
冯蕴天 ;
张宏军 ;
郝文宁 .
计算机科学, 2015, 42 (07) :15-18+47
[7]
服装类商品属性实体识别 [J].
周详 ;
李少波 ;
杨观赐 .
计算机应用, 2015, 35 (07) :1945-1949
[8]
信息抽取研究综述 [J].
郭喜跃 ;
何婷婷 .
计算机科学, 2015, 42 (02) :14-17+38
[9]
基于变换的中国地名自动识别研究(英文) [J].
谭红叶 ;
郑家恒 ;
刘开瑛 .
软件学报, 2001, (11) :1608-1613
[10]
中文姓名的自动辨识[J] 孙茂松,黄昌宁,高海燕,方捷 中文信息学报 1995, 02