基于深度学习模型的菊花古典诗词命名实体识别

被引:30
作者
崔竞烽
郑德俊
王东波
李婷婷
机构
[1] 南京农业大学信息科技学院
关键词
深度学习; 菊花诗词; 命名实体识别; BERT模型; BiLSTM模型;
D O I
10.16353/j.cnki.1000-7490.2020.11.024
中图分类号
I207.2 [诗歌、韵文]; TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
[目的/意义]菊花古典诗词的命名实体识别有助于深度挖掘菊花诗词文本之间的关联,传承菊花文化,助力菊花产业及乡村文化旅游,同时也为其他花卉诗词的文本深度挖掘提供了思路。[方法/过程]文章通过网络、论文和书籍进行菊花古典诗词数据的采集,重点选择诗词中涉及的时间、地点、季节、花名、花色、人物和节日7类命名实体进行标注和识别,得到BiLSTM、BiLSTM-CRF和BERT模型不同识别结果,并与CRF模型识别结果进行对比。[结果/结论]BERT模型在菊花古诗词文本的命名实体识别中表现优异,实体识别的调和平均数高于其他模型,最优调和平均数达到91.60%。BERT模型可用于菊花古诗词文本的深层次挖掘研究,并可向更多的花卉诗词扩展,古诗词文本的命名实体标注体系可以为后续研究提供借鉴。
引用
收藏
页码:150 / 155
页数:6
相关论文
共 15 条