基于BiLSTM-CRF的关键词自动抽取

被引:30
作者
陈伟 [1 ]
吴友政 [2 ]
陈文亮 [1 ]
张民 [1 ]
机构
[1] 苏州大学计算机科学与技术学院
[2] 爱奇艺人工智能研究组
关键词
自然语言处理; 关键词抽取; 条件随机场; 长短期记忆网络;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
关键词自动抽取是自然语言处理(Natural Language Processing,NLP)的一项重要任务,给个性化推荐、网购等应用提供了重要的技术支撑。针对关键词自动抽取问题,提出一种新的基于双向长短期记忆网络条件随机场(Bidirectional Long Short-Term Memory Network Conditional Random Field,BiLSTM-CRF)的方法,并将该问题刻画为序列标注问题。首先,该方法通过对输入的文本进行建模,把文本表示为低维高密度的向量;然后,使用分类算法对各个词进行分类;最后,使用CRF对整个标注序列进行解码,得到最终结果。在一个大规模的真实数据中进行实验,结果表明该方法较基准系统性能提高约1个百分点。
引用
收藏
页码:91 / 96+113 +113
页数:7
相关论文
共 3 条