面向电力智能问答系统的命名实体识别算法

被引:46
作者
杨维 [1 ]
孙德艳 [2 ]
张晓慧 [1 ]
李子乾 [1 ]
李承桓 [1 ]
吴佐平 [2 ]
机构
[1] 国家电网有限公司客户服务中心
[2] 北京中电普华信息技术有限公司
关键词
命名实体识别; 条件随机场; 智能问答系统; 文本挖掘; 自然语言处理;
D O I
10.16208/j.issn1000-7024.2019.12.043
中图分类号
TM73 [电力系统的调度、管理、通信]; TP391.1 [文字信息处理];
学科分类号
120103 [信息系统与信息管理]; 120506 [数字人文];
摘要
针对现有电力系统中智能客服机器人语义理解能力不足、关键词定位不准等问题,提出基于条件随机场(conditional random field,CRF)的命名实体识别(named entity recognition,NER)算法。根据实际的电力服务问答数据集,构建领域专用知识库,对语料进行分词与自动标注,并提取出"(地点,故障,解决方案)"的命名实体三元组。在标注后的问答语料数据集上对识别模型进行训练,可以对语料中与3类命名实体关联的关键词进行定位,实现对3类实体的识别并自动构建三元组。在测试语料上的实验结果表明,该算法相对现有方法有效提高了对位置、故障和解决方案3类实体的识别准确率,分别达到了96.44%、92.04%和95.12%。
引用
收藏
页码:3625 / 3630
页数:6
相关论文
共 9 条
[1]
基于双向LSTM神经网络电子病历命名实体的识别模型 [J].
杨红梅 ;
李琳 ;
杨日东 ;
周毅 .
中国组织工程研究, 2018, 22 (20) :3237-3242
[2]
一种面向微博文本的命名实体识别方法 [J].
李刚 ;
黄永峰 .
电子技术应用, 2018, 44 (01) :118-120+124
[3]
基于条件随机场的农作物病虫害及农药命名实体识别 [J].
李想 ;
魏小红 ;
贾璐 ;
陈昕 ;
刘磊 ;
张彦娥 .
农业机械学报, 2017, 48(S1) (S1) :178-185
[4]
[5]
基于词表示方法的生物医学命名实体识别 [J].
李丽双 ;
何红磊 ;
刘珊珊 ;
黄德根 .
小型微型计算机系统, 2016, 37 (02) :302-307
[6]
面向军事文本的命名实体识别 [J].
冯蕴天 ;
张宏军 ;
郝文宁 .
计算机科学, 2015, 42 (07) :15-18+47
[7]
基于语音分析技术的电力客户服务质量检测与分析探究 [J].
王大伟 .
电子测试, 2014, (05) :100-101
[8]
基于Hadoop平台和隐马尔可夫模型的生物医学命名实体识别方法研究 [D]. 
李世超 .
西北农林科技大学,
2017
[9]
电网大数据分析工具的研究与实现.[D].郑海敏.北京邮电大学.2016, 04