电力设备典型故障案例的文本挖掘

被引:68
作者
杜修明 [1 ]
秦佳峰 [1 ]
郭诗瑶 [2 ]
闫丹凤 [2 ]
机构
[1] 国网山东省电力公司电力科学研究院
[2] 北京邮电大学网络与交换国家重点实验室
基金
国家高技术研究发展计划(863计划);
关键词
文本挖掘; 电力设备故障案例; BiLSTM; 分布式表示; CNN;
D O I
10.13336/j.1003-6520.hve.20180329005
中图分类号
TM507 [维护、检修];
学科分类号
080801 ;
摘要
国家电网公司信息化工作中积累的大量典型故障案例多为描述性文本数据,很难利用自动化手段理解和分析。针对此一问题利用文本挖掘技术从故障案例中抽取故障问题和原因形成故障的因果关系,从而为故障文本的下一步挖掘提供必要条件。挖掘采用的方法是先将因果关系的抽取问题转化为对句子的3分类问题,缩小了目标集,提高了准确率;再将句子用分布式文本表示,利用双向长短期记忆网络(Bi LSTM),分类模型提取事件句的深层语义特征。变压器故障案例的实验结果表明Bi LSTM相比于单向LSTM、卷积神经网络(CNN)处理故障文本句子分类效果更优,对故障和原因信息的提取准确率更高,精确率和召回率的平均调和值达67%。
引用
收藏
页码:1078 / 1084
页数:7
相关论文
共 10 条
[1]   基于大数据挖掘技术的输变电设备故障诊断方法 [J].
胡军 ;
尹立群 ;
李振 ;
郭丽娟 ;
段炼 ;
张玉波 .
高电压技术, 2017, 43 (11) :3690-3697
[2]   文本信息挖掘技术及其在断路器全寿命状态评价中的应用 [J].
邱剑 ;
王慧芳 ;
应高亮 ;
张波 ;
邹国平 ;
何奔腾 .
电力系统自动化, 2016, 40 (06) :107-112+118
[3]   在配电网中应用大数据的机遇与挑战 [J].
苗新 ;
张东霞 ;
孙德栋 .
电网技术, 2015, 39 (11) :3122-3127
[4]   Word2vec的核心架构及其应用 [J].
熊富林 ;
邓怡豪 ;
唐晓晟 .
南京师范大学学报(工程技术版), 2015, 15 (01) :43-48
[5]   基于虚拟仪器技术和神经网络的电晕辐射场监测系统设计 [J].
朱利 ;
刘尚合 ;
张悦 ;
吴启蒙 ;
刘卫东 .
高电压技术, 2015, 41 (01) :333-338
[6]   智能配电网大数据应用技术与前景分析 [J].
赵腾 ;
张焰 ;
张东霞 .
电网技术, 2014, 38 (12) :3305-3312
[7]   智能电网大数据处理技术现状与挑战 [J].
宋亚奇 ;
周国亮 ;
朱永利 .
电网技术, 2013, 37 (04) :927-935
[8]   国家电网公司直流输电系统可靠性统计与分析 [J].
喻新强 .
电网技术, 2009, 33 (12) :1-7
[9]  
电力中文文本数据挖掘技术及其在可靠性中的应用研究[D]. 邱剑.浙江大学 2016
[10]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780