电力文本数据挖掘现状及挑战

被引:52
作者
王慧芳 [1 ]
曹靖 [1 ]
罗麟 [2 ]
机构
[1] 浙江大学电气工程学院
[2] 国网浙江省电力有限公司舟山供电公司
关键词
电力大数据; 文本数据; 数据挖掘; 自然语言处理; 电力设备; 缺陷文本;
D O I
10.19585/j.zjdl.201903001
中图分类号
TM76 [电力系统的自动化]; TP391.1 [文字信息处理];
学科分类号
080802 [电力系统及其自动化]; 120506 [数字人文];
摘要
文本数据是电力大数据的重要组成部分,对其进行有效挖掘是智能电网深入、全面发展的需要。在目前已有研究成果的基础上,对电力领域文本数据挖掘的现状及挑战进行了深入剖析。首先分析了文本挖掘技术的发展过程及存在难题;接着重点分析了电力文本数据挖掘的关键技术及其研究现状,包括文本预处理技术、文本表示方法以及数据挖掘方法;然后以电力设备缺陷文本为对象,介绍了文本挖掘技术在电力领域的应用,包括缺陷文本质量的提升与保证、缺陷文本严重程度自动分类、缺陷发生部件及程度的自动提取、缺陷文本检索、基于缺陷文本的电力设备健康状态评价等,可为其他类型电力文本的挖掘提供参考;最后,探讨了电力文本挖掘面临的挑战以及未来发展方向。
引用
收藏
页码:1 / 7
页数:7
相关论文
共 18 条
[1]
电力中文文本数据挖掘技术及其在可靠性中的应用研究 [D]. 
邱剑 .
浙江大学,
2016
[2]
基于生物医学文本挖掘的蛋白质间相互作用关系抽取方法的研究 [D]. 
包振栋 .
西北农林科技大学,
2017
[3]
基于文本分类技术的垃圾邮件过滤研究 [D]. 
张小花 .
安徽大学,
2017
[4]
电网设备缺陷文本的质量评价与提升方法 [J].
邵冠宇 ;
王慧芳 ;
何奔腾 .
电网技术, 2019, 43 (04) :1472-1479
[5]
基于知识图谱技术的电力设备缺陷记录检索方法 [J].
刘梓权 ;
王慧芳 .
电力系统自动化, 2018, 42 (14) :158-164
[6]
“智能电网+”研究综述 [J].
鞠平 ;
周孝信 ;
陈维江 ;
余一平 ;
秦川 ;
李若梅 ;
王成山 ;
董旭柱 ;
刘健 ;
文劲宇 ;
刘玉田 ;
李扬 ;
陈庆 ;
陆晓 ;
孙大雁 ;
徐春雷 ;
陈星莺 ;
吴峰 ;
马宏忠 .
电力自动化设备, 2018, 38 (05) :2-11
[7]
基于文本挖掘方法的突发事件与医学救援装备关联研究 [J].
周亮 ;
胡坤鹏 ;
唐硕 ;
张平 ;
张治钢 ;
范立冬 ;
肖南 ;
李曙光 .
中国医疗设备, 2018, 33 (03) :154-158
[8]
大数据技术在配电网中的应用综述 [J].
费思源 .
中国电机工程学报, 2018, 38 (01) :85-96+345
[9]
基于卷积神经网络的电力设备缺陷文本分类模型研究 [J].
刘梓权 ;
王慧芳 ;
曹靖 ;
邱剑 .
电网技术, 2018, 42 (02) :644-651
[10]
微博文本挖掘研究综述 [J].
余容 ;
李光强 ;
尹健 .
情报探索, 2017, (05) :97-103