基于机器学习的电网设备档案数据异常诊断研究

被引:19
作者
龙婧
刘伟
殷胜
机构
[1] 湖北华中电力科技开发有限责任公司
关键词
大数据; 机器学习; 电网设备档案数据; 数据异常; 自动诊断;
D O I
10.16543/j.2095-641x.electric.power.ict.2018.07.004
中图分类号
TP181 [自动推理、机器学习]; TP311.13 [];
学科分类号
140502 [人工智能];
摘要
为了对电网设备档案数据中无法提炼错误规则的数据问题进行自动诊断,提高数据质量,文章利用大数据机器学习技术,运用机器学习算法,对数据进行自动检测;基于Spark分布式内存计算,利用K-Means聚类算法对档案数据进行聚类训练,再对训练后数据进行分析和处理。试验证明,基于本方法论形成的自动诊断工具能够大幅降低在数据治理工作中的人力投入,减少工作量,降低工作成本,并且可以获得比人力筛查更详细更准确的结果。
引用
收藏
页码:21 / 27
页数:7
相关论文
共 13 条
[1]
Data clustering.[J].A. K. Jain;M. N. Murty;P. J. Flynn.ACM Computing Surveys (CSUR).1999, 3
[2]
Python数据分析与挖掘实战.[M].张良均;王路;谭立云;苏剑林.机械工业出版社.2015, 978-7-111-52123-5
[3]
Spark大数据处理.[M].高彦杰.机械工业出版社.2014,
[4]
基于Spark平台的聚类算法的优化与实现 [D]. 
曹鹏 .
北京交通大学,
2016
[5]
基于分布式平台Spark和YARN的数据挖掘算法的并行化研究 [D]. 
梁彦 .
中山大学,
2014
[6]
基于Spark框架的电力大数据清洗模型 [J].
王冲 ;
邹潇 .
电测与仪表 , 2017, (14) :33-38
[7]
基于改进快速密度峰值聚类算法的电力大数据异常值检测 [J].
刘凤魁 ;
邓春宇 ;
王晓蓉 ;
王新迎 .
电力信息与通信技术, 2017, 15 (06) :36-41
[8]
基于Spark框架的并行聚类算法 [J].
李淋淋 ;
倪建成 ;
曹博 ;
于苹苹 ;
姚彬修 .
计算机技术与发展, 2017, 27 (05) :97-101
[9]
一种基于Spark和聚类分析的辨识电力系统不良数据新方法 [J].
孟建良 ;
刘德超 .
电力系统保护与控制, 2016, 44 (03) :85-91
[10]
基于Spark平台的K-means聚类算法改进及并行化实现 [J].
吴哲夫 ;
张彤 ;
肖鹰 .
互联网天地, 2016, (01) :44-50