一种基于Hadoop的电力大数据属性实体识别算法

被引:23
作者
齐俊 [1 ]
曲朝阳 [1 ]
娄建楼 [1 ]
王冲 [2 ]
机构
[1] 东北电力大学信息工程学院
[2] 国网内蒙古东部电力有限公司信息通信分公司
关键词
电力大数据; 实体识别; 离散化算法; 信息准确率;
D O I
暂无
中图分类号
TM76 [电力系统的自动化];
学科分类号
080802 [电力系统及其自动化];
摘要
随着大数据时代的来临,传统的实体识别技术由于电网数据体积大以及类型复杂等特性已经无法有效地进行数据预处理。近年来兴起的Hadoop技术能够对大数据进行较好的处理。因此提出一种基于Hadoop的电力大数据属性实体识别算法。该算法利用改进离散化算法选取出信息准确率较高的离散点,并提出了一种离散化评价指标。最后,在Hadoop平台上对某风电机组的监测数据进行了属性实体识别。实验证明,该算法在实验正确性和断点数目方面表现良好,并且具有较好的加速比,适用于电力大数据的属性实体识别处理。
引用
收藏
页码:52 / 57
页数:6
相关论文
共 15 条
[1]
电网规划运行数据库与集成管理平台的设计与实现 [J].
金小明 ;
吴鸿亮 ;
周保荣 ;
杨柳 ;
毕兆东 ;
俞秋阳 .
电力系统保护与控制, 2015, 43 (15) :126-131
[2]
广域保护系统数据网络可靠性评估 [J].
李俊刚 ;
张爱民 ;
张杭 ;
刘星 ;
耿英三 ;
魏勇 .
电工技术学报, 2015, 30 (12) :344-350
[3]
基于PMU量测信息的电压稳定在线评估指标 [J].
董雷 ;
张昭 ;
蒲天骄 ;
于汀 ;
韩巍 .
电力系统保护与控制, 2015, 43 (11) :1-6
[4]
电网实际运行环境中相量测量装置性能在线评价方法 [J].
王茂海 ;
赵玉江 ;
齐霞 ;
孙昊 .
电力系统保护与控制, 2015, 43 (06) :86-92
[5]
实时大数据处理技术在状态监测领域中的应用 [J].
周国亮 ;
朱永利 ;
王桂兰 ;
宋亚奇 .
电工技术学报, 2014, 29(S1) (S1) :432-437
[6]
面向智能配电网的大数据统一支撑平台体系与构架 [J].
刘巍 ;
黄曌 ;
李鹏 ;
李锰 ;
丁岩 .
电工技术学报, 2014, 29(S1) (S1) :486-491
[7]
基于云计算技术的电力大数据预处理属性约简方法 [J].
曲朝阳 ;
陈帅 ;
杨帆 ;
朱莉 .
电力系统自动化, 2014, 38 (08) :67-71
[8]
异构网络中关联实体识别模型及增量式验证算法研究 [J].
寇月 ;
申德荣 ;
刘恒 ;
王泰明 ;
聂铁铮 ;
于戈 .
计算机学报, 2013, 36 (10) :2096-2108
[9]
PEIF:基于并行机群的大数据实体识别算法 [J].
李明达 ;
王宏志 ;
张佳程 ;
李建中 ;
高宏 .
计算机研究与发展, 2013, 50(S1) (S1) :211-220
[10]
基于Hadoop的广域测量系统数据处理 [J].
曲朝阳 ;
朱莉 ;
张士林 .
电力系统自动化, 2013, 37 (04) :92-97