电网设备缺陷文本的质量评价与提升方法

被引:50
作者
邵冠宇
王慧芳
何奔腾
机构
[1] 浙江大学电气工程学院
关键词
电网设备缺陷文本; 文本质量评价; 层次-自适应灰色关联分析法; 文本质量提升; 潜在狄利克雷分布;
D O I
暂无
中图分类号
TM76 [电力系统的自动化]; TP391.1 [文字信息处理];
学科分类号
080802 [电力系统及其自动化]; 120506 [数字人文];
摘要
文本质量直接影响着文本挖掘效果的优劣。在总结电网企业缺陷文本存在的质量问题基础上,提出了缺陷文本质量评价和提升方法。首先,通过对大量实际缺陷文本的分析,总结出电网设备缺陷文本的格式及容易出现的不完整、不具体、冗余度过高等问题。然后,基于相应问题,定义了缺陷文本质量的评价指标,并提出了基于"层次-自适应灰色关联分析法"的评价方法。接下来,针对历史缺陷文本中质量较差和缺陷等级与缺陷描述不匹配的文本,利用潜在狄利克雷分布方法,结合国家电网有限公司的缺陷分类标准,进行修正以提升质量;针对新录入文本,利用文本质量评价方法进行质量问题提示,利用词向量映射方法给出修正建议,保证新录入缺陷文本的质量。最后,结合实例对修正前后的缺陷文本进行质量对比,算例表明,修正后的历史缺陷文本在文本质量得分上有较大提升,新录入文本存在的问题也能较为准确地识别并给出对应修正建议。
引用
收藏
页码:1472 / 1479
页数:8
相关论文
共 14 条
[1]
基于卷积神经网络的电力设备缺陷文本分类模型研究 [J].
刘梓权 ;
王慧芳 ;
曹靖 ;
邱剑 .
电网技术, 2018, 42 (02) :644-651
[2]
基于语义框架的电网缺陷文本挖掘技术及其应用 [J].
曹靖 ;
陈陆燊 ;
邱剑 ;
王慧芳 ;
应高亮 ;
张波 .
电网技术, 2017, 41 (02) :637-643
[3]
基于大数据技术的配电网运行可靠性分析 [J].
胡丽娟 ;
刁赢龙 ;
刘科研 ;
栾文鹏 ;
盛万兴 .
电网技术, 2017, 41 (01) :265-271
[4]
文本信息挖掘技术及其在断路器全寿命状态评价中的应用 [J].
邱剑 ;
王慧芳 ;
应高亮 ;
张波 ;
邹国平 ;
何奔腾 .
电力系统自动化, 2016, 40 (06) :107-112+118
[5]
在配电网中应用大数据的机遇与挑战 [J].
苗新 ;
张东霞 ;
孙德栋 .
电网技术, 2015, 39 (11) :3122-3127
[6]
电力大数据技术与电力系统仿真计算结合问题研究 [J].
黄彦浩 ;
于之虹 ;
谢昶 ;
史东宇 ;
周孝信 .
中国电机工程学报, 2015, 35 (01) :13-22
[7]
基于粗糙集的电网操作票规则提取 [J].
张旭 ;
程雪婷 ;
赵冬梅 .
电网技术, 2014, 38 (06) :1600-1605
[8]
基于改进的潜在语义分析的文本聚类 [J].
宋涛 ;
施水才 ;
房祥 ;
吕学强 .
北京信息科技大学学报(自然科学版), 2012, 27 (03) :21-25
[9]
数据挖掘在电力系统暂态稳定评估中的应用综述 [J].
童晓阳 ;
叶圣永 .
电网技术, 2009, 33 (20) :88-93
[10]
基于多智能体的电网操作票自动生成系统 [J].
陈素芳 ;
王凯 .
电力系统自动化, 2008, (15) :49-53