基于依存句法分析的电力设备缺陷文本信息精确辨识方法

被引:53
作者
邵冠宇 [1 ]
王慧芳 [1 ]
吴向宏 [2 ]
陆金龙 [2 ]
李建红 [2 ]
何奔腾 [1 ]
机构
[1] 浙江大学电气工程学院
[2] 浙江华云信息科技有限公司
关键词
文本挖掘; 电力设备; 依存句法分析; 依存句法树匹配; 信息辨识;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TM507 [维护、检修];
学科分类号
090303 [农业农村环境保护与治理(农业环境保护)]; 120506 [数字人文];
摘要
电力设备缺陷文本包含大量设备缺陷历史信息,从文本中精确辨识缺陷信息,可提供对于设备的故障率建模和健康状态评价问题的有效指导。引入依存句法分析技术,提出"左贪心"出栈规则和基于神经网络的依存关系状态转移分析模型,实现了电力设备实际缺陷文本和缺陷分类标准文本的依存句法树构建,并结合缺陷文本特点提出了电力设备依存句法树的剪枝、切分和重构方法。同时,提出了基于依存关系的树匹配算法,实现实际缺陷和标准缺陷依存句法树的匹配。以主变压器缺陷文本为例,研究了基于依存句法分析的缺陷信息辨识方法的可行性和有效性。结果表明,所提方法相比于其他树匹配算法和语义相似度计算方法在效率和准确性上有明显提升。
引用
收藏
页码:178 / 185
页数:8
相关论文
共 12 条
[1]
电力文本数据挖掘现状及挑战 [J].
王慧芳 ;
曹靖 ;
罗麟 .
浙江电力, 2019, 38 (03) :1-7
[2]
深度学习在智能电网中的应用现状分析与展望 [J].
周念成 ;
廖建权 ;
王强钢 ;
李春艳 ;
李剑 .
电力系统自动化, 2019, 43 (04) :180-191
[3]
电力设备状态评估中的数据科学问题:挑战与展望 [J].
李刚 ;
张博 ;
赵文清 ;
刘云鹏 ;
高树国 .
电力系统自动化, 2018, 42 (21) :10-20+177
[4]
电网设备缺陷文本的质量评价与提升方法 [J].
邵冠宇 ;
王慧芳 ;
何奔腾 .
电网技术, 2019, 43 (04) :1472-1479
[5]
基于知识图谱技术的电力设备缺陷记录检索方法 [J].
刘梓权 ;
王慧芳 .
电力系统自动化, 2018, 42 (14) :158-164
[6]
基于卷积神经网络的电力设备缺陷文本分类模型研究 [J].
刘梓权 ;
王慧芳 ;
曹靖 ;
邱剑 .
电网技术, 2018, 42 (02) :644-651
[7]
一种中文句子相似度的计算方法 [D]. 
李文轩 .
华中科技大学,
2016
[8]
基于树型网络结构的用户相似性度量算法研究 [D]. 
李雪琴 .
四川师范大学,
2015
[9]
基于图和转移算法相结合的中文依存关系解析 [D]. 
刘春红 .
大连理工大学,
2009
[10]
汉语依存句法分析关键技术研究 [D]. 
李正华 .
哈尔滨工业大学,
2013