电力大数据中文地址解析和规范化方法研究

被引:15
作者
刘婷婷 [1 ]
朱文东 [1 ]
陆海兵 [2 ]
赵婷 [3 ]
刘贺 [3 ]
刘广一 [1 ]
朱文娟 [1 ]
机构
[1] 全球能源互联网美国研究院
[2] Santa Clara University
[3] 全球能源互联网研究院
关键词
中文地址; 地址知识库; 地址分词; 地址解析; 地址规范化; 大数据;
D O I
10.16543/j.2095-641x.electric.power.ict.2017.05.001
中图分类号
TM76 [电力系统的自动化]; TP391.1 [文字信息处理];
学科分类号
080802 [电力系统及其自动化]; 120506 [数字人文];
摘要
由于长期以来我国地址的使用习惯复杂多样,使得电力系统业务部门中的地址数据不规范,阻碍了电力大数据的研发。针对此问题,在分析人类理解地址所用知识的基础上提出了基于地址知识库的地址解析和规范化方法,并结合地址的应用提出了为地址评估规范化置信水平的评价方法。实验结果表明,该方法对中文地址的解析F值可达95.37%,置信水平评估中82.40%的规范化地址可以直接应用到大数据分析等领域,具有重要的应用和研究参考价值。
引用
收藏
页码:1 / 7
页数:7
相关论文
共 11 条
[1]
应用智能电网统一数据模型的大数据应用架构及其实践 [J].
韩笑 ;
狄方春 ;
刘广一 ;
张逸 ;
陈金祥 ;
刘凤成 ;
孙昕 .
电网技术, 2016, 40 (10) :3206-3212
[2]
智能电网大数据的特点、应用场景与分析平台 [J].
刘广一 ;
朱文东 ;
陈金祥 ;
张逸 .
南方电网技术, 2016, 10 (05) :102-110
[3]
一种基于有限状态机的中文地址标准化方法 [J].
罗明 ;
黄海量 .
计算机应用研究, 2016, 33 (12) :3691-3695
[4]
面向自由文本的中文地址规范化 [J].
徐娟 ;
曹晔 ;
张奇 .
计算机应用与软件, 2015, 32 (08) :22-24+93
[5]
自然语言理解的中文地址匹配算法 [J].
宋子辉 .
遥感学报, 2013, 17 (04) :788-801
[6]
一种基于规则的模糊中文地址分词匹配方法 [J].
程昌秀 ;
于滨 .
地理与地理信息科学 , 2011, (03) :26-29
[7]
基于规则的中文地址要素解析方法 [J].
张雪英 ;
闾国年 ;
李伯秋 ;
陈文君 .
地球信息科学学报, 2010, (01) :9-16
[8]
城市地理编码系统应用与研究 [J].
陈细谦 ;
迟忠先 ;
金妮 .
计算机工程, 2004, (23) :50-52
[9]
数字城市地理信息公共平台地名/地址编码规则.[S].李成名;王丹;王继周;印洁;肖学年;马照亭;刘东琴;刘勇..2009,
[10]
城市市政综合监管信息系统.地理编码.[S].北京市东城区人民政府;建设部信息中心.行业标准-城建.2005,