中文地名识别与歧义消除——以中国县级以上行政区划地名为例

被引:7
作者
杜萍
刘勇
机构
[1] 兰州大学资源环境学院
关键词
地名识别; 歧义消除; 地理解析; 地理编码;
D O I
暂无
中图分类号
P208 [测绘数据库与信息系统];
学科分类号
070503 ; 081603 ; 0818 ; 081802 ;
摘要
介绍了本体、地理本体和地名本体的基本概念,探讨了在文本工程通用框架GATE(GeneralArchitecture for Text Engineering)下,以自然语言处理为基础,借助地名本体,完成Web文本的中文地名识别与歧义消除的关键问题,设计并实现了一个原型系统。通过geo/non-geo和geo/geo地名歧义的消除,使得识别出来的地名与地球表面具体的地理位置相对应,进而为Web文本中的中国行政区划地名赋予地理坐标和地理语义。做了验证实验,并对实验结果进行了分析。
引用
收藏
页码:868 / 873
页数:6
相关论文
共 6 条
[1]   面向GIS的地理命名实体识别研究 [J].
李玉森 ;
张雪英 ;
袁正午 .
重庆邮电大学学报(自然科学版), 2008, (06) :719-724
[2]   信息抽取研究综述 [J].
李保利 ;
陈玉忠 ;
俞士汶 .
计算机工程与应用, 2003, (10) :1-5+66
[3]  
中文文本关键词自动抽取方法研究[J] 张雪英;Jürgen Krause; 情报学报 2008,
[4]  
Knowledge engineering: Principles and methods[J] Rudi Studer;V.Richard Benjamins;Dieter Fensel Data & Knowledge Engineering 1998,
[5]  
Ontological Tools for Geographic Representation Casati R;Smith B;Varzi A; Formal Ontology in Information Sys-tem 1998,
[6]  
ICTCLAS ICT of Chinese Academy of Sciences; http://ictclas.org/ictclas_feature.html 2011,