基于本体的中文地名识别

被引:12
作者
杜萍 [1 ,2 ]
刘勇 [1 ]
机构
[1] 兰州大学资源环境学院
[2] 兰州交通大学数理与软件工程学院
关键词
地名本体; 地理解析; 地理编码; 地名歧义消除;
D O I
10.16783/j.cnki.nwnuz.2011.06.017
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对国内自然语言处理领域地名识别存在的缺点,提出一种基于本体的中文地名识别方法.该方法借助文本工程通用框架GATE,引入构建的地名本体,识别文本中中国县及县以上行政区划地名,使之与地球表面具体的地理位置相对应,进而赋予它们地理坐标和地理语义.重点讨论地名本体的构建、地理解析及地理编码过程中geo/non-geo,geo/geo歧义的消除.实验结果表明该方法能够达到较为理想的准确率和召回率,从而证明geo/non-geo和geo/geo歧义消除算法可行、有效.
引用
收藏
页码:87 / 93
页数:7
相关论文
共 10 条
[1]   中文文本的地名解析方法研究 [J].
唐旭日 ;
陈小荷 ;
张雪英 .
武汉大学学报(信息科学版) , 2010, (08) :930-935+982
[2]   用支持向量机进行中文地名识别的研究 [J].
李丽双 ;
黄德根 ;
陈春荣 ;
杨元生 .
小型微型计算机系统, 2005, (08) :1416-1419
[3]   信息抽取研究综述 [J].
李保利 ;
陈玉忠 ;
俞士汶 .
计算机工程与应用, 2003, (10) :1-5+66
[4]   基于统计的中文地名识别 [J].
黄德根 ;
岳广玲 ;
杨元生 .
中文信息学报, 2003, (02) :36-41
[5]   基于变换的中国地名自动识别研究(英文) [J].
谭红叶 ;
郑家恒 ;
刘开瑛 .
软件学报, 2001, (11) :1608-1613
[6]  
城市地理编码方法的探索与实践[A]. 张铁燕,翁敬农,黄坚.中国地理信息系统协会第九届年会论文集[C]. 2005
[7]  
统计自然语言处理基础[M]. 电子工业出版社 , (美)ChristopherD.Manning,(德)HinrichSchutze著, 2005
[8]  
空间信息的语言学特征及其自动理解机制. 杜清运. 武汉大学 . 2001
[9]  
Web-a-Where:Geotagging WebContent. Amitay E,Har’EI N,Sivan R,et al. Proceedings of the 27th Annual International ACM SIGIRConference on Research and Development in Information Retrieval (SIGIR 2004) . 2004
[10]  
Spatial Information Theory: A Theoretical Basis for GIS. Egenhofer M, Mark D. Springer-Verlag . 1995