基于规则和统计相结合的中文命名实体识别研究

被引:32
作者
潘正高
机构
[1] 宿州学院信息工程学院
关键词
命名实体; 文本特征; 中文命名实体; 识别;
D O I
10.13833/j.cnki.is.2012.05.019
中图分类号
G201 [信息理论];
学科分类号
050302 ;
摘要
介绍命名实体识别在文本信息处理领域的重要地位,分析了中文命名实体识别存在的困难,介绍中文命名实体识别的一般过程、评价标准及方法。提出了一种在构造内部规则和外部规则的同时采用概率统计的中文命名实体的识别方法,并利用这种基于规则和统计相结合的方法。实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性。
引用
收藏
页码:708 / 712+786 +786
页数:6
相关论文
共 7 条
[1]   基于信息抽取的文本知识挖掘模型研究 [J].
余肖生 ;
孙珊 .
情报科学 , 2010, (05) :776-778+792
[2]   基于层叠隐马模型的汉语词法分析 [J].
刘群 ;
张华平 ;
俞鸿魁 ;
程学旗 .
计算机研究与发展, 2004, (08) :1421-1429
[3]   信息抽取研究综述 [J].
李保利 ;
陈玉忠 ;
俞士汶 .
计算机工程与应用, 2003, (10) :1-5+66
[4]   基于统计的汉语组块分析 [J].
刘芳 ;
赵铁军 ;
于浩 ;
杨沐昀 ;
方高林 .
中文信息学报, 2000, (06) :28-32+39
[5]   规则和统计相结合的汉语词类标注方法 [J].
周强 .
中文信息学报, 1995, (03) :1-10
[6]  
一种网上图书信息抽取方法[J]. 李向阳,张亚非.情报学报. 2004 (06)
[7]  
A traninable method for extracting Chinese entity names an their relations .2 ZHANG Yimin,ZHOU J F. proc of the 2nd Chinese Language Processing Workshop . 2000