基于文献的中文命名实体识别算法适用性分析研究

被引:9
作者
滕青青
吉久明
郑荣廷
李楠
机构
[1] 华东理工大学科技信息研究所
关键词
中文命名实体识别; 隐马尔可夫模型; 最大熵模型; 支持向量机; 条件随机场;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
命名实体识别(Named Entity Recognition)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。首先对我国关于命名实体识别研究的文献进行了总结,给出命名实体识别的主要方法及模型。并针对文献中对这些命名实体识别方法的效果进行统计分析,探讨各种识别对象、识别模型的效果及适用性。经过对现有研究文献的统计,结论为:在不考虑运行效率的情况下,对于机构名,识别效果最好的是层叠CRF模型;对于地名,测试效果最好的是CRF方法与专家知识相结合;人名识别方法中表现不错的则是边界模版和局部统计相结合的模型。
引用
收藏
页码:157 / 161+169 +169
页数:6
相关论文
共 26 条
[1]   基于条件随机场和知识库的手机短信命名实体识别 [J].
刘海鹏 ;
王小捷 .
广西师范大学学报(自然科学版), 2009, 27 (01) :177-180
[2]   基于条件随机场的中文组织机构名识别研究 [J].
周波 ;
蔡东风 .
沈阳航空工业学院学报, 2009, 26 (01) :49-52
[3]   基于多层条件随机场的中文命名实体识别 [J].
胡文博 ;
都云程 ;
吕学强 ;
施水才 .
计算机工程与应用 , 2009, (01) :163-165+227
[4]   基于最大熵方法汉语基本短语分析 [J].
朱冲 ;
王大为 ;
张向利 .
计算机工程与应用, 2008, (32) :137-139
[5]   一种人名识别方法的研究 [J].
张素香 ;
张素贤 ;
王小捷 .
计算机工程与应用, 2008, (21) :157-161
[6]   基于支持向量机方法的中文组织机构名的识别 [J].
陈霄 ;
刘慧 ;
陈玉泉 .
计算机应用研究, 2008, (02) :362-364+367
[7]   基于单字提示特征的中文命名实体识别快速算法 [J].
冯元勇 ;
孙乐 ;
李文波 ;
张大鲲 .
中文信息学报, 2008, (01) :104-110
[8]   隐马尔可夫模型在自然语言处理中的应用 [J].
于江德 ;
樊孝忠 ;
尹继豪 .
计算机工程与设计, 2007, (22) :5514-5516
[9]   基于条件随机场的中文科研论文信息抽取 [J].
于江德 ;
樊孝忠 ;
尹继豪 .
华南理工大学学报(自然科学版), 2007, (09) :90-94+106
[10]   基于姓氏用字驱动的混合中文姓名识别算法 [J].
刘力科 ;
陈蓉 ;
张南 ;
刘杰 ;
于中华 .
四川大学学报(自然科学版), 2007, (04) :795-798