共 4 条
面向短文本的命名实体识别
被引:17
作者:
王丹
樊兴华
机构:
[1] 重庆邮电大学计算机科学与技术研究所
来源:
关键词:
短文本;
隐马尔可夫模型;
命名实体识别;
拼音同指关系库;
词性;
D O I:
暂无
中图分类号:
TP391.43 [];
学科分类号:
0811 ;
081101 ;
081104 ;
1405 ;
摘要:
针对短文本命名实体识别这项紧缺任务,提出了一种面向短文本的快速有效的命名实体识别方法。该方法主要分成三步:第一步,针对短文本表达不规范特性对命名实体识别的干扰,采取去干扰字符,化繁为简等规范化操作。第二步,针对短文本语意不完整特性,提出用HMM(隐马尔可夫模型)以词性做观察值进行初步命名实体识别。第三步,据初步识别结果,构建拼音同指关系库来识别潜在实体。在由8464篇短文本构成的测试集上运行的实验表明,该方法能较好地进行短文本命名实体识别。
引用
收藏
页码:143 / 145+171
+171
页数:4
相关论文