面向微博文本的命名实体识别

被引:17
作者
姜仁会
王挺
唐晋韬
机构
[1] 国防科学技术大学计算机学院计算机科学与技术系
关键词
命名实体识别; 微博; 短文本;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
命名实体识别是文本信息处理的重要基础,也是自然语言处理的一项关键技术。近几年来微博迅速发展成为人们进行信息交流的平台,微博文本俨然已经成为进行命名实体抽取的新载体。论文利用微博内容和结构的特点,提出了一种基于统计与规则相结合的命名实体识别的方法。微博文本较短并且文本中含有标签、话题等内容,论文在考虑这些特点基础上,利用微博评论和转发进行词频统计,通过规则筛选,完成命名实体识别。在新浪微博数据上的实验结果表明该方法可以有效地提高微博中命名实体识别效果。
引用
收藏
页码:647 / 651
页数:5
相关论文
共 2 条
[1]
面向短文本的命名实体识别 [J].
王丹 ;
樊兴华 .
计算机应用, 2009, 29 (01) :143-145+171
[2]
命名实体识别研究 [J].
张晓艳 ;
王挺 ;
陈火旺 .
计算机科学, 2005, (04) :44-48