中文微博命名实体识别

被引:33
作者
邱泉清
苗夺谦
张志飞
机构
[1] 同济大学计算机科学与技术系
[2] 同济大学嵌入式系统与服务计算教育部重点实验室
基金
中央高校基本科研业务费专项资金资助;
关键词
中文信息处理; 微博; 命名实体; 条件随机场;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
微博这一媒体形式的迅速发展为命名实体识别提供了一个新的载体。根据微博文本的特点,提出针对中文微博的命名实体识别方法。首先,对微博文本做规范化处理,消除由于微博表达不规范造成的干扰;在建立中文人名库、常用地点库等知识库的基础上,选取适合微博的特征模板,使用条件随机场方法进行实体识别;同时,将正确的识别结果添加到知识库中以提升识别效果。在真实微博数据上的实验表明,该方法能够有效地完成中文微博的命名实体识别任务。
引用
收藏
页码:196 / 198
页数:3
相关论文
共 8 条
[1]  
基于规则的命名实体识别研究.[D].周昆.合肥工业大学.2010, 04
[2]  
基于最大熵模型的中文命名实体识别方法研究.[D].杨华.哈尔滨工程大学.2008, 06
[3]   一种中文微博新闻话题检测的方法 [J].
郑斐然 ;
苗夺谦 ;
张志飞 ;
高灿 .
计算机科学, 2012, 39 (01) :138-141
[4]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[5]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报 , 2006, (02) :87-94
[6]   命名实体识别研究 [J].
张晓艳 ;
王挺 ;
陈火旺 .
计算机科学, 2005, (04) :44-48
[7]  
Chinese named entity recognitionwith conditional probabilistic models..Chen A;Peng F;Shan R;et al;.Proceedings of the5th SIGHAN Workshop on Chinese Language Processing.2006,
[8]  
统计学习方法.[M].李航; 著.清华大学出版社.2012,