基于词向量聚类的中文微博产品命名实体识别

被引:24
作者
王洪亮
机构
[1] 石家庄职业技术学院
关键词
中文微博; 命名实体; 主题模型; 神经网络; 词向量;
D O I
10.13295/j.cnki.jlut.2017.01.020
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果.
引用
收藏
页码:104 / 110
页数:7
相关论文
共 11 条
[1]
基于层叠条件随机场的中文病历命名实体识别 [J].
燕杨 ;
文敦伟 ;
王云吉 ;
王珂 .
吉林大学学报(工学版), 2014, (06) :1843-1848
[2]
针对产品命名实体识别的半监督学习方法 [J].
黄诗琳 ;
郑小林 ;
陈德人 .
北京邮电大学学报, 2013, 36 (02) :20-23+54
[3]
基于条件随机场的英文产品命名实体识别 [J].
张朝胜 ;
郭剑毅 ;
线岩团 ;
余正涛 ;
雷春雅 ;
王海雄 .
计算机工程与科学, 2010, 32 (06) :115-117
[4]
面向网络文本的中文产品命名实体识别 [J].
梅丰 ;
孙承杰 ;
孙珂 ;
程明波 ;
林磊 .
郑州大学学报(理学版), 2010, 42 (01) :62-66
[5]
基于层叠条件随机场的旅游领域命名实体识别 [J].
郭剑毅 ;
薛征山 ;
余正涛 ;
张志坤 ;
张宜浩 ;
姚贤明 .
中文信息学报, 2009, 23 (05) :47-52
[6]
基于单字提示特征的中文命名实体识别快速算法 [J].
冯元勇 ;
孙乐 ;
李文波 ;
张大鲲 .
中文信息学报, 2008, (01) :104-110
[7]
特征选择方法的研究和改进 [J].
张永 ;
陈思睿 ;
杨志勇 ;
贾桂霞 .
兰州理工大学学报, 2006, (05) :92-95
[8]
基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[9]
面向商务信息抽取的产品命名实体识别研究 [J].
刘非凡 ;
赵军 ;
吕碧波 ;
徐波 ;
于浩 ;
夏迎炬 .
中文信息学报, 2006, (01) :7-13
[10]
Product named entity recognition in Chinese text [J].
Zhao, Jun ;
Liu, Feifan .
LANGUAGE RESOURCES AND EVALUATION, 2008, 42 (02) :197-217