利用新词探测提高中文微博的情感表达抽取

被引:15
作者
万琪 [1 ]
于中华 [1 ]
陈黎 [1 ]
宋磊磊 [1 ]
丁革建 [2 ]
机构
[1] 四川大学计算机学院
[2] 浙江师范大学数理与信息工程学院
基金
浙江省自然科学基金;
关键词
情感分析; 新词发现; 条件随机场; 信息抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
情感表达抽取工作是细粒度情感挖掘的重要任务之一.中文微博中包含大量网络新词和不规范词,现有的方法在进行微博情感表达抽取任务时不能很好地处理上述情况.通过研究发现,微博中新词大量分布在文本的情感表达部分,于是提出了基于CRF的联合抽取模型,即将新词发现融入到情感表达抽取任务中,从而改进原有工作的不足.实验结果表明,新词探测对微博文本情感表达抽取有很好的指示作用,在电影领域和开放领域的微博数据集上分别进行实验,F1值均提高了2%以上.
引用
收藏
页码:63 / 69
页数:7
相关论文
共 6 条
[1]
中文微博细粒度情绪识别研究 [D]. 
雷龙艳 .
南华大学,
2014
[2]
基于词内部结合度和边界自由度的新词发现 [J].
李文坤 ;
张仰森 ;
陈若愚 .
计算机应用研究, 2015, 32 (08) :2302-2304+2342
[3]
微博新词发现及情感倾向判断分析 [J].
唐波 ;
陈光 ;
王星雅 ;
王非 ;
陈小慧 .
山东大学学报(理学版), 2015, (01) :20-25
[4]
基于条件随机场方法的开放领域新词发现 [J].
陈飞 ;
刘奕群 ;
魏超 ;
张云亮 ;
张敏 ;
马少平 .
软件学报, 2013, 24 (05) :1051-1060
[5]
Annotating Expressions of Opinions and Emotions in Language.[J].Janyce Wiebe;Theresa Wilson;Claire Cardie.Language Resources and Evaluation.2006, 2-3
[6]
Mining Opinion Features in Customer Reviews..Hu M;Liu B;.Proceedings of the 19th National Conference on ArtificialIntelligence(AAAI''04).2004,