基于情绪特征的中文微博用户性别识别

被引:6
作者
刘宝芹
牛耘
机构
[1] 南京航空航天大学计算机科学与技术学院
关键词
性别识别; 中文微博; 情绪风格特征; 情绪词特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
随着互联网的蓬勃发展,微博受到了越来越多用户的青睐,对微博用户性别的研究也逐渐成为学术界研究的热点。目前,对英文微博文本用户的性别识别已有研究,但针对中文微博用户性别识别的研究较少。从两性表达情绪的差异出发,提出了一种基于情绪特征的中文微博用户性别识别方法。本文考虑的情绪特征包括情绪词特征和与情绪相关的语言风格特征。实验结果表明,利用情绪特征提高了用户性别识别的精度。
引用
收藏
页码:1917 / 1923
页数:7
相关论文
共 7 条
[1]   中文微博用户性别分类方法研究 [J].
王晶晶 ;
李寿山 ;
黄磊 .
中文信息学报, 2014, 28 (06) :150-155+168
[2]  
情感词汇本体的构造[J]. 徐琳宏,林鸿飞,潘宇,任惠,陈建美.情报学报. 2008 (02)
[3]  
LIBSVM[J] . Chih-Chung Chang,Chih-Jen Lin.ACM Transactions on Intelligent Systems and Technology (TIST) . 2011 (3)
[4]  
Gender Differences in Language Use: An Analysis of 14,000 Text Samples[J] . Matthew L. Newman,Carla J. Groom,Lori D. Handelman,James W. Pennebaker.Discourse Processes . 2008 (3)
[5]   Developmental and gender differences in the language for emotions across the adolescent years [J].
O'Kearney, R ;
Dadds, M .
COGNITION & EMOTION, 2004, 18 (07) :913-938
[6]  
Variation in the contextuality of language: an empirical measure[J] . Francis Heylighen,Jean-Marc Dewaele.Foundations of science . 2002 (3)
[7]   How variable may a constant be? Measures of lexical richness in perspective [J].
Tweedie, FJ ;
Baayen, RH .
COMPUTERS AND THE HUMANITIES, 1998, 32 (05) :323-352