一种基于情感的中文微博话题检测方法

被引:11
作者
方然 [1 ,2 ]
苗夺谦 [1 ,2 ]
张志飞 [1 ,2 ]
机构
[1] 同济大学计算机科学与技术系
[2] 同济大学嵌入式系统与服务计算教育部重点实验室
基金
中央高校基本科研业务费专项资金资助;
关键词
中文微博; 话题检测; 聚类; 情感;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对微博这种特殊的文本形式的话题检测,传统的算法并不能取得很好的效果.为了提高其查全率,根据微博这种带有结构化特点的信息,提出了一种带有情感内容加权的话题检测方法.该方法基于含有负面情感的词语往往携带了更多的信息量这一论点,在现有短文本话题检测的算法中,通过加大含有负面情感的短文本在话题检测中的权重,之后再根据一种基于自查询的聚类方法进行话题聚类,将情感倾向融合到短文本话题检测中.在真实数据集上的实验表明,此方法能有效地进行话题聚类并检测话题,并提高了查全率.
引用
收藏
页码:208 / 213
页数:6
相关论文
共 5 条
[1]   基于提升系数的微博异常排名检测方法 [J].
印桂生 ;
张亚楠 ;
董宇欣 ;
袁伟伟 ;
董红斌 .
哈尔滨工程大学学报, 2013, 34 (04) :488-493
[2]   一种中文微博新闻话题检测的方法 [J].
郑斐然 ;
苗夺谦 ;
张志飞 ;
高灿 .
计算机科学, 2012, 39 (01) :138-141
[3]   基于概念的词汇情感倾向识别方法 [J].
陈岳峰 ;
苗夺谦 ;
李文 ;
张志飞 .
智能系统学报, 2011, 6 (06) :489-494
[4]   话题发现与追踪技术研究 [J].
张晓艳 ;
王挺 .
计算机科学与探索 , 2009, (04) :347-357
[5]   话题检测与跟踪的评测及研究综述 [J].
洪宇 ;
张宇 ;
刘挺 ;
李生 .
中文信息学报, 2007, (06) :71-87