共 5 条
一种基于情感的中文微博话题检测方法
被引:11
作者:
方然
[1
,2
]
苗夺谦
[1
,2
]
张志飞
[1
,2
]
机构:
[1] 同济大学计算机科学与技术系
[2] 同济大学嵌入式系统与服务计算教育部重点实验室
来源:
基金:
中央高校基本科研业务费专项资金资助;
关键词:
中文微博;
话题检测;
聚类;
情感;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
针对微博这种特殊的文本形式的话题检测,传统的算法并不能取得很好的效果.为了提高其查全率,根据微博这种带有结构化特点的信息,提出了一种带有情感内容加权的话题检测方法.该方法基于含有负面情感的词语往往携带了更多的信息量这一论点,在现有短文本话题检测的算法中,通过加大含有负面情感的短文本在话题检测中的权重,之后再根据一种基于自查询的聚类方法进行话题聚类,将情感倾向融合到短文本话题检测中.在真实数据集上的实验表明,此方法能有效地进行话题聚类并检测话题,并提高了查全率.
引用
收藏
页码:208 / 213
页数:6
相关论文