EDM:高效的微博事件检测算法

被引:18
作者
童薇
陈威
孟小峰
机构
[1] 中国人民大学信息学院
关键词
事件检测; 事件摘要; 特征选取; 微博;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件。同时,微博数据的海量、短文本和丰富的社交关系等特性也为事件检测带来了新的挑战。综合考虑了微博数据的文本特征(转帖、评论、内嵌链接、用户标签hashtag、命名实体等)、语义特征、时序特性和社交关系特性,提出了一种有效的基于微博数据的事件检测算法(event detection in microblogs,EDM)。还提出了一种通过提取事件关键要素,即关键词、命名实体、发帖时间和用户情感倾向性,构成事件摘要的方法。与基于LDA(latent Dirichlet allocation)模型的事件检测算法进行实验对比,结果表明,EDM算法能够取得更好的事件检测效果,并且能够提供更直观可读的事件摘要。
引用
收藏
页码:1076 / 1086
页数:11
相关论文
共 1 条
[1]  
Event detection and tracking in social streams .2 Sayyadi H,Hurst M,Maykov A. Proceedings of the3rd International AAAI Conference on Weblogs and Social Media (ICWSM09) . 2009