新浪微博话题流行度预测技术研究

被引:7
作者
熊小兵
周刚
黄永忠
马俊
机构
[1] 信息工程大学信息工程学院
关键词
微博; 话题流行度; 预测; 主成分分析;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
微博作为一种新的在线社会网形式,逐渐成为人们获取和共享信息的重要平台。以我国最大的微博网站——新浪微博为对象,重点研究了微博话题的流行度预测问题。收集了大约40G的微博话题信息作为研究数据集,从中提取出与话题流行度相关的微博用户属性和话题内容属性,在对这些属性相关性分析的基础上,提出了一种兼顾用户属性和内容属性的话题流行度定量描述方法。文章对影响话题流行度的各属性进行了详细的主成分分析,总结出4种属性作为话题流行度预测的依据,并建立了流行度的线性预测模型。该模型能较好地预测话题流行度,模型指标R2达到0.89。
引用
收藏
页码:496 / 502
页数:7
相关论文
共 14 条
[1]  
Science of Retweets. Zarrella D. http://danzarrella.com/the-science-of-retweets-report.html . 2009
[2]  
A few chirps about twitter. Krishnamurthy B,Gill P,Arlitt M. http://dl.acm.org/citation.cfm?id=1397741 . 2008
[3]  
Analysis of social voting patterns on digg. Lerman K,Galstyan A. http://dl.acm.org/citation.cfmid=1397738 . 2008
[4]  
What is twitter, a social network or a news media?. H. Kwak,C. Lee,H. Park,S. Moon. WWW 10 . 2010
[5]  
Identifying’’Influencers’’on Twitter. Eytan Bakshy,Jake M,Hofman. http://kdpaine.blogs.com/files/twitterinfluencershofmanetal . 2011
[6]  
Tweet,Retweet:Conversational Aspects of Retweeting on Twitter. Boyd d,Golder S,Lotan,et al. http://research.microsoft.com/pubs/135165/TweetTweet-Retweet . 2010
[7]  
Information contagion:an empirical study of the spread of news on digg and twitter social networks. Lerman K,Ghosh R. http://arxiv.org/abs/1003.2664 . 2010
[8]  
Viral,quality,and junk videos on youtube:Separating content from noise in an information-rich envi-ronment. Crane R,Sornette D. http://www.citeulike.org/user/exp_chris/article/4416117 . 2008
[9]  
"Measuring user influence in twitter: the million follower fallacy,". M. Cha,H. Haddadi,F. Benevenuto,K. P. Gummadi. Proc. of International AAAI (Association for the Advancement of Artificial Intelligence) Conf. on Weblogs and Social Media . 2010
[10]  
Tad Hogg.Using a model of social dynamics to predict popularity of news. Kristina Lerman. ht-tp://dl.acm.org/citation.cfmid=1772754 . 2010