基于混合特征学习的微博转发预测方法

被引:24
作者
马晓峰 [1 ]
王磊 [2 ]
陈观淡 [2 ]
机构
[1] 上海数据分析与处理技术研究所
[2] 中国科学院自动化研究所复杂系统管理与控制国家重点实验室
关键词
微博; 混合特征学习; 转发预测;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
微博转发预测是研究信息传播的关键问题之一,对于舆情监控、广告投放、商业决策具有重要意义。用户兴趣、微博作者影响力及微博内容等信息均影响信息传播过程。转发行为预测的挑战性问题在于如何捕获更多有意义的影响因素以提高预测性能。提出基于混合特征学习的转发预测方法,该方法首先引入并分析了局部社会影响力特征、用户特征、微博内容特征的计算方法;接着,基于分类器建立预测模型;最后,比较了不同类型微博的转发预测效果。在新浪微博平台数据的实验结果表明,局部社会影响力特征、用户特征、微博内容特征都对转发预测有较大影响,其中微博内容特征的影响最大。随机森林预测效果最好,准确率达到83.1%;与朴素贝叶斯、逻辑回归、支持向量机模型相比,准确率平均提高约7.4%,最高提高约10.8%。另外,该方法对自然灾害、环境、审判、维权等类型的微博进行转发预测时,效果更加明显,说明这类事件转发的规律性更强。
引用
收藏
页码:249 / 252+257 +257
页数:5
相关论文
共 10 条
[1]
Audience design in Twitter: Retweeting behavior between informational value and followers’ interests.[J].Anja Rudat;Jürgen Buder;Friedrich W. Hesse.Computers in Human Behavior.2014,
[2]
Feature selection using Principal Component Analysis for massive retweet detection.[J].Mohamed Morchid;Richard Dufour;Pierre-Michel Bousquet;Georges Linarès;Juan-Manuel Torres-Moreno.Pattern Recognition Letters.2014,
[3]
Analyzing user behavior of the micro-blogging website Sina Weibo during hot social events.[J].Wanqiu Guan;Haoyu Gao;Mingmin Yang;Yuan Li;Haixin Ma;Weining Qian;Zhigang Cao;Xiaoguang Yang.Physica A: Statistical Mechanics and its Applications.2014,
[4]
微博信息传播预测研究综述 [J].
李洋 ;
陈毅恒 ;
刘挺 .
软件学报, 2016, 27 (02) :247-263
[5]
基于BP神经网络的微博转发量的预测 [J].
邓青 ;
马晔风 ;
刘艺 ;
张辉 .
清华大学学报(自然科学版), 2015, 55 (12) :1342-1347
[6]
融合热点话题的微博转发预测研究 [J].
陈江 ;
刘玮 ;
巢文涵 ;
王丽宏 .
中文信息学报, 2015, (06) :150-158
[7]
一个基于随机森林的微博转发预测算法 [J].
罗知林 ;
陈挺 ;
蔡皖东 .
计算机科学, 2014, 41 (04) :62-64+74
[8]
基于SVM的微博转发规模预测方法 [J].
李英乐 ;
于洪涛 ;
刘力雄 .
计算机应用研究, 2013, 30 (09) :2594-2597
[9]
基于行为预测的微博网络信息传播建模 [J].
吴凯 ;
季新生 ;
刘彩霞 .
计算机应用研究, 2013, 30 (06) :1809-1812
[10]
微博客中转发行为的预测研究 [J].
张旸 ;
路荣 ;
杨青 .
中文信息学报, 2012, 26 (04) :109-114+121