微博数据挖掘研究综述

被引:242
作者
丁兆云 [1 ,2 ,3 ]
贾焰 [3 ]
周斌 [3 ]
机构
[1] 国防科学技术大学信息系统与管理学院
[2] 国防科学技术大学信息系统工程重点实验室
[3] 国防科学技术大学计算机学院
关键词
微博; 数据挖掘; 文本挖掘; 社会网络; 社会媒体;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
随着近几年微博的快速发展与普及,微博凭借平台的开放性、终端扩展性、内容简洁性和低门槛等特性,在网民中快速渗透,已发展成一个重要的社会化媒体,微博成为网民获取新闻时事、人际交往、自我表达、社会分享以及社会参与的重要媒介以及社会公共舆论的重要平台,对国家安全和社会发展产生了深远的影响.微博是人类在虚拟网络世界生活的抽象概括和延伸,与一般信息网络不同,微博本身具有大规模、噪音数据多样性、快速传播演化性、非线性、社会媒体性以及多关系等特征,因此其在分析方法和挖掘目标上都与传统信息系统具有很大差别,在相关技术的研究上也带来了更大的挑战.针对微博的新特性,研究了微博近几年的相关研究现状,同时分析了Twitter数据集特征,且总结了未来研究面临的挑战.
引用
收藏
页码:691 / 706
页数:16
相关论文
共 5 条
[1]
微博中基于多关系网络的话题影响力个体挖掘(英文) [J].
丁兆云 ;
贾焰 ;
周斌 ;
韩毅 .
中国通信, 2013, 10 (01) :93-104
[2]
微博网络测量研究 [J].
樊鹏翼 ;
王晖 ;
姜志宏 ;
李沛 .
计算机研究与发展, 2012, (04) :691-699
[3]
基于MB-LDA模型的微博主题挖掘 [J].
张晨逸 ;
孙建伶 ;
丁轶群 .
计算机研究与发展, 2011, (10) :1795-1802
[4]
Twitter mood predicts the stock market [J].
Bollen, Johan ;
Mao, Huina ;
Zeng, Xiaojun .
JOURNAL OF COMPUTATIONAL SCIENCE, 2011, 2 (01) :1-8
[5]
Authoritative sources in a hyperlinked environment [J].
Kleinberg, JM .
JOURNAL OF THE ACM, 1999, 46 (05) :604-632