基于Python的微博用户关系挖掘研究

被引:14
作者
林晓丽 [1 ,2 ]
胡可可 [2 ]
胡青 [1 ]
机构
[1] 武汉科技大学计算机科学与技术学院
[2] 武汉科技大学城市学院
关键词
新浪微博; 用户关系; 数据挖掘; 聚类分析;
D O I
暂无
中图分类号
G358 [情报资料的利用]; G206 [传播理论];
学科分类号
1205 ; 050302 ;
摘要
以新浪微博平台为研究对象,利用Python语言和Web自动化工具通过平台提供的应用接口实现自动认证和微博数据的自动抓取,将其转换成需要的数据格式之后,运用深度优先搜索算法进行分析,获得用户的关系并可视化。此外,采用改进的K-means算法进行主题聚类,实验结果表明,改进后的算法更加准确有效。最后,根据用户信息生成兴趣相关性矩阵,采用改进后的K-means算法分析微博用户关注兴趣的相似性。
引用
收藏
页码:144 / 148
页数:5
相关论文
共 11 条
[1]   基于k-means算法的微博用户推荐功能研究 [J].
杨尊琦 ;
张倩楠 .
情报杂志 , 2013, (08) :142-144+131
[2]   微博用户关系挖掘研究综述 [J].
王连喜 ;
蒋盛益 ;
庞观松 ;
吴美玲 .
情报杂志, 2012, 31 (12) :91-97+57
[3]   基于Python的Web数据采集技术 [J].
齐鹏 ;
李隐峰 ;
宋玉伟 .
电子科技, 2012, 25 (11) :118-120
[4]   基于k均值聚类的微博用户分类的研究 [J].
张国安 ;
钟绍辉 .
电脑知识与技术, 2012, 8 (26) :6273-6275
[5]   基于Python和Selenium的新浪微博数据访问 [J].
郭晓云 .
电脑编程技巧与维护, 2012, (15) :21-23
[6]   基于SNA的突发事件网络舆情关键节点识别——以“7·23动车事故”为例 [J].
康伟 .
公共管理学报, 2012, 9 (03) :101-111+127
[7]   基于聚类分析的SNS网络研究 [J].
张丹 ;
何跃 .
情报杂志, 2012, 31 (05) :62-65
[8]   微博用户关注兴趣的社会网络分析 [J].
袁园 ;
孙霄凌 ;
朱庆华 .
现代图书情报技术, 2012, (02) :68-75
[9]  
社交网站的数据挖掘与分析[M]. 机械工业出版社 , (美) 罗素 (Russell, 2012
[10]  
信息检索分析与展示[M]. 清华大学出版社 , 李平, 2012