学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于多策略的新浪微博大数据抓取及应用
被引:15
作者
:
孙晓
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学计算机与信息学院
孙晓
叶嘉麒
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学计算机与信息学院
叶嘉麒
唐陈意
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学计算机与信息学院
唐陈意
任福继
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学计算机与信息学院
任福继
机构
:
[1]
合肥工业大学计算机与信息学院
来源
:
合肥工业大学学报(自然科学版)
|
2014年
/ 37卷
/ 10期
基金
:
国家高技术研究发展计划(863计划);
关键词
:
新浪微博API;
大数据;
数据挖掘;
网络爬虫;
多策略;
D O I
:
暂无
中图分类号
:
TP311.13 [];
TP393.092 [];
学科分类号
:
1201 ;
080402 ;
摘要
:
微博数据处理属于大数据范畴,其前提是获取大量的微博数据,而由于商业利益以及安全方面的考虑,获取微博数据的途径越来越少。同时随着新浪官方API的逐步更新,数据获取的限制也日益增加。文章尝试利用现有资源,基于多策略获取机制,设计出可稳定获得新浪微博数据的挖掘方案,并给出情感分析应用实例。实验表明,所设计的挖掘方案可以根据需要获取微博上的数据,并可以应用于微博情感分析中。
引用
收藏
页码:1210 / 1215
页数:6
相关论文
未找到相关数据
未找到相关数据