基于用户关系的维吾尔文微博数据获取方法的研究

被引:8
作者
亚森伊斯马伊力 [1 ,2 ]
吐尔根依布拉音 [1 ,2 ]
卡哈尔江阿比的热西提 [1 ,2 ]
机构
[1] 新疆大学信息科学与工程学院
[2] 新疆大学新疆多语种信息技术重点实验室
关键词
跨语言; 舆情; 数据获取; 用户关系; 网络爬虫; 微博API;
D O I
10.13568/j.cnki.651094.2015.01.013
中图分类号
TP393.092 [];
学科分类号
摘要
目前,互联网上的大部分群体性数据资源集中在微博、论坛等社交网络上.跨语言社会舆情分析是我国智能信息处理的一个研究热点.维吾尔语是我国主要少数民族语言之一,为了构建一个好的跨语言舆情分析系统,维吾尔文微博的数据获取显得尤为重要.维吾尔文微博数据获取最大的难点是微博开发商不提供API.本文以技术和经济为基础的"Guduk"微博为研究对象,提出了一种基于用户关系的维吾尔文微博数据获取爬虫系统方案,此方案解决了在不提供API情况下的数据获取难点.本文的研究为跨语言舆情分析系统提供大量的维吾尔文社交网络数据资源、数据获取方法和技术.
引用
收藏
页码:74 / 79
页数:6
相关论文
共 5 条
[1]
一种基于模拟登录的微博数据采集方案 [J].
孙青云 ;
王俊峰 ;
赵宗渠 ;
高梦超 .
计算机技术与发展, 2014, 24 (03) :6-10
[2]
新浪微博数据获取技术研究 [J].
黄延炜 ;
刘嘉勇 .
信息安全与通信保密, 2013, (06) :71-73+76
[3]
新浪微博数据挖掘方案 [J].
廉捷 ;
周欣 ;
曹伟 ;
刘云 .
清华大学学报(自然科学版), 2011, 51 (10) :1300-1305
[4]
基于HTTP协议的POST数据分析与还原 [J].
陈雷 ;
刘嘉勇 .
通信技术, 2011, 44 (04) :132-134+169
[5]
开放API:新浪微博必经之路? [J].
姚科 .
互联网天地, 2010, (08) :71-72