大数据时代的互联网分析引擎

被引:5
作者
窦志成
文继荣
机构
[1] 中国人民大学信息学院大数据管理与分析方法研究北京市重点实验室
基金
中央高校基本科研业务费专项资金资助;
关键词
互联网大数据; 分析引擎; 数据感知与采集;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
随着互联网尤其是移动互联网的高速发展,互联网文档的数量、内容的丰富度和复杂度都大大增加,互联网正朝大数据时代迈进,而用户的信息需求也趋于复杂化。除了基本的信息检索需求外,对大量相关文档的深入理解与聚合分析的需求也越来越强烈,而传统的互联网搜索引擎已经无法满足人们对该类信息的需求。针对这一问题,提出"互联网分析引擎"的构想,阐述了其与搜索引擎和OLAP分析系统的区别,介绍了一种互联网分析引擎的架构,并详细讨论了实现该引擎的核心问题。
引用
收藏
页码:36 / 47
页数:12
相关论文
共 5 条
[1]   Effective top-k computation with term-proximity support [J].
Zhu, Mingjie ;
Shi, Shuming ;
Li, Mingjing ;
Wen, Ji-Rong .
INFORMATION PROCESSING & MANAGEMENT, 2009, 45 (04) :401-412
[2]  
The anatomy of a large-scale hypertextual Web search engine[J] . Sergey Brin,Lawrence Page.Computer Networks and ISDN Systems . 1998 (1)
[3]   EVALUATION OF AN INFERENCE NETWORK-BASED RETRIEVAL MODEL [J].
TURTLE, H ;
CROFT, WB .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 1991, 9 (03) :187-222
[4]  
A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)
[5]  
Avatara: OLAP for web-scale analytics products .2 Lili Wu,Roshan Sumbaly,Chris Riccomini,Gordon Koo,Hyung Jin Kim,Jay Kreps,Sam Shah. Proceedings of the VLDB Endowment . 2012