一种云环境下的大数据Top-K查询方法

被引:17
作者
慈祥
马友忠
孟小峰
机构
[1] 中国人民大学信息学院
基金
高等学校博士学科点专项科研基金;
关键词
Top-K查询; 云计算; MapReduce;
D O I
10.13328/j.cnki.jos.004564
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
Top-K查询在搜索引擎、电子商务等领域有着广泛的应用.Top-K查询从海量数据中返回最符合用户需求的前K个结果,主要目的是消除信息过载带来的负面影响.大数据背景下的Top-K查询,给数据管理和分析等方面带来新的挑战.结合MapReduce的特点,从数据划分、数据筛选等方面对云环境下的大数据Top-K查询问题进行深入研究.实验结果表明,该方法具有良好的性能和扩展性.
引用
收藏
页码:813 / 825
页数:13
相关论文
共 8 条
  • [1] Distributed top-k query processing by exploiting skyline summaries[J] . Distributed and Parallel Databases . 2012 (3)
  • [2] MapReduce[J] . Jeffrey Dean,Sanjay Ghemawat.Communications of the ACM . 2008 (1)
  • [3] Efficient top-k processing in large-scaled distributed environments
    Zhao, Keping
    Tao, Yufei
    Zhou, Shuigeng
    [J]. DATA & KNOWLEDGE ENGINEERING, 2007, 63 (02) : 315 - 335
  • [4] Evaluating top-k queries over web-accessible databases
    Marian, A
    Bruno, N
    Gravano, L
    [J]. ACM TRANSACTIONS ON DATABASE SYSTEMS, 2004, 29 (02): : 319 - 362
  • [5] Supporting top-k join queries in relational databases
    Ilyas, IF
    Aref, WG
    Elmagarmid, AK
    [J]. VLDB JOURNAL, 2004, 13 (03) : 207 - 221
  • [6] Optimal aggregation algorithms for middleware
    Fagin, R
    Lotem, A
    Naor, M
    [J]. JOURNAL OF COMPUTER AND SYSTEM SCIENCES, 2003, 66 (04) : 614 - 656
  • [7] Top- k selection queries over relational databases[J] . Nicolas Bruno,Surajit Chaudhuri,Luis Gravano.ACM Transactions on Database Systems (TODS) . 2002 (2)
  • [8] Combining fuzzy information from multiple systems
    Fagin, R
    [J]. JOURNAL OF COMPUTER AND SYSTEM SCIENCES, 1999, 58 (01) : 83 - 99