基于改进DPhyp算法的Impala查询优化

被引:3
作者
周强 [1 ]
陈岭 [1 ]
马骄阳 [1 ]
赵宇亮 [1 ]
吴勇 [2 ]
王敬昌 [2 ]
机构
[1] 浙江大学计算机科学与技术学院
[2] 浙江鸿程计算机系统有限公司
关键词
查询超图; 代价模型; Impala大数据实时查询; 左线性树; 执行计划;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对目前基于动态规划查询超图(dynamic programming hypergraphs,DPhyp)优化SQL查询算法产生指数运行时间、传统代价模型难以直接适用于Impala大数据实时查询系统等问题,提出基于改进DPhyp算法的Impala查询优化方法.首先,构建满足左线性树的搜索策略,缩小整个执行计划的搜索空间;接着,综合考虑数据移动代价及Hash join算法运行等关键因素,结合提出的代价模型,生成最佳的join顺序;最后,在生成的join顺序基础上构建执行计划,执行后返回最终查询结果.大量实验结果表明,改进的DPhyp算法与DPhyp生成的join顺序一致,且前者算法运行效率比后者要快近一倍.另外,改进的DPhyp算法结合提出的代价模型,比原始的Impala查询响应时间平均减少67%80%.
引用
收藏
页码:114 / 120
页数:7
相关论文
共 3 条
  • [1] Heuristic and randomized optimization for the join ordering problem
    Steinbrunn M.
    Moerkotte G.
    Kemper A.
    [J]. The VLDB Journal, 1997, 6 (3) : 191 - 208
  • [2] Outerjoin simplification and reordering for query optimization
    GalindoLegaria, C
    Rosenthal, A
    [J]. ACM TRANSACTIONS ON DATABASE SYSTEMS, 1997, 22 (01): : 43 - 74
  • [3] Hypergraph based reorderings of outer join queries with complex predicates[J] . Gautam Bhargava,Piyush Goel,Bala Iyer.ACM SIGMOD Record . 1995 (2)