CMU Advanced DB System - Query Optimizer Implementation

时间：2019-07-22 18:08:45 收藏：0 阅读：136

Overview

Optimizer模块所处在的位置如图，

技术图片

那么做optimize的目的是，

找出所有‘correct’执行计划中‘cost’最低的

技术图片

那么这里首先要明确的概念，‘correct’，关系代数等价，产生相同的结果集；所以所有优化的前提是需要是等价变换

但是等价集合，即所有等价的执行计划的集合，会非常大，所以这个问题是如果要穷举会是NP-Complete问题；所以需要研究‘Search算法’来限制search空间，提高search效率

技术图片

在等价集合中，如何选择执行计划，通过‘cost’，如何定义和计算cost也是非常困难的工作，因为涉及查询cost的因素有很多

技术图片

逻辑计划和物理计划

区别简单的说，逻辑计划是说‘做什么’，物理计划是说‘怎么做’

技术图片

通常Optimization对OLAP意义更大，因为OLTP的查询一般都比较简单，并且通常都是sargable的

技术图片

Design Decision

在设计Optimizer的时候需要考虑哪些点？

优化粒度

基于单条query或是多条query进行优化，明显基于多条query会效果更好，但是那样的search space会大很多，所以当前主要还是在研究单条query的优化

技术图片

静态优化 v.s. 动态优化

动态优化比较理想化，但是难于实现和debug，所以现在主流都是静态优化；Hybrid方式，会在error超过阈值时，选择re-Optimize

技术图片

Prepared Statements的优化

这种情况下是参数化的，所以当传入参数不同的时候，会影响筛选率，进而影响join的顺序

解决方法有3种，1. 每次都re-optimize；2. 生成多个plans，并把参数buckets化，参数落在什么buckets中就选相应的plan；3.用参数的平均值来生成plan

技术图片

Plan的稳定性

用户有时候更关心的是，相同query执行的稳定性

所以就算你的优化器99%的情况下比原来的好很多，但是会有1%的bad cases，用户的反馈可能反而是负面的

所以需要如下的方法去保障plan的稳定

技术图片

Search算法的结束标准

这个search问题是个NP-Complete问题，一般没法完全穷举

算法结束可以用，时间，只能优化1s，到1s就结束；cost阈值，发现低于阈值的plan就结束；完成穷举，没法继续transform，结束

技术图片

Optimization Search Strategy

这里重点描述优化的search算法的演进

Heuristic-based

基于启发式规则，把先验的经验定义成优化规则，简单容易实现，适用于早期的数据库

技术图片

例子，一个3表join的查询，可以先拆分成3条单独的查询；由于结果集很小，第二步可以直接把每个查询替换成结果集

技术图片

Heuristic+Cost-Based

在heuristic的基础上，加上cost-based来做join顺序的优化，是cost-based优化技术的初次尝试

技术图片

System R的例子，

技术图片

PG的例子，

技术图片

Top-down v.s. Bottom-up

这里提出两种search的策略，没有说哪种一定好，当前流行的框架都用top-down，比如calcite，比较方便剪枝

技术图片

Randomized

这是一个典型的优化算法的思路，比如经典算法模拟退火；

算法的缺点很明显，就是不确定性，所以往往会被用于极为复杂的查询优化，死马当活马医，反正也没有其他高效的优化方式；优点是overhead很低，很容易实现，运气好的话会有不错的效果

技术图片

PG里面就实现了Genetic Optimizer

技术图片

之前的Optimizer都是用程序语言写的，很难扩展或作为独立的组件
并且用程序语言写的Rule很难被理解和维护

所以大家想是否可以用DSL来维护rule，这样我们通过开发一个generator来根据DSL来生成Optimizer，这样形成framework

技术图片

Stratified

优化分成多个Stage，

比如，stage1，Rule-base的logical plan的transformation；stage2，cost-based的从logical到physical plan的生成

技术图片

Unified

和stratified相比，不区分stage，logical或physical的转换同时进行；同时使用动态规划和memoization来优化算法效率

技术图片

比较有代表性的就是，Volcano，火山模型

技术图片

Cascades Optimizer

Valcano作为一种学术原型，而Cascades作为它的一种面向对象的实现

技术图片

Cascades中的一些定义

Expression

Expression作为plan中的基本单元，有逻辑和物理两种

技术图片

Groups

等价的逻辑和物理expression的集合

技术图片

Multi-expression

把所有等价的expression都写出来，太多太乱
Multi-expression是一种分层的，简单的表示方式

技术图片

Rules

分为Transformation Rule和Implementation Rule分别对应为转换成Logical或Physical的expression

Rule有两部分组成，Pattern，定义何种logical expression适用于该rule；Substitute，定义如何转换

技术图片

Memo Table

动态规划算法，用来缓存中间结果

可以使用Memo的前提假设，如右，如果当前plan是optimal，那么他的所有子plan也是optimal
这个其实不一定的，因为这个贪心算法的思路，有可能子plan非最优，但整体最优；
这里后面会通过enforcer来约束，保证假设成立

技术图片

Memo使用的例子，

左图，算过[A] join [B]，[A]和[B]的cost会被缓存，后面就可以直接用

技术图片

Cascades模型当前的实现，

技术图片

前面考虑的都是比较简单的join情况，如果考虑各种join，可能re-ordering是invalid的；具体解决方法这里不详细描述

技术图片

优化的时候，谓词是个很关键的优化点

最常见的谓词下推，也可以在不同的阶段进行，方法二比较简单但是无法应对复杂谓词，所以一般方法一比较通用一些

对于谓词还需要考虑，哪个谓词先被执行，这个需要考虑两个方面，selectivity和computation cost

技术图片

下面列举一些例子，

Orca，

技术图片

Calcite

技术图片

Memsql

特点是，在把优化过的physical plan重新转化成SQL，然后再发到各个子节点

因为对于分布式数据库，子节点上有更准确的数据分布信息，所以在子节点上再根据local的信息做一遍优化会更合理

技术图片

评论（0）

© 2014 mamicode.com 版权所有京ICP备13008772号-2 联系我们:gaon5@hotmail.com

迷上了代码！