Full Outer Join (Not Access or MySQL)

发布时间:2019-03-25  栏目:MyBatis  评论:0 Comments

MySQL 查询优化之 Block Nested-Loop 与 Batched Key Access Joins

在MySQL中,能够使用批量密钥访问(BKA)连接算法,该算法使用对连接表的目录访问和连接缓冲区。

BKA算法帮衬:内接连,外接连和半连接操作,包涵嵌套外接连。

BKA的优点:尤其高效的表扫描提升了延续属性。

其它,先前仅用于内连接的块嵌套循环(BNL)连接算法现已扩展,可用以外连接半连接操作,包括嵌套外连接

以下部分研商了连接缓冲区管理,它是原始BNL算法扩张,扩大BNL算法和BKA算法的基础。
有关半接连策略的音讯,请参见“使用半再三再四转换优化子查询,派生表和视图引用”

SELECT Room.RoomID, Class.Time
FROM Room
   FULL OUTER JOIN Class
   ON Room.RoomID = Class.RoomID
ORDER BY Room.RoomID;

Nested Loop Join算法

将外层表的结果集作为循环的基本功数据,然后循环从该结果集每便一条获取数据作为下一个表的过滤条件去询问数据,然后合并结果。倘若有三个表join,那么应该将前方的表的结果集作为循环数据,取结果集中的每一行再到下三个表中继续举行巡回匹配,获取结果集并赶回给客户端。

伪代码如下

for each row in t1 matching range {
  for each row in t2 matching reference key {
     for each row in t3 {
      if row satisfies join conditions,
      send to client
    }
  }
 }

 

一般说来的Nested-Loop
Join算法三遍只好将一行数据传入内部存款和储蓄器循环,所以外层循环结果集有多少行,那么内部存款和储蓄器循环就要执行多少次。

Block Nested-Loop算法

MySQL
BNL算法原本只援救内连接,未来已帮衬外连接半连接操作,包括嵌套外连接

BNL算法原理:将外层循环的行/结果集存入join
buffer,内部存款和储蓄器循环的每一行数据与全体buffer中的记录做相比较,能够减去内层循环的扫描次数

举个简易的例子:外层循环结果集有一千行数据,使用NLJ算法须要扫描内层表一千次,但假使接纳BNL算法,则先取出外层表结果集的100行存放到join
buffer,
然后用内层表的每一行数据去和那100行结果集做相比较,能够3次性与100行数据进行比较,那样内层表其实只要求循环一千/100=10回,减弱了百分之九十。

伪代码如下

for each row in t1 matching range {
   for each row in t2 matching reference key {
    store used columns from t1, t2 in join buffer
    if buffer is full {
      for each row in t3 {
         for each t1, t2 combination in join buffer {
          if row satisfies join conditions,
          send to client
        }
        }
       empty buffer
     }
   }
 }

 if buffer is not empty {
    for each row in t3 {
     for each t1, t2 combination in join buffer {
       if row satisfies join conditions,
       send to client
      }
   }
 }

 

假若t1, t2涉足join的列长度只和为s, c为双方组合数, 那么t3表被围观的次数为

(S * C)/join_buffer_size + 1

 

扫描t3的次数随着join_buffer_size的附加而减去, 直到join
buffer能够容纳全数的t1, t2结合, 再增大join buffer size, query
的进程就不会再变快了。

 

optimizer_switch系统变量的block_nested_loop标志控制优化器是不是选取块嵌套循环算法。

暗许意况下,block_nested_loop已启用。

在EXPLAIN输出中,当Extra值包含Using join buffer(Block Nested Loop)type值为ALL,index或range时,表示使用BNL。

示例

mysql> explain SELECT  a.gender, b.dept_no FROM employees a, dept_emp b WHERE a.birth_date = b.from_date;
+----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+
| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows   | filtered | Extra                                              |
+----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+
|  1 | SIMPLE      | a     | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 298936 |   100.00 | NULL                                               |
|  1 | SIMPLE      | b     | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 331143 |    10.00 | Using where; Using join buffer (Block Nested Loop) |
+----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+
2 rows in set, 1 warning (0.00 sec)

 

Batched Key Access 算法

对于多表join语句,当MySQL使用索引访问首个join表的时候,使用1个join
buffer来收集第叁个操作对象生成的相干列值。BKA营造好key后,批量传给引擎层做索引查找。key是透过MR牧马人接口提交给引擎的,那样,M帕JeroOdyssey使得查询更有功用。

若是外部表扫描的是主键,那么表中的记录走访都以比较平稳的,可是倘使连接的列是非主键索引,那么对于表中著录的拜会或然正是不行离散的。因而对于非主键索引的连片,Batched
Key Access
Join算法将能大幅进步SQL的进行功用。BKA算法帮助内三番五次,外接连和半连接操作,包蕴嵌套外接连。

Batched Key Access Join算法的做事步骤如下:

  • 1) 将表面表中相关的列放入Join Buffer中。

  • 2) 批量的将Key(索引键值)发送到Multi-Range Read(M凯雷德奥迪Q5)接口。

  • 3) Multi-Range
    Read(M奥迪Q5RAV4)通过收到的Key,依照其相应的ROWID进行排序,然后再开始展览数据的读取操作。

  • 4) 再次回到结果集给客户端。

Batched Key Access Join算法的本色上来说依然Simple Nested-Loops
Join算法,其发出的准绳为个中表上有索引,并且该索引为非主键,并且连接须要拜访内部表主键上的目录。那时Batched
Key Access Join算法会调用Multi-Range
Read(M劲客福睿斯)接口,批量的开始展览索引键的很是和主键索引上获取数据的操作,以此来增长联接的实行效用,因为读取数据是以一一磁盘IO而不是即兴磁盘IO举办的。

使用BKA时,join_buffer_size的值定义了对存款和储蓄引擎的每一个请求中批量密钥的尺寸。缓冲区越大,对连日操作的左侧表的顺序访问就更加多,那足以显着进步品质。

要使用BKA,必须将optimizer_switch系统变量的batched_key_access评释设置为on。
BKA使用M昂Cora兰德瑞虎,因而mrr标志也不能够不打开。近日,M途乐奥迪Q5的基金估摸过于悲观。因而,mrr_cost_based也务必关闭才能动用BKA。

以下设置启用BKA:

mysql> SET optimizer_switch='mrr=on,mrr_cost_based=off,batched_key_access=on';

 

在EXPLAIN输出中,当Extra值包含Using join buffer(Batched Key Access)且类型值为refeq_ref时,表示使用BKA。

示例:

mysql> show index from employees;
+-----------+------------+----------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table     | Non_unique | Key_name       | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-----------+------------+----------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| employees |          0 | PRIMARY        |            1 | emp_no      | A         |      298936 |     NULL | NULL   |      | BTREE      |         |               |
| employees |          1 | idx_name       |            1 | last_name   | A         |        1679 |     NULL | NULL   |      | BTREE      |         |               |
| employees |          1 | idx_name       |            2 | first_name  | A         |      277495 |     NULL | NULL   |      | BTREE      |         |               |
| employees |          1 | idx_birth_date |            1 | birth_date  | A         |        4758 |     NULL | NULL   |      | BTREE      |         |               |
+-----------+------------+----------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
4 rows in set (0.00 sec)


mysql> explain SELECT a.gender, b.dept_no FROM employees a, dept_emp b WHERE a.birth_date = b.from_date;
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+-------+
| id | select_type | table | partitions | type | possible_keys  | key            | key_len | ref                   | rows   | filtered | Extra |
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+-------+
|  1 | SIMPLE      | b     | NULL       | ALL  | NULL           | NULL           | NULL    | NULL                  | 331143 |   100.00 | NULL  |
|  1 | SIMPLE      | a     | NULL       | ref  | idx_birth_date | idx_birth_date | 3       | employees.b.from_date |     62 |   100.00 | NULL  |
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+-------+

#使用hint,强制走bka

mysql> explain SELECT /*+ bka(a)*/ a.gender, b.dept_no FROM employees a, dept_emp b WHERE a.birth_date = b.from_date;
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+----------------------------------------+
| id | select_type | table | partitions | type | possible_keys  | key            | key_len | ref                   | rows   | filtered | Extra                                  |
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+----------------------------------------+
|  1 | SIMPLE      | b     | NULL       | ALL  | NULL           | NULL           | NULL    | NULL                  | 331143 |   100.00 | NULL                                   |
|  1 | SIMPLE      | a     | NULL       | ref  | idx_birth_date | idx_birth_date | 3       | employees.b.from_date |     62 |   100.00 | Using join buffer (Batched Key Access) |
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+----------------------------------------+
2 rows in set, 1 warning (0.00 sec)

 

BNL和BKA算法的优化器Hint

除此之外运用optimizer_switch系统变量来支配优化程序在对话范围Nelly用BNL和BKA算法之外,MySQL还扶助优化程序提示,以便在每种语句的基本功上海电影制片厂响优化程序。
请参见“优化程序Hint”

要选取BNL或BKA提示为外部联接的别样内部表启用联接缓冲,必须为外部联接的装有内部表启用联接缓冲。

图片 1

使用qb_name

SELECT /*+ QB_NAME(qb1) MRR(@qb1 t1) BKA(@qb2) NO_MRR(@qb3t1 idx1, id2) */ ...
  FROM (SELECT /*+ QB_NAME(qb2) */ ...
  FROM (SELECT /*+ QB_NAME(qb3) */ ... FROM ...)) ...

 

留下评论

网站地图xml地图