`
wister
  • 浏览: 85173 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Mysql Join语法解析与性能分析

阅读更多

一.Join语法概述

join 用于多表中字段之间的联系,语法如下:

... FROM table1 INNER|LEFT|RIGHT JOIN table2 ON conditiona

table1:左表;table2:右表。

JOIN 按照功能大致分为如下三类:

INNER JOIN(内连接,或等值连接):取得两个表中存在连接匹配关系的记录。

LEFT JOIN(左连接):取得左表(table1)完全记录,即是右表(table2)并无对应匹配记录。

RIGHT JOIN(右连接):与 LEFT JOIN 相反,取得右表(table2)完全记录,即是左表(table1)并无匹配对应记录。

注意:mysql不支持Full join,不过可以通过UNION 关键字来合并 LEFT JOIN 与 RIGHT JOIN来模拟FULL join.

接下来给出一个列子用于解释下面几种分类。如下两个表(A,B)

mysql> select A.id,A.name,B.name from A,B where A.id=B.id;
+----+-----------+-------------+
| id | name       | name             |
+----+-----------+-------------+
|  1 | Pirate       | Rutabaga      |
|  2 | Monkey    | Pirate            |
|  3 | Ninja         | Darth Vader |
|  4 | Spaghetti  | Ninja             |
+----+-----------+-------------+
4 rows in set (0.00 sec)

二.Inner join

内连接,也叫等值连接,inner join产生同时符合A和B的一组数据。

mysql> select * from A inner join B on A.name = B.name;
+----+--------+----+--------+
| id | name   | id | name   |
+----+--------+----+--------+
|  1 | Pirate |  2 | Pirate |
|  3 | Ninja  |  4 | Ninja  |
+----+--------+----+--------+

三.Left join

mysql> select * from A left join B on A.name = B.name;
#或者:select * from A left outer join B on A.name = B.name;

+----+-----------+------+--------+
| id | name      | id   | name   |
+----+-----------+------+--------+
|  1 | Pirate    |    2 | Pirate |
|  2 | Monkey    | NULL | NULL   |
|  3 | Ninja     |    4 | Ninja  |
|  4 | Spaghetti | NULL | NULL   |
+----+-----------+------+--------+
4 rows in set (0.00 sec)

left join,(或left outer join:在Mysql中两者等价,推荐使用left join.)左连接从左表(A)产生一套完整的记录,与匹配的记录(右表(B)) .如果没有匹配,右侧将包含null。

如果想只从左表(A)中产生一套记录,但不包含右表(B)的记录,可以通过设置where语句来执行,如下:

mysql> select * from A left join B on A.name=B.name where A.id is null or B.id is null;
+----+-----------+------+------+
| id | name      | id   | name |
+----+-----------+------+------+
|  2 | Monkey    | NULL | NULL |
|  4 | Spaghetti | NULL | NULL |
+----+-----------+------+------+
2 rows in set (0.00 sec)

同理,还可以模拟inner join. 如下:

mysql> select * from A left join B on A.name=B.name where A.id is not null and B.id is not null;
+----+--------+------+--------+
| id | name   | id   | name   |
+----+--------+------+--------+
|  1 | Pirate |    2 | Pirate |
|  3 | Ninja  |    4 | Ninja  |
+----+--------+------+--------+
2 rows in set (0.00 sec)

求差集:

根据上面的例子可以求差集,如下:

SELECT * FROM A LEFT JOIN B ON A.name = B.name
WHERE B.id IS NULL
union
SELECT * FROM A right JOIN B ON A.name = B.name
WHERE A.id IS NULL;
# 结果
    +------+-----------+------+-------------+
| id   | name      | id   | name        |
+------+-----------+------+-------------+
|    2 | Monkey    | NULL | NULL        |
|    4 | Spaghetti | NULL | NULL        |
| NULL | NULL      |    1 | Rutabaga    |
| NULL | NULL      |    3 | Darth Vader |
+------+-----------+------+-------------+

四.Right join

mysql> select * from A right join B on A.name = B.name;
+------+--------+----+-------------+
| id   | name   | id | name        |
+------+--------+----+-------------+
| NULL | NULL   |  1 | Rutabaga    |
|    1 | Pirate |  2 | Pirate      |
| NULL | NULL   |  3 | Darth Vader |
|    3 | Ninja  |  4 | Ninja       |
+------+--------+----+-------------+
4 rows in set (0.00 sec)

同left join。

五.Cross join

cross join:交叉连接,得到的结果是两个表的乘积,即笛卡尔积

笛卡尔(Descartes)乘积又叫直积。假设集合A={a,b},集合B={0,1,2},则两个集合的笛卡尔积为{(a,0),(a,1),(a,2),(b,0),(b,1), (b,2)}。可以扩展到多个集合的情况。类似的例子有,如果A表示某学校学生的集合,B表示该学校所有课程的集合,则A与B的笛卡尔积表示所有可能的选课情况。

mysql> select * from A cross join B;
+----+-----------+----+-------------+
| id | name      | id | name        |
+----+-----------+----+-------------+
|  1 | Pirate    |  1 | Rutabaga    |
|  2 | Monkey    |  1 | Rutabaga    |
|  3 | Ninja     |  1 | Rutabaga    |
|  4 | Spaghetti |  1 | Rutabaga    |
|  1 | Pirate    |  2 | Pirate      |
|  2 | Monkey    |  2 | Pirate      |
|  3 | Ninja     |  2 | Pirate      |
|  4 | Spaghetti |  2 | Pirate      |
|  1 | Pirate    |  3 | Darth Vader |
|  2 | Monkey    |  3 | Darth Vader |
|  3 | Ninja     |  3 | Darth Vader |
|  4 | Spaghetti |  3 | Darth Vader |
|  1 | Pirate    |  4 | Ninja       |
|  2 | Monkey    |  4 | Ninja       |
|  3 | Ninja     |  4 | Ninja       |
|  4 | Spaghetti |  4 | Ninja       |
+----+-----------+----+-------------+
16 rows in set (0.00 sec)

#再执行:mysql> select * from A inner join B; 试一试

#在执行mysql> select * from A cross join B on A.name = B.name; 试一试

实际上,在 MySQL 中(仅限于 MySQL) CROSS JOIN 与 INNER JOIN 的表现是一样的,在不指定 ON 条件得到的结果都是笛卡尔积,反之取得两个表完全匹配的结果。
INNER JOIN 与 CROSS JOIN 可以省略 INNER 或 CROSS 关键字,因此下面的 SQL 效果是一样的:

... FROM table1 INNER JOIN table2
... FROM table1 CROSS JOIN table2
... FROM table1 JOIN table2

六.Full join

mysql> select * from A left join B on B.name = A.name 
    -> union 
    -> select * from A right join B on B.name = A.name;
+------+-----------+------+-------------+
| id   | name      | id   | name        |
+------+-----------+------+-------------+
|    1 | Pirate    |    2 | Pirate      |
|    2 | Monkey    | NULL | NULL        |
|    3 | Ninja     |    4 | Ninja       |
|    4 | Spaghetti | NULL | NULL        |
| NULL | NULL      |    1 | Rutabaga    |
| NULL | NULL      |    3 | Darth Vader |
+------+-----------+------+-------------+
6 rows in set (0.00 sec)

全连接产生的所有记录(双方匹配记录)在表A和表B。如果没有匹配,则对面将包含null。

七.性能优化

1.显示(explicit) inner join VS 隐式(implicit) inner join

如:

select * from
table a inner join table b
on a.id = b.id;

VS

select a.*, b.*
from table a, table b
where a.id = b.id;

我在数据库中比较(10w数据)得之,它们用时几乎相同,第一个是显示的inner join,后一个是隐式的inner join。

参照:Explicit vs implicit SQL joins

2.left join/right join VS inner join

尽量用inner join.避免 LEFT JOIN 和 NULL.

在使用left join(或right join)时,应该清楚的知道以下几点:

(1). on与 where的执行顺序

ON 条件(“A LEFT JOIN B ON 条件表达式”中的ON)用来决定如何从 B 表中检索数据行。如果 B 表中没有任何一行数据匹配 ON 的条件,将会额外生成一行所有列为 NULL 的数据,在匹配阶段 WHERE 子句的条件都不会被使用。仅在匹配阶段完成以后,WHERE 子句条件才会被使用。它将从匹配阶段产生的数据中检索过滤。

所以我们要注意:在使用Left (right) join的时候,一定要在先给出尽可能多的匹配满足条件,减少Where的执行。如:

PASS

select * from A
inner join B on B.name = A.name
left join C on C.name = B.name
left join D on D.id = C.id
where C.status>1 and D.status=1;

Great

select * from A
inner join B on B.name = A.name
left join C on C.name = B.name and C.status>1
left join D on D.id = C.id and D.status=1

从上面例子可以看出,尽可能满足ON的条件,而少用Where的条件。从执行性能来看第二个显然更加省时。

(2).注意ON 子句和 WHERE 子句的不同

如作者举了一个列子:

mysql> SELECT * FROM product LEFT JOIN product_details
       ON (product.id = product_details.id)
       AND product_details.id=2;
+----+--------+------+--------+-------+
| id | amount | id   | weight | exist |
+----+--------+------+--------+-------+
|  1 |    100 | NULL |   NULL |  NULL |
|  2 |    200 |    2 |     22 |     0 |
|  3 |    300 | NULL |   NULL |  NULL |
|  4 |    400 | NULL |   NULL |  NULL |
+----+--------+------+--------+-------+
4 rows in set (0.00 sec)

mysql> SELECT * FROM product LEFT JOIN product_details
       ON (product.id = product_details.id)
       WHERE product_details.id=2;
+----+--------+----+--------+-------+
| id | amount | id | weight | exist |
+----+--------+----+--------+-------+
|  2 |    200 |  2 |     22 |     0 |
+----+--------+----+--------+-------+
1 row in set (0.01 sec)

从上可知,第一条查询使用 ON 条件决定了从 LEFT JOIN的 product_details表中检索符合的所有数据行。第二条查询做了简单的LEFT JOIN,然后使用 WHERE 子句从 LEFT JOIN的数据中过滤掉不符合条件的数据行。

(3).尽量避免子查询,而用join

往往性能这玩意儿,更多时候体现在数据量比较大的时候,此时,我们应该避免复杂的子查询。如下:

PASS

insert into t1(a1) select b1 from t2 where not exists(select 1 from t1 where t1.id = t2.r_id); 

Great

insert into t1(a1)  
select b1 from t2  
left join (select distinct t1.id from t1 ) t1 on t1.id = t2.r_id   
where t1.id is null;  

这个可以参考mysql的exists与inner join 和 not exists与 left join 性能差别惊人

分享到:
评论

相关推荐

    浅析Mysql Join语法以及性能优化

    以下是关于MySQL JOIN语法及其性能优化的详细解析: 1. JOIN类型: - INNER JOIN:内连接返回两个表中匹配的记录。如果在任一表中没有找到匹配,那么结果集中不会包含这些记录。例如: ``` SELECT * FROM table1...

    mysql性能优化与架构设计

    MySQL性能优化与架构设计是数据库管理员和开发人员必须掌握的关键技能之一。MySQL作为一个广泛使用的开源关系型数据库管理系统,其性能优化对于提升应用的整体性能至关重要。本资料主要关注MySQL的架构理解、性能...

    MySQL性能调优与架构设计

    2. **语法解析**:服务器接收 SQL 命令后,首先进行语法解析,检查语法是否正确。 3. **查询优化**:优化器对 SQL 语句进行优化,确定最佳执行计划。 4. **执行计划执行**:按照优化后的执行计划执行 SQL 操作。 5. ...

    高性能MYSQL1

    《高性能MySQL》是一本深入探讨MySQL数据库性能优化的权威书籍,涵盖了从基础概念到高级技巧的广泛内容。本文将重点围绕书中的“MySQL概述与架构”这一章节进行详细阐述。 一、MySQL概述 MySQL是一个开源的关系型...

    鲁班学员mysql底层原理分析学习笔记

    4. **SQL语法与执行流程**:从SQL语句的解析到执行,涉及预处理、解析、优化和执行四个阶段。了解这些步骤有助于编写更高效的SQL。 5. **事务处理**:事务是数据库操作的基本单位,包含提交、回滚、保存点等概念。...

    mysql源码

    1. 解析器:MySQL接收到SQL语句后,首先通过解析器将字符串转换为抽象语法树(AST),进行语义检查和语法分析。 2. 查询优化器:解析后的查询会被查询优化器处理,选择最佳的执行计划,如决定使用索引、选择合适的...

    从 Oracle 合并到 MySQL - NPR 实例分析

    从 Oracle 合并到 MySQL 的 NPR 实例分析深入解析了国家公共广播电台(NPR)在数据库迁移过程中遇到的关键挑战及解决方案。本文将基于提供的标题、描述和部分内容,详细阐述数据库迁移过程中的核心知识点。 ### ...

    MySQL50道练习题.zip

    MySQL是世界上最受欢迎的关系型数据库管理系统(RDBMS)之一,被广泛应用于Web应用程序、电子商务、数据分析等多个领域。这里我们有“MySQL50道练习题”的压缩包,它包含了一系列问题,旨在帮助用户深入理解和掌握...

    MySql+5.5版本中文手册

    MySQL 5.5是MySQL数据库管理系统的一个重要版本,它在前任版本的基础上引入了许多新特性...手册通常会包含详细的安装指南、配置参数解释、SQL语法解析、故障排查方法等,是数据库管理员和开发人员不可或缺的参考资料。

    MySQL 轻快掌握 视频+ppt+代码+数据 全套

    10. **日志系统**:解析错误日志、二进制日志和慢查询日志,以及如何利用这些日志进行问题排查和性能分析。 PPT可能会更深入地展示这些概念,并提供清晰的图表和流程图以帮助理解。代码示例将让学习者有机会亲手...

    MySQL权威指南(第3版)

    《MySQL权威指南(第3版)》是一本深入解析MySQL数据库系统的专业书籍,它涵盖了从基础到高级的各种MySQL知识,是学习和掌握SQL语言及MySQL数据库管理的重要参考资料。该书全面介绍了MySQL的安装、配置、数据类型、...

    Mysql详细学习笔记.rar

    这份“Mysql详细学习笔记”显然是一个深入解析MySQL的资源,旨在帮助初学者和有经验的开发者更好地理解和运用SQL语句。以下是笔记中可能包含的一些核心知识点: 1. **SQL基础**:SQL(Structured Query Language)...

    MySQL 8.0中文版参考手册

    MySQL 8.0是世界上最流行的开源关系型数据库管理系统(RDBMS)的最新版本,它在功能、性能和安全性上都有显著提升。本中文版参考手册详细地涵盖了MySQL 8.0的所有关键特性,旨在帮助开发者和数据库管理员深入理解并...

    第16讲 mysql笔试题

    以下是对"第16讲 mysql笔试题"中可能涉及的MySQL知识点的详细解析: 1. **数据类型**:MySQL支持多种数据类型,如整数类型(TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT)、浮点数类型(FLOAT、DOUBLE)、字符串...

    MYSQL中文手册完全版

    同时,讲解如何通过EXPLAIN分析查询执行计划,优化查询性能。 4. **存储引擎**: MySQL支持多种存储引擎,如InnoDB(支持事务处理和外键)、MyISAM(快速读取,不支持事务)、Memory(数据存于内存中)等。手册会...

    北京动力节点MySQL课程

    11. **性能监控与调优**:使用MySQL自带的性能分析工具,如SHOW STATUS和SHOW VARIABLES,以及如何调整系统参数以提升性能。 12. **高级话题**:可能涉及分区表、复制与集群、InnoDB Cluster、JSON支持等进阶主题。...

    Effective+MySQL之SQL语句最优化

    9. **性能监控与调优工具**:MySQL提供多种内置工具,如SHOW STATUS、SHOW VARIABLES和Performance Schema,用于监控数据库性能并进行调优。了解如何利用这些工具是必不可少的。 10. **数据库配置与参数调整**:...

    MySQL官方指南 MySQL-5-0-Certification-Study-Guide

    书中通过实例解析了查询执行计划、EXPLAIN命令的使用,以及如何通过分析查询语句和调整索引来提升查询性能。此外,还讨论了覆盖索引、延迟键引用等高级优化策略。 存储引擎部分,介绍了InnoDB、MyISAM、Memory等...

    MySQL实战45讲.zip

    5. **复制与高可用**:详细解析MySQL的主从复制机制,包括异步复制、半同步复制、多源复制等,以及如何搭建主从集群,实现高可用性。 6. **分区与分片**:讨论如何通过分区和分片来提高大表的查询性能,以及分区...

Global site tag (gtag.js) - Google Analytics