`

MySQL 数据库性能优化之SQL优化

 
阅读更多
  • 优化目标
    1. 减少 IO 次数
      IO永远是数据库最容易瓶颈的地方,这是由数据库的职责所决定的,大部分数据库操作中超过90%的时间都是 IO 操作所占用的,减少 IO 次数是 SQL 优化中需要第一优先考虑,当然,也是收效最明显的优化手段。
    2. 降低 CPU 计算
      除了 IO 瓶颈之外,SQL优化中需要考虑的就是 CPU 运算量的优化了。order by, group by,distinct … 都是消耗 CPU 的大户(这些操作基本上都是 CPU 处理内存中的数据比较运算)。当我们的 IO 优化做到一定阶段之后,降低 CPU 计算也就成为了我们 SQL 优化的重要目标
  • 优化方法
    1. 改变 SQL 执行计划
      明确了优化目标之后,我们需要确定达到我们目标的方法。对于 SQL 语句来说,达到上述2个目标的方法其实只有一个,那就是改变 SQL 的执行计划,让他尽量“少走弯路”,尽量通过各种“捷径”来找到我们需要的数据,以达到 “减少 IO 次数” 和 “降低 CPU 计算” 的目标
  • 常见误区
    1. count(1)和count(primary_key) 优于 count(*)
      很多人为了统计记录条数,就使用 count(1) 和 count(primary_key) 而不是 count(*) ,他们认为这样性能更好,其实这是一个误区。对于有些场景,这样做可能性能会更差,应为数据库对 count(*) 计数操作做了一些特别的优化。
    2. count(column) 和 count(*) 是一样的
      这个误区甚至在很多的资深工程师或者是 DBA 中都普遍存在,很多人都会认为这是理所当然的。实际上,count(column) 和 count(*) 是一个完全不一样的操作,所代表的意义也完全不一样。
      count(column) 是表示结果集中有多少个column字段不为空的记录
      count(*) 是表示整个结果集有多少条记录
    3. select a,b from … 比 select a,b,c from … 可以让数据库访问更少的数据量
      这个误区主要存在于大量的开发人员中,主要原因是对数据库的存储原理不是太了解。
      实际上,大多数关系型数据库都是按照行(row)的方式存储,而数据存取操作都是以一个固定大小的IO单元(被称作 block 或者 page)为单位,一般为4KB,8KB… 大多数时候,每个IO单元中存储了多行,每行都是存储了该行的所有字段(lob等特殊类型字段除外)。
      所以,我们是取一个字段还是多个字段,实际上数据库在表中需要访问的数据量其实是一样的。
      当然,也有例外情况,那就是我们的这个查询在索引中就可以完成,也就是说当只取 a,b两个字段的时候,不需要回表,而c这个字段不在使用的索引中,需要回表取得其数据。在这样的情况下,二者的IO量会有较大差异。
    4. order by 一定需要排序操作
      我们知道索引数据实际上是有序的,如果我们的需要的数据和某个索引的顺序一致,而且我们的查询又通过这个索引来执行,那么数据库一般会省略排序操作,而直接将数据返回,因为数据库知道数据已经满足我们的排序需求了。
      实际上,利用索引来优化有排序需求的 SQL,是一个非常重要的优化手段
      延伸阅读:MySQL ORDER BY 的实现分析MySQL 中 GROUP BY 基本实现原理 以及 MySQL DISTINCT 的基本实现原理 这3篇文章中有更为深入的分析,尤其是第一篇
    5. 执行计划中有 filesort 就会进行磁盘文件排序
      有这个误区其实并不能怪我们,而是因为 MySQL 开发者在用词方面的问题。filesort 是我们在使用 explain 命令查看一条 SQL 的执行计划的时候可能会看到在 “Extra” 一列显示的信息。
      实际上,只要一条 SQL 语句需要进行排序操作,都会显示“Using filesort”,这并不表示就会有文件排序操作。
      延伸阅读:理解 MySQL Explain 命令输出中的filesort ,我在这里有更为详细的介绍
  • 基本原则
    1. 尽量少 join
      MySQL 的优势在于简单,但这在某些方面其实也是其劣势。MySQL 优化器效率高,但是由于其统计信息的量有限,优化器工作过程出现偏差的可能性也就更多。对于复杂的多表 Join,一方面由于其优化器受限,再者在 Join 这方面所下的功夫还不够,所以性能表现离 Oracle 等关系型数据库前辈还是有一定距离。但如果是简单的单表查询,这一差距就会极小甚至在有些场景下要优于这些数据库前辈。
    2. 尽量少排序
      排序操作会消耗较多的 CPU 资源,所以减少排序可以在缓存命中率高等 IO 能力足够的场景下会较大影响 SQL 的响应时间。
      对于MySQL来说,减少排序有多种办法,比如:
      • 上面误区中提到的通过利用索引来排序的方式进行优化
      • 减少参与排序的记录条数
      • 非必要不对数据进行排序
    3. 尽量避免 select *
      很多人看到这一点后觉得比较难理解,上面不是在误区中刚刚说 select 子句中字段的多少并不会影响到读取的数据吗?
      是的,大多数时候并不会影响到 IO 量,但是当我们还存在 order by 操作的时候,select 子句中的字段多少会在很大程度上影响到我们的排序效率,这一点可以通过我之前一篇介绍 MySQL ORDER BY 的实现分析 的文章中有较为详细的介绍。
      此外,上面误区中不是也说了,只是大多数时候是不会影响到 IO 量,当我们的查询结果仅仅只需要在索引中就能找到的时候,还是会极大减少 IO 量的。
    4. 尽量用 join 代替子查询
      虽然 Join 性能并不佳,但是和 MySQL 的子查询比起来还是有非常大的性能优势。MySQL 的子查询执行计划一直存在较大的问题,虽然这个问题已经存在多年,但是到目前已经发布的所有稳定版本中都普遍存在,一直没有太大改善。虽然官方也在很早就 承认这一问题,并且承诺尽快解决,但是至少到目前为止我们还没有看到哪一个版本较好的解决了这一问题。
    5. 尽量少 or
      当 where 子句中存在多个条件以“或”并存的时候,MySQL 的优化器并没有很好的解决其执行计划优化问题,再加上 MySQL 特有的 SQL 与 Storage 分层架构方式,造成了其性能比较低下,很多时候使用 union all 或者是union(必要的时候)的方式来代替“or”会得到更好的效果。
    6. 尽量用 union all 代替 union
      union 和 union all 的差异主要是前者需要将两个(或者多个)结果集合并后再进行唯一性过滤操作,这就会涉及到排序,增加大量的 CPU 运算,加大资源消耗及延迟。所以当我们可以确认不可能出现重复结果集或者不在乎重复结果集的时候,尽量使用 union all 而不是 union。
    7. 尽量早过滤
      这一优化策略其实最常见于索引的优化设计中(将过滤性更好的字段放得更靠前)。
      在 SQL 编写中同样可以使用这一原则来优化一些 Join 的 SQL。比如我们在多个表进行分页数据查询的时候,我们最好是能够在一个表上先过滤好数据分好页,然后再用分好页的结果集与另外的表 Join,这样可以尽可能多的减少不必要的 IO 操作,大大节省 IO 操作所消耗的时间。
    8. 避免类型转换
      这里所说的“类型转换”是指 where 子句中出现 column 字段的类型和传入的参数类型不一致的时候发生的类型转换:
      • 人为在column_name 上通过转换函数进行转换
        直接导致 MySQL(实际上其他数据库也会有同样的问题)无法使用索引,如果非要转换,应该在传入的参数上进行转换
      • 由数据库自己进行转换
        如果我们传入的数据类型和字段类型不一致,同时我们又没有做任何类型转换处理,MySQL 可能会自己对我们的数据进行类型转换操作,也可能不进行处理而交由存储引擎去处理,这样一来,就会出现索引无法使用的情况而造成执行计划问题。
    9. … 后续补充中 …
分享到:
评论

相关推荐

    MySql数据库性能优化

    MySql数据库性能优化 MySql数据库性能优化是指通过调整和优化数据库的各种参数、结构和查询语句,提高数据库的运行速度和效率,减少资源占用和系统瓶颈。下面将详细介绍MySql数据库性能优化的相关知识点。 什么是...

    MySQL数据库优化SQL篇PPT课件.pptx

    MySQL数据库优化SQL篇PPT课件.pptx 本PPT课件主要讲述了MySQL数据库优化的重要知识点,特别是SQL优化方面的内容。从执行计划、SELECT语句、IN和EXIST语句、LIMIT语句、RAND函数、Order by、Group by、Distinct和...

    mySQL数据库性能优化pdf.pdf

    这篇文章将详细讨论MySQL数据库性能优化的相关知识点,这不仅是Java面试的热点,也是每一位数据库管理员和开发人员应该掌握的技能。 首先,性能优化的范围非常广泛,无论是桌面应用、Web应用还是移动应用,无论是...

    MySQL架构执行与SQL性能优化 MySQL高并发详解 MySQL数据库优化训练营四期课程

    MySQL架构执行与SQL性能优化-MySQL高并发详解课程,课程的目标简单...课程安排的学习的教程与对应的学习课件,详细的学习笔以及课程对应的SQL语句,具有由数据库或者MySQL的同学们快来参加这堂MySQL的性能优化课堂吧。

    Mysql数据库与SQL优化+集群+负载均衡.doc

    2. 索引优化:索引是数据库性能优化的重要手段。正确的索引设置可以提高查询速度、减少磁盘空间占用和提高数据安全性。常见的索引类型包括:B-Tree 索引、Hash 索引、Full-text 索引等。 3. 查询语句优化:查询语句...

    MySQL数据库性能(SQL)优化方案.pdf

    MySQL数据库性能优化是提高系统效率的关键,特别是在处理大量数据时。本文主要从以下几个方面探讨了如何优化MySQL数据库的SQL性能: 1. **选择合适的字段属性**:为了提高查询速度和节省存储空间,应尽可能减少字段...

    基于MySQL数据库的查询性能优化研究.pdf

    基于 MySQL 数据库的查询性能优化研究 MySQL 数据库是当前网络环境中最流行的开源关系型数据库之一,随着网络环境中数据总量的急剧攀升,对数据库查询的响应时间提出了更严格的要求。为了提高查询效率,需要研究 ...

    数据库性能优化方案

    数据库性能优化是IT领域中的一个核心议题,尤其对于处理大量数据的企业级应用而言,高效的数据库性能至关重要。在SQL Server、MySQL和Oracle这三大主流数据库系统中,优化策略各有其特点和技巧。以下将针对这些...

    sql查询优化(提高MySQL数据库查询效率的几个技巧)

    SQL 查询优化(提高 MySQL 数据库查询效率的几个技巧) 在 MySQL 数据库中,查询优化是一个非常重要的方面。在实际应用中,高效的查询可以提高整个系统的性能和响应速度。下面我们将介绍几个提高 MySQL 数据库查询...

    【整理】数据库面试题索引sql优化+数据库SQL优化总结之百万级数据库优化

    在IT行业中,数据库性能优化是至关重要的,尤其是在处理百万级数据量时。本文将深入探讨数据库面试中的常见问题,特别是关于SQL优化和针对大规模数据库的优化策略。首先,我们来看看"数据库面试题索引sql优化.pdf...

    千金良方:MySQL性能优化金字塔法则.docx

    MySQL性能优化是指通过调整MySQL数据库的配置、优化数据库结构和查询语句等方式,提高MySQL数据库的性能和响应速度,以满足应用程序的需求。MySQL作为最流行的开源数据库之一,被广泛应用于各种规模的企业和应用程序...

    深入浅出MySQL数据库开发、优化与管理维护.doc

    查询优化是数据库开发的重要步骤,需要考虑到查询性能和数据存储的需求。在优化查询时,需要遵循一定的原则,例如,使用索引、优化 SQL 语句等。 事务处理 事务处理是数据库开发的重要步骤,需要考虑到数据的一致...

    基于MySQL的数据库查询性能优化.pdf

    "基于MySQL的数据库查询性能优化" 在当前的Web应用开发中,数据库的查询操作已经成为整个应用的性能瓶颈, especialmente 对于使用 MySQL 的 Web 应用。因此,数据库查询性能的优化已经成为一个非常重要的课题。...

    MySQL数据库性能(SQL)优化方案-期末论文.doc

    综上所述,MySQL数据库性能优化是一个多方面的过程,涉及到SQL查询优化、数据库设计、参数配置等多个层面。通过对这些方面进行综合考虑和细致调整,可以显著提升MySQL数据库的整体性能,满足日益增长的数据处理需求...

    优化MySQL数据库性能的八大妙手.rar

    以上八大妙手是MySQL数据库性能优化的主要方向,但具体实施时需结合实际情况灵活应用。不断监控和调整数据库性能,确保系统的高效稳定运行。通过持续学习和实践,你将成为MySQL数据库性能优化的大师。

    MySQL数据库查询优化方案.docx

    MySQL 数据库查询优化是指对数据库中的查询语句进行优化,以提高查询效率和数据库性能。以下是 MySQL 数据库查询优化的一些重要知识点: 一、索引相关 索引是 MySQL 数据库查询优化的重要手段。索引可以提高查询...

    MYSQL数据库技术分享.ppt

    MYSQL数据库SQL优化是MYSQL数据库性能优化的重要步骤。通过优化SQL语句,可以提高MYSQL数据库的性能。常用的MYSQL数据库SQL优化方法包括: 1. 优化SQL语句结构:通过优化SQL语句结构,例如使用索引、优化子查询等,...

    mysql数据库优化的学习心得

    由于 MySQL 数据库的性能优化可以直接影响到整个应用系统的性能和用户体验,因此掌握 MySQL 数据库优化技巧对开发者和数据库管理员来说非常重要。本文总结了一些 MySQL 数据库优化技巧,包括选择合适的字段属性、...

    sql 数据库导入 mysql数据库的工具 sql 转化mysql

    总结,将SQL数据库的数据导入到MySQL数据库,涉及到多个环节,包括数据的导出、转换和导入,以及在此过程中需要注意的数据一致性、权限管理、备份恢复和性能优化。通过使用如`mss2sql`这样的专业工具,可以简化这个...

    MySQL数据库性能优化之表结构优化

     这是 MySQL数据库性能优化专题 系列的第二篇文章:MySQL 数据库性能优化之表结构优化  系列的第一篇文章:MySQL 数据库性能优化之缓存参数优化  由于MySQL数据库是基于行(Row)存储的数据库,而数据库操作 IO ...

Global site tag (gtag.js) - Google Analytics