`
weitao1026
  • 浏览: 1048769 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

针对 MySQL 大规模数据库的性能和伸缩性的优化

 
阅读更多

在需要支持移动/平板电脑应用及普通桌面浏览器访问的时代,网站的普及率和有效性很大程度上取决于其可用性和性能。一个访问缓慢的网站会使得访问者或潜在的客户流失,并导致商业的失败。一个访问速度相当快的网站将会决定访客是否会使用网站提供的产品或服务。

拥有大规模数据库的网站始终需要适当的关注、配置、优化、调整和维护,以确保网站的快速加载。这篇文章将讨论如何优化有海量数据的 MySQL 数据库。

选择 InnoDB 作为存储引擎

大型产品的数据库对于可靠性和并发性的要求较高,InnoDB 作为默认的 MySQL 存储引擎,相对于 MyISAM 来说是个更佳的选择。

优化数据库结构

  • 组织数据库的 schema、表和字段以降低 I/O 的开销,将相关项保存在一起,并提前规划,以便随着数据量的增长,性能可以保持较高的水平。
  • 设计数据表应尽量使其占用的空间最小化,表的主键应尽可能短。
  • 对于 InnoDB 表,主键所在的列在每个辅助索引条目中都是可复制的,因此如果有很多辅助索引,那么一个短的主键可以节省大量空间。
  • 仅创建你需要改进查询性能的索引。索引有助于检索,但是会增加插入和更新操作的执行时间。

InnoDB 的 Change Buffering 特性

InnoDB 提供了 change buffering 的配置,可减少维护辅助索引所需的磁盘 I/O。大规模的数据库可能会遇到大量的表操作和大量的 I/O,以保证辅助索引保持最新。当相关页面不在缓冲池里面时,InnoDB 的 change buffer 将会更改缓存到辅助索引条目,从而避免因不能立即从磁盘读取页面而导致耗时的 I/O 操作。当页面被加载到缓冲池时,缓冲的更改将被合并,更新的页面之后会刷新到磁盘。这样做可提高性能,适用于 MySQL 5.5 及更高版本。

InnoDB 页面压缩

InnoDB 支持对表进行页面级的压缩。当写入数据页的时候,会有特定的压缩算法对其进行压缩。压缩后的数据会写入磁盘,其打孔机制会释放页面末尾的空块。如果压缩失败,数据会按原样写入。表和索引都会被压缩,因为索引通常是数据库总大小中占比很大的一部分,压缩可以显著节约内存,I/O 或处理时间,这样就达到了提高性能和伸缩性的目的。它还可以减少内存和磁盘之间传输的数据量。MySQL 5.1 及更高版本支持该功能。

注意,页面压缩并不能支持共享表空间中的表。共享表空间包括系统表空间、临时表空间和常规表空间。

使用批量数据导入

在主键上使用已排序的数据源进行批量数据的导入可加快数据插入的过程。否则,可能需要在其他行之间插入行以维护排序,这会导致磁盘 I/O 变高,进而影响性能,增加页的拆分。关闭自动提交的模式也是有好处的,因为它会为每个插入执行日志刷新到磁盘。在批量插入期间临时转移唯一键和外键检查也可显著降低磁盘 I/O。对于新建的表,最好的做法是在批量导入后创建外键/唯一键约束。

SQL 语句优化

为了提升查询的速度,可以为 WHERE 字句中使用的列添加索引。此外,不要将主键索引用于太多或太长的列,因为这些列值在辅助索引进行复制的时候会增加读取所需要的 I/O 资源并占用缓存。

如果索引包含了不必要的数据,通过 I/O 读取这些数据并进行缓存就会减弱服务器的性能和伸缩性。也不要为不必要的列使用唯一键索引,因为它会禁用 change buffering。应该使用常规索引代替。

减少和隔离需要耗费大量时间的函数调用。

尽可能的减少查询中的全表扫描次数。

调整缓存区域的大小和属性,比如 InnoDB 缓冲池,MySQL 查询缓存等,这样会通过从内存而非从硬盘获取数据而让重复的查询变得更快。

优化存储结构

对于大型的表,或者包含大量重复文本或数值数据的表,应该考虑使用 COMPRESSED(压缩的) 行格式。这样只需要较少的 I/O 就可以把数据取到缓冲池,或执行全表扫描。

一旦你的数据达到稳定的大小,或者增长的表增加了几十或几百兆字节,就应该考虑使用 OPTIMIZE TABLE 语句重新组织表并压缩浪费的空间。对重新组织后的表进行全表扫描所需要的 I/O 会更少。

优化 InnoDB 磁盘 I/O

增加 InnoDB 缓冲池大小可以让查询从缓冲池访问而不是通过磁盘 I/O 访问。通过调整系统变量 innodb_flush_method 来调整清除缓冲的指标使其达到最佳水平。

使用其它存储设备配置 RAID。

MySQL 的内存分配

在为 MySQL 分配足够的内存之前,请考虑不同领域对 MySQL 的内存需求。

要考虑的关键领域是:并发连接 —— 对于大量并发连接,排序和临时表将需要大量内存。在撰写本文时,对于处理 3000+ 并发连接的数据库,16GB 到 32GB的 RAM 是足够的。

内存碎片可以消耗大约 10% 或更多的内存。像 innodb_buffer_pool_size、key_buffer_size、query_cache_size 等缓存和缓冲区要消耗大约 80% 的已分配内存。

日常维护

定期检查慢的查询日志并优化查询机制以有效使用缓存来减少磁盘 I/O。优化它们,以扫描最少的行数,而不是进行全表扫描。

其他可以帮助 DBA 检查和分析性能的日志包括:错误日志、常规查询日志、二进制日志、DDL日志(元数据日志)。

定期刷新缓存和缓冲区以降低碎片化。使用 OPTIMIZE TABLE 语句重新组织表并压缩任何可能被浪费的空间。

分享到:
评论

相关推荐

    ⼗招搞定 MySQL ⼤规模数据库的性能和伸缩性优化

    MySQL 大规模数据库的性能和伸缩性优化是确保网站高效运行的关键,尤其是在移动设备和平板电脑广泛应用的时代。本文将探讨一系列策略来优化处理大量数据的 MySQL 数据库。 首先,选择正确的存储引擎至关重要。...

    MySQL数据库性能优化研究.docx

    1. MySQLTuner:一款流行的 MySQL 性能诊断工具,可以检查 MySQL 服务器的配置和性能,并提供优化建议。 2. Percona Toolkit:一款强大的 MySQL 管理工具,提供了多种性能测试和优化工具。 3. Sysbench:一款开源的...

    利用USL预测MySQL数据库可伸缩性.pptx

    总结来说,利用USL预测MySQL数据库的可伸缩性是解决性能瓶颈和优化数据库设计的有效手段。通过对并发性、竞争和一致性的量化分析,我们可以更好地理解和改进系统的扩展能力,确保数据库在面临高负载时仍能保持高效...

    深入比较MySQL与Oracle:性能、可伸缩性与最佳实践

    在数据库管理系统(DBMS)领域,MySQL和Oracle是两个备受瞩目的选择。它们各自具有独特的特点和优势,适用于不同的应用场景。...通过合理的优化和配置,两者都可以为特定的应用场景提供出色的性能和可伸缩性。

    面向大规模可伸缩网站基础设施的MySQL参考架构

    面向大规模可伸缩网站基础设施的MySQL参考架构是一个详细的指南,它由Oracle在2013年发布,旨在为使用MySQL作为数据存储的网站提供推荐的拓扑结构。这篇白皮书针对不同规模的网站,从小型到中型,再到大型和超大型...

    MYSQL 百度分布式数据库

    综上所述,“百度分布式数据库”是针对大规模互联网应用而设计的数据库解决方案,它结合了MySQL的灵活性和分布式架构的优势,实现了高并发、高可用和高性能的目标。通过主从复制、分片、分布式事务处理等多种技术...

    archive_ Cetus MySQL数据库中间件 v2.3.9 [江西新余电信].zip.zip

    【标题】"archive_ Cetus MySQL数据库中间件 v2.3.9 [江西新余电信].zip.zip" 提供的是Cetus MySQL数据库中间件的版本2.3.9,这个软件通常用于数据库管理和优化,特别是在处理高并发和大规模数据场景时。Cetus作为一...

    高并发高可用mysql优化

    此外,监控和性能调优工具,如MySQL Enterprise Monitor和Percona Toolkit,能够实时监控数据库状态,及时发现并解决问题。 综上所述,高并发高可用的MySQL优化涉及索引设计、查询优化、架构调整以及使用高级特性等...

    mysql数据库的超级详细总结

    2. **分布式数据库**:为了满足大规模数据处理的需求,MySQL将继续优化分布式数据库技术,提升数据处理的并行性和可扩展性。 3. **AI与数据库融合**:人工智能技术的应用将推动MySQL向自动化、智能化方向发展,例如...

    mysql-connector-java-8.0.29.zip_数据库

    5. **连接池支持**: 驱动程序支持常见的Java连接池实现,如C3P0、HikariCP、Apache DBCP等,这有助于管理数据库连接资源,提高应用程序的性能和可伸缩性。 6. **自动类型映射**: MySQL Connector/J自动将MySQL的...

    京东弹性数据库中间件-JED.pdf

    JED支持多种数据库协议,包括MySQL、PostgreSQL、Oracle和SqlServer,适合在大规模分布式系统中使用,保证了服务的高性能和高可用性。 发展历程部分概述了JED的历史脉络,从早期的诸侯混战阶段到2011年开始支持...

    多种数据库性能比较.docx

    其查询优化器和对多任务并行查询的支持,使其在网络环境中表现出色,适合处理大规模的分布式应用。 Microsoft的SQL Server数据库系统是专为分布式客户机/服务器计算设计的,与Windows NT紧密集成,提供了先进的系统...

    MySQL云数据库架构设计实践_.zip

    云数据库通常具有弹性伸缩、高可用性和易于管理的特点。 二、MySQL云数据库架构设计原则 1. 高可用性:通过主备复制、多副本等方式确保数据的安全性和服务的连续性。 2. 弹性扩展:根据业务需求动态调整资源,如CPU...

    三大主流数据库快速上手

    三大主流数据库MySQL、MSSQL和Oracle各具特色,为不同规模和类型的业务提供支持。通过本教程,读者将能够掌握这三个数据库的基本操作和高级应用,为今后在数据库领域的深入学习和工作打下坚实的基础。

    从小型网站到超大规模网站的MySQL参考架构1

    《面向大规模可伸缩网站基础设施的 MySQL 参考架构》白皮书提供了针对不同规模网站的MySQL设计架构,从小型到超大型网站,确保数据库的高效运行和可伸缩性。以下是各类型网站的参考架构及其特点: 1. **小型(Small)...

    数据库复习试题 复习题目

    10. NoSQL数据库:NoSQL(Not Only SQL)提供了与传统SQL数据库不同的数据存储和访问方式,适用于大规模、动态和高并发的应用场景。NoSQL数据库通常支持文档、键值对、列族和图形等多种数据模型。 以上知识点对于...

Global site tag (gtag.js) - Google Analytics