`
大涛学长
  • 浏览: 106223 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

大型企业数据库服务首选,AliSQL这几大企业级功能你了解几个?

sql 
阅读更多
MySQL代表了开源数据库的快速发展,从2004年前后的Wiki、WordPress等轻量级Web 2.0应用起步,到2010年阿里巴巴在电商及支付场景大规模使用MySQL数据库,再到2012年开始阿里云RDS for MySQL为成千上万家客户提供可靠的关系数据库服务,积累了来自内外部功能、性能、安全方面的众多需求,培养了一支强劲的MySQL研发团队,并打造了面向企业场景的AliSQL分支,高效演进并稳定地服务着内外部关键业务场景。

让我们来一起看一下AliSQL中面向企业场景的设计及功能。

1、MySQL 8.0 Compatiable 
MySQL 8.0有5个非常好的企业级功能,来逐一看一下:

??Atomic DDL,MySQL 8.0去掉了表结构frm文件,实现了元数据信息字典化,可以保证DDL操作处理或回滚干净,避免了表删除不干净的情况。 
??Instant Add Column,元数据字典化后,向表最后面加列(无默认值)时,可以只更改数据字典,而不需要更改表数据,实现了极快速的加列。 
??Window Function,窗口函数可以用来快速实现复杂的报表,在许多企业应用场景中都会出现。 
??Temp Engine,执行特别复杂的SQL时,需要用到内存之外的临时空间,以前版本会动态地创建和删除文件,而在MySQL 8.0中,使用了集中式的Temp Engine,避免不停地创建和删除文件,有效降低了文件系统的压力。 
??Hash Join,MySQL 8.0中实现了Hash Join,可以加快多表(三表)以上关联的SQL性能,在企业场景中由于业务逻辑复杂,多表关联是常态,绝对的企业级功能。

我们在2019年推出了基于MySQL 8.0版本的AliSQL版本,远远领先于同行。

2、Dynamic Thread Pool 
企业级场景(包括互联网与非互联网场景)的商业数字化程度越来越高,应用场景越来越丰富,RDS数据库如何在有限资源(4c/8c规格,云上弹性降底企业成本)的情况下提供高质量服务,会面临以下挑战:

??如何在有限的资源下,支持更多的数据库连接数? 
??如何支持更高的短连接能力? 
??如何在有限的资源下,提高资源的使用效率,提升性能? 
??如何进行并发控制或隔离,保证核心业务逻辑的稳定性?

Dynamic Thread Pool可以很好地解决上述问题,

??采用Listener & Worker机制,将所有请求放到Worker队列中,由共享的Worker线程来执行不同用户的请求,从而不需要每个客户端会话都创建一个后台线程(非Dynamic Thread Pool)来执行请求,比如1000个客户端连接发起请求,服务器端只需要数十个Worker线程即可,而不需要创建1000个线程,从而可以在有限资源内创建更多的连接。 
??由于每个连接后面并不对应固定的线程,创建新连接时没有线程的操作,因此建立新连接的成本大大降底,从而可以提供更高和更稳定的连接创建能力。 
??通过控制了有限资源内的线程数,减少了线程切换,有效降低了SYS CPU的使用,提升了CPU的资源使用效率。在高并发的sysbench point select测试中,Dynamic Thread Pool可以提升10%左右的性能;在低并发时,Dynamic Thread Pool可以动态切换回专用模式,即每个连接都有专用的Worker对应,从而保证高低并发下都有极好的性能。 
??在数据库中有读写操作,SQL操作也可以分为简单操作和复杂操作,为了防止相互影响,Dynamic Thread Pool设计了多个队列,按SQL的操作成本将SQL进行分类,各自进入不同的队列,并在队列上进行并发的控制,从而可以隔离不同类型操作的相互影响。比如说核心业务逻辑中都是简单查询,新建应用未经评审的复杂SQL就不会影响核心逻辑。 
??Dynamic Thread Pool可以动态启停,不需要重启数据库实例。这是AliSQL Dynamic Thread Pool一个非常重大的技术创新与突破。

Dynamic Thread Pool已经在RDS 5.6/5.7/8.0版本上线,并已经默认开启,所有用户和客户都可以受益。TPCC模型最接近企业核心业务场景,在1024或2048客户端并发的TPCC测试中,Dynamic Thread Pool可以提升50%-100%左右的TpmC,并节约10%到20%的CPU资源消耗,给阿里云所有客户带来实实在在的技术红利。

3、Index Mutex Tuning 
TPCC模型最接近企业核心业务场景,对此场景的优化可以让企业应用受益。在TPCC的压力测试中,发现Index的锁非常重,在节点分裂时会阻塞所有的其他操作。AliSQL对此进行了优化,有效地降低了压测过程中,索引节点分裂的成本,大大地提升了TPCC场景的处理能力。在全内存的测试中,单机达到了39W的TpmC,相对于原生版本提升35-50%不等(大规格测试,5.6提升35%、5.7提升40%、8.0进升45%)。 
![image.png](https://ucc.alicdn.com/pic/developer-ecology/c1afc72bf8e24f2e8b167bcb9e6ab37e.png)

此优化已在RDS 56/57/80上同步优化发布上线。

4、TDE & SM4 
RDS 5.6/5.7/8.0都已经全线支持,并且支持SM4国密算法,可以确保客户数据的安全。

5、Performance Insight 
应用侧的SQL优化对系统及业务的优化至关重要,原生的MySQL中缺少行之有效的监控数据,AliSQL结合不同数据库的经验,并结合内部外部客户的需求,在SQL性能这块做了丰富的扩展,包含以下五个方面的扩展:

??table\_stats,记录每个表增删除改查的行数,可以快速地了解现有系统中的数据存取行为,判断业务的核心表,判断哪些表适合来作缓存处理。

??index\_stats,记录用到的索引以及索引被使用的频率,可以快速地了解索引的使用情况,判断哪些索引是多余的,判断哪些索引是核心的索引。

??Performance Point,记录了每个SQL的细粒度性能数据,包括SQL语句的时间(包括消耗时间、执行时间、Server层MDL锁的时间、事务锁的时间)、SQL IO的信息(包括这条SQL引起的数据读、数据写、日志生成、内存访问、物理读写的量及IO时间)、以及内核层面的锁(包括Mutex、RW Lock)的次数和时间。很容易找到值得优化的SQL语句,如果有一定的源代码能力,也可以分析和改进MySQL的锁机制。

??Performance Agent,使用内置Daemon程序,在同一时间点收集不同唯度(CPU、内存、网络、磁盘IO、Server、InnoDB、Linux Kernel、File System)的关键性能数据,每秒收集一次,以格式化文本方式在后台记录,便于事后进行性能分析,同时也是内存表的方式提供访问,方便客户直接使用Grafana等工具来展示RDS数据库性能曲线。 
![image.png](https://ucc.alicdn.com/pic/developer-ecology/2c3b10089b2f443c9caab98c2bada115.png)

??IO\_STATISTICS,记录实例级各种不同IO的总量及时间,默认每2秒一个值(可配置),可以直接使用Grafana等工具来展示。

在仔细分析原生Performance Schema后,AliSQL中增加了这些额外的性能相关的数据,如实地反映了系统的运行情况,方便我们进行事后性能问题诊断,也方便了客户进行SQL性能分析,也可以让第三方基于这些性能数据来为客户提供更好的性能优化服务。

6、Async File Purge 
在文件系统中删除一个特别大的文件(Drop Table/Partition、Truncate Table/Partition)时,可能会锁定整个文件系统,导致同一个文件系统上的其他操作无法进行,阻塞整个实例。AliSQL中对这种行为进行了优化,当接到删除表或分区的操作时,会记一个文件异步清理的任务,将表或分区的操作先做完,然后由后台线程以相对温和的方式进行清理。其原理是将大文件一步一步变小,到某个安全大小后,才彻底删除文件。

7、Slow Log Rotate 
某些业务场景下,会产生大量的慢SQL语句,会被记录在慢日志中,而原生的MySQL一直使用单个文件机制会一直保持Slow Log文件打开,导致文件变得特别大(可高在上百GB),需要在关闭MySQL实例的情况下,才能对Slow Log文件进行维护,非常地不友好。 
AliSQL对此作出了改进,设计了Slow Log切换机制,可以定时或到指定大小后进行切换(切换指令由外部触发),避免需要重启数据库实例来维护Slow Log文件(比如释放Slow Log空间)。其间还修复了以CSV格式存放Slow Log时,SQL执行时间范围超过35天(通常是Binlog Dump命令)引起的损坏问题。

8、SQL Outline 
SQL Hint是非常有效的优化手段,AliSQL对SQL Hint做了功能扩展,可以在运行过程中将SQL计算中的路径信息用相应的SQL Hint进行持久化保存,以保证执行计划的稳定性。可以有效应对以下场景下的SQL执行计划变更:

??数据库版本升级,优化器行为会发生变化,SQL计算计划可能变好也可能变坏。 
??DDL操作,新建索引后,会导致原有的SQL执行计划发生变化。 
??统计信息发生变化,重新收集或人工设置后,SQL执行计划可能发生变化。

对于核心业务的SQL,应当使用SQL Outline进行固化,避免SQL执行计划变坏。

AliSQL还提供API进行SQL Hint编辑,即可以手工给SQL加一个Hint,进行透明的SQL优化,可以在无法更改应用程序代码的情况下进行SQL优化。并在此基础上,与AliSQL其他的优化功能进行集成,比如Statement Queue、Query Cache(研发中)等,可以通过在SQL Outline中指定Hint来启用Statement Queeu的并发控制,或启用Query Cache,实现对应用透明的SQL优化。

9、Binlog XA Tuning 
MySQL的逻辑日志(Binlog)给数据订阅带来了极大的便捷性,但也给性能带来了负面影响。在服务客户的过程中,我们发现企业场景对性能的要求越来越高,便对启用Binlog后的事务提交机制进行了重大的技术突破,在不影响Binlog的前提下,去除了XA机制带来的所有负面性能影响,相较于原生的MySQL,事务处理性能提升将近一倍。更实现了事务提交的Pipeline机制,交由Dynamic Thread Pool的线程去回复用户事务提交结果,进一步降底了线程池的线程数,提升了系统处理效率。

10、DDL Recycle Bin 
在MySQL中DDL语句是无法回滚的,因此Drop/Truncate表或分区的操作会变得极期危险,在商业数据库中也是如此。

Oracle在10g中加入了回收站的功能,可以将Drop/Truncate的表或分区先放到回收站中,后续根据空间的使用情况,按先进先出的策略自动回收。这样就可以在Drop/Truncate误操作手,从回收站中快速恢复数据,而不需要进行实例基于时间点的恢复来找回误操作的表,AliSQL在8.0上也实现了此回收站功能。

AliSQL还有其他的企业级功能,例如Sequence引挚、Statement Queue等,在这里不一一详细解释。

从业务中找需求,从技术中找需求,从运行维护中找需求,从合作伙伴中找需求,所有的需求方都是我们的客户,一直致力于让AliSQL更加开放更加面向企业级应用。

 

 

[原文链接](https://link.zhihu.com/?target=https%3A//yq.aliyun.com/articles/739645%3Futm_content%3Dg_1000094672)

本文为阿里云内容,未经允许不得转载。
分享到:
评论

相关推荐

    AliSQL数据库开源功能特性.pdf

    在AliSQL的开源功能特性中,有几个关键的创新点: 1. **Sequence Engine**:这是一个序列生成器,允许用户创建和管理序列,类似于其他数据库系统中的序列。用户可以通过`CREATE SEQUENCE`语句定义序列,并使用`...

    企业级数据库管理系统

    在信息技术领域,企业级数据库管理系统(Enterprise Database Management System,简称EDBMS)是专门设计用于处理大型、复杂企业数据的软件系统。这类系统具有高可用性、可扩展性、安全性以及高性能的特点,能有效地...

    Oracle下搭建ArcGIS企业级地理数据库

    在现有的Oracle数据库中启用企业级地理数据库功能,通常涉及以下几个步骤: 1. **检查现有数据库**:确保现有数据库满足创建企业级地理数据库的要求,包括硬件配置、软件版本等。 2. **安装ArcSDE服务**:如果尚未...

    C# 编写的SqlServer 数据库自动备份服务,带配置,功能强大

    数据库自动备份服务是企业级系统中不可或缺的部分,它能够定期创建数据库的副本,以防数据丢失或系统故障。 描述中提到的“带配置”意味着该服务具有可定制性,用户可以根据实际需求调整备份频率、备份路径、备份...

    ArcSDE 企业级地理数据库概述

    总之,ArcSDE企业级地理数据库是GIS领域中一个至关重要的技术,它连接了空间数据的复杂性和关系数据库的稳定性,使得空间信息能够被有效地存储、管理和应用,尤其适用于需要高性能和高可靠性的大型GIS项目。

    简洁、直观、强大的企业级数据库监控系统.zip

    简洁、直观、强大的企业级数据库监控系统,MySQL/Oracle/MongoDB/Redis一站式监控,让数据库监控更简单。支持邮件告警、短信告警、AWR性能报告、慢查询分析等专业功能。 简洁、直观、强大的企业级数据库监控系统,...

    大型ORACLE数据库优化设计方案

    在IT领域,尤其在企业级应用中,ORACLE数据库因其卓越的性能和稳定性,成为众多大型企业和机构的首选。然而,随着业务量的增长,数据库的性能瓶颈逐渐显现,这不仅影响了系统的响应时间,还可能导致数据处理能力的...

    湖南工业大学大型数据库应用历年试卷

    Oracle数据库以其强大的功能、高度的可扩展性和安全性著称,尤其适合大型企业级应用。复习时,学生应该掌握Oracle的基本语法,如SQL查询、表和索引的创建、存储过程、触发器、事务管理等。此外,了解Oracle的数据...

    企业级DB2数据库学习与认证

    此外,DB2的分区功能允许将大型数据库分散到多个物理设备上,提高查询效率。内存管理和缓冲池也是提升性能的关键因素。 对于IBM的DB2资格认证,通常包括多个级别,例如Foundation、Associate、Professional等。这些...

    AliSQL数据库最佳实践之路.pptx

    AliSQL是阿里巴巴基于MySQL开发的一个分支,旨在提供更高效、稳定和安全的数据库服务。这份文档详细介绍了AliSQL的发展历程、重要成果、生态体系以及未来规划,揭示了AliSQL在性能优化和功能增强方面的诸多改进。 1...

    中大型企业数据库PaaS平台建设实践.pptx

    【中大型企业数据库PaaS平台建设实践】是针对现代企业面临的数据库管理挑战而提出的解决方案。随着业务互联网化的加速,企业数据库的数量、种类和架构复杂性急剧增加,对数据库运维提出了更高要求。传统的数据库运维...

    三级数据库考试基本要求

    计算机三级数据库考试是针对数据库系统的基本原理、设计与应用进行的综合评估,旨在检验考生对计算机系统、数据结构、操作系统、数据库系统以及编程基础的掌握程度。以下是对考试大纲的详细解析: 1. 计算机系统和...

    C#企业级即时消息系统(数据库齐全)

    一个典型的企业级即时消息系统可能包含客户端应用、服务器端应用、数据库服务器以及消息队列服务。客户端负责用户界面和交互,服务器端处理业务逻辑和数据交换,数据库存储所有信息,消息队列用于缓冲消息,减轻...

    PowerBuilder 企业级数据库

    **PowerBuilder:企业级数据库应用开发的利器** PowerBuilder是一款由Sybase公司(现已被SAP收购)开发的集成开发环境(IDE),专门用于构建企业级数据库应用程序。它以其高效、便捷的特性,在数据库开发领域享有...

    使用catalog新建企业级地理数据库

    使用catalog新建企业级地理数据库基本操作,可针对新手使用

    SQL Server:企业级数据库管理系统概述及应用场景

    内容概要:本文详细介绍了SQL Server这款由微软开发的企业级数据库管理系统,涵盖其主要特点、关键组件、应用场景、版本选择以及安装和常用操作。SQL Server以其高性能、高可用性、多平台支持、全面的数据工具、内置...

    构建Oracle高可用环境:企业级高可用数据库架构、实战与经验总结

    资源名称:构建Oracle高可用环境:企业级高可用数据库架构、实战与经验总结资源截图: 资源太大,传百度网盘了,链接在附件中,有需要的同学自取。

    会员的大型商城数据库设计文件(.sql)网站千万级大型商城数据库必备的sql参考

    大型网站数据库设计sql,下载运行即可使用参考,完美注释,清晰字段名

Global site tag (gtag.js) - Google Analytics