Mysql的 ReplicReplication 线程
Mysql的 Replication 是一个异步的复制过程,从一个 Mysql instace(我们称之为 Master)复制到另一个 Mysql instance(我们称之 Slave)。在 Master 与 Slave 之间的实现整个复制过程主要由三个线程来完成,其中两个线程(Sql线程和IO线程)在 Slave 端,另外一个线程(IO线程)在 Master 端。
要实现 MySQL 的 Replication ,首先必须打开 Master 端的Binary Log(mysql-bin.xxxxxx)功能,否则无法实现。因为整个复制过程实际上就是Slave从Master端获取该日志然后再在自己身上完全顺序的执行日志中所记录的各种操作。打开 MySQL 的 Binary Log 可以通过在启动 MySQL Server 的过程中使用 “—log-bin” 参数选项,或者在 my.cnf 配置文件中的 mysqld 参数组([mysqld]标识后的参数部分)增加 “log-bin” 参数项。
MySQL 复制的基本过程如下:
1. Slave 上面的IO线程连接上 Master,并请求从指定日志文件的指定位置(或者从最开始的日志)之后的日志内容;
2. Master 接收到来自 Slave 的 IO 线程的请求后,通过负责复制的 IO 线程根据请求信息读取指定日志指定位置之后的日志信息,返回给 Slave 端的 IO 线程。返回信息中除了日志所包含的信息之外,还包括本次返回的信息在 Master 端的 Binary Log 文件的名称以及在 Binary Log 中的位置;
3. Slave 的 IO 线程接收到信息后,将接收到的日志内容依次写入到 Slave 端的Relay Log文件(mysql-relay-bin.xxxxxx)的最末端,并将读取到的Master端的bin-log的文件名和位置记录到master-info文件中,以便在下一次读取的时候能够清楚的告诉Master“我需要从某个bin-log的哪个位置开始往后的日志内容,请发给我”
4. Slave 的 SQL 线程检测到 Relay Log 中新增加了内容后,会马上解析该 Log 文件中的内容成为在 Master 端真实执行时候的那些可执行的 Query 语句,并在自身执行这些 Query。这样,实际上就是在 Master 端和 Slave 端执行了同样的 Query,所以两端的数据是完全一样的。
实际上,在老版本中,MySQL 的复制实现在 Slave 端并不是由 SQL 线程和 IO 线程这两个线程共同协作而完成的,而是由单独的一个线程来完成所有的工作。但是 MySQL 的工程师们很快发现,这样做存在很大的风险和性能问题,主要如下:
首先,如果通过一个单一的线程来独立实现这个工作的话,就使复制 Master 端的,Binary Log日志,以及解析这些日志,然后再在自身执行的这个过程成为一个串行的过程,性能自然会受到较大的限制,这种架构下的 Replication 的延迟自然就比较长了。
其次,Slave 端的这个复制线程从 Master 端获取 Binary Log 过来之后,需要接着解析这些内容,还原成 Master 端所执行的原始 Query,然后在自身执行。在这个过程中,Master端很可能又已经产生了大量的变化并生成了大量的 Binary Log 信息。如果在这个阶段 Master 端的存储系统出现了无法修复的故障,那么在这个阶段所产生的所有变更都将永远的丢失,无法再找回来。这种潜在风险在Slave 端压力比较大的时候尤其突出,因为如果 Slave 压力比较大,解析日志以及应用这些日志所花费的时间自然就会更长一些,可能丢失的数据也就会更多。
所以,在后期的改造中,新版本的 MySQL 为了尽量减小这个风险,并提高复制的性能,将 Slave 端的复制改为两个线程来完成,也就是前面所提到的 SQL 线程和 IO 线程。最早提出这个改进方案的是Yahoo!的一位工程师“Jeremy Zawodny”。通过这样的改造,这样既在很大程度上解决了性能问题,缩短了异步的延时时间,同时也减少了潜在的数据丢失量。
当然,即使是换成了现在这样两个线程来协作处理之后,同样也还是存在 Slave 数据延时以及数据丢失的可能性的,毕竟这个复制是异步的。只要数据的更改不是在一个事务中,这些问题都是存在的。
如果要完全避免这些问题,就只能用 MySQL 的来解决了。不过 MySQL的 Cluster 知道笔者写这部分内容的时候,仍然还是一个内存数据库的解决方案,也就是需要将所有数据包括索引全部都 Load 到内存中,这样就对内存的要求就非常大的大,对于一般的大众化应用来说可实施性并不是太大。当然,在之前与 MySQL 的 CTO David 交流的时候得知,MySQL 现在正在不断改进其 Cluster 的实现,其中非常大的一个改动就是允许数据不用全部 Load 到内存中,而仅仅只是索引全部 Load 到内存中,我想信在完成该项改造之后的 MySQL Cluster 将会更加受人欢迎,可实施性也会更大。
转自:http://blog.sina.com.cn/s/blog_63940ce20101c34w.html
分享到:
相关推荐
作者:高鹏(网名八怪),《深入理解MySQL主从原理32讲》系列文的作者。2008年开始至今一直从事Oracle/MySQL相关工作,现任易极付高级DBA,Oracle Ocm。有丰富的数据库性能调优,故障诊断经验,并且对MySQL源码有...
#### 二、MySQL同步原理 MySQL同步的核心在于将一个服务器(通常是主服务器)的数据变化复制到其他服务器(从服务器)上。这种复制过程由MySQL内部自动完成,用户只需要正确配置相关的参数即可。下面将具体介绍其...
首先,我们需要理解MySQL的复制原理。MySQL的主从复制是基于日志的,主库上的所有更改都会被记录到二进制日志(binlog)中,然后从库通过读取并应用这些日志来更新其数据。这个过程可以是异步的,也可以是半同步的,...
#### 二、MySQL同步原理 MySQL中的同步通常被称为“复制”(Replication),其核心思想是通过复制主服务器(Master)的事务到从服务器(Slave)上来保持数据的一致性。这种机制不仅能够提高系统的可靠性和可用性,...
MySQL 主从同步配置过程 一、 MySQL 主从同步配置概述 MySQL 主从同步配置是指将 MySQL 数据库的数据从一台服务器(主服务器)同步到另一台服务器(从服务器)的过程。这种配置可以实现数据的高可用性和灾难恢复,...
无损复制(Lossless Replication)是MySQL 5.7.2版本之后引入的一种半同步复制方式,并通过一个参数值after_sync来实现。在这种模式下,事务写入到主服务器的binlog之后,会传递到从服务器,当从服务器写入到relay ...
**半同步复制的工作原理:** 1. **事务提交流程:** - 主库接收到一个事务,并将其写入binlog。 - 主库向从库发送该binlog事件。 - 从库接收并应用binlog事件到其中继日志(relay log)。 - 从库发送一个确认...
下面将详细介绍 MySQL 双机热备同步的配置步骤和原理。 主从关系同步 在 MySQL 中,主从关系同步是指一个主服务器将数据同步到一个或多个从服务器上。主服务器负责写入数据,而从服务器负责读取数据。在 MySQL ...
MySQL数据库同步和主主同步是数据库管理中的重要概念,尤其对于需要实时数据共享或高可用性的系统至关重要。...然而,理解同步的基本原理和潜在问题仍然至关重要,以便在遇到故障时能快速诊断和解决。
MySQL的主从复制和半同步复制是数据库集群中常见的高可用性和数据冗余策略,能够保证数据的一致性并提供故障恢复能力。本文将详细解释这两种复制方式的原理、配置步骤以及优缺点。 **一、MySQL主从复制** MySQL...
为了解决异步复制可能导致的数据丢失问题,MySQL引入了半同步复制(Semisynchronous Replication)。在半同步复制中,主服务器在提交事务前会等待至少一个从服务器确认已经接收并写入其中继日志。这样可以确保在主...
《DataX ClickHouse读写插件:MySQL、Oracle到ClickHouse的数据同步与反向同步实践》 DataX作为阿里巴巴开源的一款高效、稳定、强大的数据同步工具,广泛应用于大数据生态中的数据迁移任务。针对ClickHouse这款高...
### 一、Mysql多机同步原理 Mysql的多机同步主要基于主从复制(Master-Slave Replication)模式,这是一种异步或半同步的数据复制方式,通过在主服务器上执行的事务日志(Binlog)传输到从服务器,从而实现数据的...
淘宝资深工程师丁奇在2009年的分享中详细介绍了MySQL主从同步的原理、配置、优化以及在实际应用中遇到的问题和解决方案。 首先,MySQL主从同步的基本概念指的是在一个数据库实例(主库)上对数据进行修改操作后,...
与MySQL同步,可以满足对非结构化数据或半结构化数据的处理需求。 6. **数据同步原理**: Canal通过解析MySQL的binlog,获取到数据库的增删改查操作,然后将这些操作以事件的形式推送到目标NoSQL数据库。这种方式...
下面将详细阐述主从复制的基本原理、异步复制的特点以及半同步复制和GTID复制的概念。 ### 一、主从复制简述 主从复制的基本架构包括单向、双向、级联、一主多从和多主一从等模式。当主服务器接收到写操作请求并...
### MySQL 主从原理、问题、解决方案和应用 #### 一、MySQL主从同步基本流程 在MySQL中,主从同步是一种常见的数据复制机制,用于在多个数据库服务器间保持数据的一致性。通常,一个主服务器负责接收客户端的写...
2. **MySQL主从备份原理**: - **Binary Log (binlog)**:主库上的所有更改都会被记录到binlog中,这是复制的基础。 - **I/O线程**:从库启动一个I/O线程,连接到主库并请求binlog。主库将binlog事件发送到从库。 ...