mysql的master和salve 详解
事件:由于公司的服务器配置较低,大量的请求用户进来托的很慢将系统,于是想到了mysqd集群配置,具体配置参数就不贴出来了,请看下面 的 原理篇
Mysql的 Replication 是一个异步的复制过程,从一个 Mysql instace(我们称之为 Master)复制到另一个 Mysql instance(我们称之 Slave)。在 Master 与 Slave 之间的实现整个复制过程主要由三个线程来完成,其中两个线程(Sql线程和IO线程)在 Slave 端,另外一个线程(IO线程)在 Master 端。
要 实现 MySQL 的 Replication ,首先必须打开 Master 端的Binary Log(mysql-bin.xxxxxx)功能,否则无法实现。因为整个复制过程实际上就是Slave从Master端获取该日志然后再在自己身上完全 顺序的执行日志中所记录的各种操作。打开 MySQL 的 Binary Log 可以通过在启动 MySQL Server 的过程中使用 “—log-bin” 参数选项,或者在 my.cnf 配置文件中的 mysqld 参数组([mysqld]标识后的参数部分)增加 “log-bin” 参数项。
MySQL 复制的基本过程如下:
1. Slave 上面的IO线程连接上 Master,并请求从指定日志文件的指定位置(或者从最开始的日志)之后的日志内容;
2. Master 接收到来自 Slave 的 IO 线程的请求后,通过负责复制的 IO 线程根据请求信息读取指定日志指定位置之后的日志信息,返回给 Slave 端的 IO 线程。返回信息中除了日志所包含的信息之外,还包括本次返回的信息在 Master 端的 Binary Log 文件的名称以及在 Binary Log 中的位置;
3. Slave 的 IO 线程接收到信息后,将接收到的日志内容依次写入到 Slave 端的Relay Log文件(mysql-relay-bin.xxxxxx)的最末端,并将读取到的Master端的bin-log的文件名和位置记录到master- info文件中,以便在下一次读取的时候能够清楚的高速Master“我需要从某个bin-log的哪个位置开始往后的日志内容,请发给我”
4. Slave 的 SQL 线程检测到 Relay Log 中新增加了内容后,会马上解析该 Log 文件中的内容成为在 Master 端真实执行时候的那些可执行的 Query 语句,并在自身执行这些 Query。这样,实际上就是在 Master 端和 Slave 端执行了同样的 Query,所以两端的数据是完全一样的。
实际上,在老版本中,MySQL 的复制实现在 Slave 端并不是由 SQL 线程和 IO 线程这两个线程共同协作而完成的,而是由单独的一个线程来完成所有的工作。但是 MySQL 的工程师们很快发现,这样做存在很大的风险和性能问题,主要如下:
首先,如果通过一个单一的线程来独立实现这个工作的话,就使复制 Master 端的,Binary Log日志,以及解析这些日志,然后再在自身执行的这个过程成为一个串行的过程,性能自然会受到较大的限制,这种架构下的 Replication 的延迟自然就比较长了。
其次,Slave 端的这个复制线程从 Master 端获取 Binary Log 过来之后,需要接着解析这些内容,还原成 Master 端所执行的原始 Query,然后在自身执行。在这个过程中,Master端很可能又已经产生了大量的变化并生成了大量的 Binary Log 信息。如果在这个阶段 Master 端的存储系统出现了无法修复的故障,那么在这个阶段所产生的所有变更都将永远的丢失,无法再找回来。这种潜在风险在Slave 端压力比较大的时候尤其突出,因为如果 Slave 压力比较大,解析日志以及应用这些日志所花费的时间自然就会更长一些,可能丢失的数据也就会更多。
所以,在后期的改造中,新版本的 MySQL 为了尽量减小这个风险,并提高复制的性能,将 Slave 端的复制改为两个线程来完成,也就是前面所提到的 SQL 线程和 IO 线程。最早提出这个改进方案的是Yahoo!的一位工程师“Jeremy Zawodny”。通过这样的改造,这样既在很大程度上解决了性能问题,缩短了异步的延时时间,同时也减少了潜在的数据丢失量。
当然,即使是换成了现在这样两个线程来协作处理之后,同样也还是存在 Slave 数据延时以及数据丢失的可能性的,毕竟这个复制是异步的。只要数据的更改不是在一个事务中,这些问题都是存在的。
如果要完全避免这些问题,就只能用 MySQL 的 Cluster 来解决了。不过 MySQL的 Cluster 知道笔者写这部分内容的时候,仍然还是一个内存数 据库的解决方案,也就是需要将所有数据包括索引全部都 Load 到内存中,这样就对内存的要求就非常大的大,对于一般的大众化应用来说可实施性并不是太大。当然,在之前与 MySQL 的 CTO David 交流的时候得知,MySQL 现在正在不断改进其 Cluster 的实现,其中非常大的一个改动就是允许数据不用全部 Load 到内存中,而仅仅只是索引全部 Load 到内存中,我想信在完成该项改造之后的 MySQL Cluster 将会更加受人欢迎,可实施性也会更大。
分享到:
相关推荐
Hadoop集群可以分成两大类角色:Master和Salve。Master节点包括NameNode和JobTracker,负责管理文件系统的命名空间和客户端对文件系统的访问操作,调度和监控任务的执行;Salve节点包括DataNode和TaskTracker,负责...
【工控老马出品,必属精品,亲测...资源名:delphi下的modbus master salve控制件 资源类型:程序源代码 源码说明: 应用于delphi下的modbus master salve控制件,支持多种PLC 适合人群:新手及有一定经验的开发人员
Salve节点配置了DataNode和TaskTracker服务,负责存储数据和执行任务。 **1.3 网络配置** 为了确保集群内的服务器能够正常通信,需要正确配置网络设置。这里以Master节点为例,说明如何修改主机名: 1. **查看...
此资源为shardingsphere 调研...内容:一个master mysql docker实例,一个slave docker实例 内置3个库,mydb,mydb0,mydb1。仅开启了这三个库的主从。如果三个库主从不够用,自行配置。 使用:1.解压 2.执行build.sh
本文将详细介绍如何在Linux环境中配置Jenkins Master节点与Slave节点,实现分布式构建。 首先,我们理解Master-Slave架构的基本概念。Master节点作为主控服务器,负责调度任务、管理job配置,并通过Web界面提供用户...
3. **主从配置**:在主节点的 `activemq.xml` 中配置 master-slave 组件,包括 slave URL 和其他相关参数。同时,确保 slave 节点的配置文件指向主节点。 ### 启动与验证 1. **启动 MQ**:先启动 master,然后启动...
需要配置集群中各个节点之间的网络连接,确保节点之间可以相互通信。包括配置 hostname、IP 地址、子网掩码、默认网关等。 1.3 所需软件 在部署 Hadoop 集群之前,需要安装一些必要的软件,包括 Java 环境、SSH ...
假设您正在部署一个包含4个节点的Hadoop集群,其中1个Master节点和3个Salve节点。所有节点都安装了CentOS 6.0系统,并拥有相同的用户hadoop。节点IP地址分布如下: - Master节点:192.168.1.2 - Salve1节点:192....
在本文中,我们将详细讨论Modbus模拟器及其在模拟Master和Slave设备中的应用。 **1. Modbus协议基础** Modbus协议基于主从架构,其中一台设备作为Master,发出请求,而其他设备作为Slave响应这些请求。该协议定义了...
2. Redis集群的规划:在Redis官网中提到,Redis集群至少需要3个节点,但强烈建议安装6个节点,即3个master,3个salve。 3. Redis安装包的上传和解压:在安装Redis集群之前,需要上传Redis安装包到每个节点上,并...
1. `.gitignore`:定义了版本控制系统Git应该忽略哪些文件,通常包括编译生成的临时文件和配置文件等。 2. `LICENSE`:项目的许可协议,决定了其他人可以如何使用、修改和分发这个项目。 3. `README.md`:提供项目...
用户可以通过配置虚拟从站来模拟各种设备行为,从而调试或验证主站的通信逻辑。 3. **Modbus协议**: Modbus协议是基于串行通信的,最初设计用于简单PLC(可编程逻辑控制器)之间的通信。它支持ASCII、RTU(远程...
最近在学习STM32hal库,顺便玩一下TIM的主定时器触发从定时器功能,本代码是采用TIM4为主定时器,TIM3是从定时器,TIM3的启动是通过TIM4触发的,另外代码里面有HAL库的配置,适合新手,不喜勿喷!
创建完用户后,还需要确保该用户具有适当的权限来进行Hadoop的安装和配置。 ###### 2.2.2 SSH无密码验证配置 SSH无密码验证是Hadoop集群中的一项重要配置,因为它允许Master节点能够自动地启动或停止远程节点上的...
redis集群sentinel主从复制 已经配置好的案例,放在conf目录下。详情可以查看我的博客:http://blog.csdn.net/caiwenfeng_for_23/article/details/45695581
Salve-2.3.0-py2.7.egg这个文件确保了在运行Python 2.7的系统上可以无缝集成和使用Salve库。 使用这个库的过程通常包括以下步骤: 1. 下载:首先,从PyPI或者其他可靠源下载`salve-2.3.0-py2.7.egg`文件。 2. 安装...
- **集群角色**:Hadoop集群分为两类主要角色——Master和Slave。 - **Master**:通常包含NameNode和JobTracker服务。 - **NameNode**:负责管理文件系统的命名空间和客户端对文件系统的访问操作。 - **...