`

Cobar使用文档(可用作MySQL大型集群解决方案)

 
阅读更多

最近好不容易抽空研究了下Cobar,感觉这个产品确实很不错(在文档方面比Amoeba强多了),特此推荐给大家。Cobar是阿里巴巴研发的关系型数据的分布式处理系统,该产品成功替代了原先基于Oracle的数据存储方案,目前已经接管了3000+个MySQL数据库的schema,平均每天处理近50亿次的SQL执行请求。

首先,使用Cobar的核心功能如下:

分布式:

Cobar的分布式主要是通过将表放入不同的库来实现:
1. Cobar支持将一张表水平拆分成多份分别放入不同的库来实现表的水平拆分
2. Cobar也支持将不同的表放入不同的库
3. 多数情况下,用户会将以上两种方式混合使用
这里需要强调的是,Cobar不支持将一张表,例如test表拆分成test_1, test_2, test_3.....放在同一个库中,必须将拆分后的表分别放入不同的库来实现分布式。

HA:
在用户配置了MySQL心跳的情况下,Cobar可以自动向后端连接的MySQL发送心跳,判断MySQL运行状况,一旦运行出现异常,Cobar可以自动切换到备机工作。但需要强调的是:
1. Cobar的主备切换有两种触发方式,一种是用户手动触发,一种是Cobar的心跳语句检测到异常后自动触发。那么,当心跳检测到主机异常,切换到备机,如果主机恢复了,需要用户手动切回主机工作,Cobar不会在主机恢复时自动切换回主机,除非备机的心跳也返回异常。
2. Cobar只检查MySQL主备异常,不关心主备之间的数据同步,因此用户需要在使用Cobar之前在MySQL主备上配置双向同步,详情可以参阅MySQL参考手册。

其次,我们也需要注意Cobar的功能约束:

1) 不支持跨库情况下的join、分页、排序、子查询操作。
2) SET语句执行会被忽略,事务和字符集设置除外。
3) 分库情况下,insert语句必须包含拆分字段列名。
4) 分库情况下,update语句不能更新拆分字段的值。
5) 不支持SAVEPOINT操作。
6) 暂时只支持MySQL数据节点。
7) 使用JDBC时,不支持rewriteBatchedStatements=true参数设置(默认为false)。
8) 使用JDBC时,不支持useServerPrepStmts=true参数设置(默认为false)。
9) 使用JDBC时,BLOB, BINARY, VARBINARY字段不能使用setBlob()或setBinaryStream()方法设置参数。

然后,我们来分析一下Cobar逻辑层次图:

* dataSource:数据源,表示一个具体的数据库连接,与物理存在的数据库schema一一对应。
* dataNode:数据节点,由主、备数据源,数据源的HA以及连接池共同组成,可以将一个dataNode理解为一个分库。
* table:表,包括拆分表(如tb1,tb2)和非拆分表。
* tableRule:路由规则,用于判断SQL语句被路由到具体哪些datanode执行。
* schema:cobar可以定义包含拆分表的schema(如schema1),也可以定义无拆分表的schema(如schema2)。

Cobar支持的数据库结构(schema)的层次关系具有较强的灵活性,用户可以将表自由放置不同的datanode,也可将不同的datasource放置在同一MySQL实例上。在实际应用中,我们需要通过配置文件(schema.xml)来定义我们需要的数据库服务器和表的分布策略,这点我们将在后面的安装和配置部分中介绍到。

接着,我们来介绍Cobar的安装和配置步骤:

下面我们将使用一个最简单的分库分表的例子来说明Cobar的基本用法,数据库schema如下图(该实例也可参考:Cobar产品首页)。

1) 系统对外提供的数据库名是dbtest,并且其中有两张表tb1和tb2。
2) tb1表的数据被映射到物理数据库dbtest1的tb1上。
3) tb2表的一部分数据被映射到物理数据库dbtest2的tb2上,另外一部分数据被映射到物理数据库dbtest3的tb2上。

1、环境准备

操作系统:Linux或者Windows (推荐在Linux环境下运行Cobar)
MySQL:http://www.mysql.com/downloads/ (推荐使用5.1以上版本)
JDK:http://www.oracle.com/technetwork/java/javase/downloads/ (推荐使用1.6以上版本)
Cobar:http://code.alibabatech.com/wiki/display/cobar/release/ (下载tar.gz或者zip文件)

2、数据准备

假设本文MySQL所在服务器IP为192.168.0.1,端口为3306,用户名为test,密码为空,我们需要创建schema:dbtest1、dbtest2、dbtest3,table:tb1、tb2,SQL如下:

[sql] view plaincopy
 
  1. #创建dbtest1  
  2. drop database if exists dbtest1;  
  3. create database dbtest1;  
  4. use dbtest1;  
  5. #在dbtest1上创建tb1  
  6. create table tb1(  
  7. id    int not null,  
  8. gmt   datetime);  
  9.    
  10. #创建dbtest2  
  11. drop database if exists dbtest2;  
  12. create database dbtest2;  
  13. use dbtest2;  
  14. #在dbtest2上创建tb2  
  15. create table tb2(  
  16. id    int not null,  
  17. val   varchar(256));  
  18.    
  19. #创建dbtest3  
  20. drop database if exists dbtest3;  
  21. create database dbtest3;  
  22. use dbtest3;  
  23. #在dbtest3上创建tb2  
  24. create table tb2(  
  25. id    int not null,  
  26. val   varchar(256));  


3、配置Cobar

Cobar解压之后有四个目录:
bin/:可执行文件目录,包含启动(start)、关闭(shutdown)和重启(restart)脚本
lib/:逻辑类库目录,包含了Cobar所需的jar包
conf/:配置文件目录,下面会详细介绍
logs/:运行日志目录,最主要的log有两个:程序日志(stdout.log)和控制台输出(console.log)

配置文件的用法如下:
log4j.xml:日志配置,一般来说保持默认即可
schema.xml:定义了schema逻辑层次图中的所有元素,并利用这些元素以及rule.xml中定义的规则组建分布式数据库系统
rule.xml:定义了分库分表的规则
server.xml:系统配置文件

我们在schema.xml中配置数据库结构(schema)、数据节点(dataNode)、以及数据源(dataSource)。

[html] view plaincopy
 
  1. <?xml version="1.0" encoding="UTF-8"?>  
  2. <!DOCTYPE cobar:schema SYSTEM "schema.dtd">  
  3. <cobar:schema xmlns:cobar="http://cobar.alibaba.com/">  
  4.    
  5.   <!-- schema定义 -->  
  6.   <schema name="dbtest" dataNode="dnTest1">  
  7.     <table name="tb2" dataNode="dnTest2,dnTest3" rule="rule1" />  
  8.   </schema>  
  9.    
  10.   <!-- 数据节点定义,数据节点由数据源和其他一些参数组织而成。-->  
  11.   <dataNode name="dnTest1">  
  12.     <property name="dataSource">  
  13.       <dataSourceRef>dsTest[0]</dataSourceRef>  
  14.     </property>  
  15.   </dataNode>  
  16.   <dataNode name="dnTest2">  
  17.     <property name="dataSource">  
  18.       <dataSourceRef>dsTest[1]</dataSourceRef>  
  19.     </property>  
  20.   </dataNode>  
  21.   <dataNode name="dnTest3">  
  22.     <property name="dataSource">  
  23.       <dataSourceRef>dsTest[2]</dataSourceRef>  
  24.     </property>  
  25.   </dataNode>  
  26.    
  27.   <!-- 数据源定义,数据源是一个具体的后端数据连接的表示。-->  
  28.   <dataSource name="dsTest" type="mysql">  
  29.     <property name="location">  
  30.       <location>192.168.0.1:3306/dbtest1</location> <!--注意:替换为您的MySQL IP和Port-->  
  31.       <location>192.168.0.1:3306/dbtest2</location> <!--注意:替换为您的MySQL IP和Port-->  
  32.       <location>192.168.0.1:3306/dbtest3</location> <!--注意:替换为您的MySQL IP和Port-->  
  33.     </property>  
  34.     <property name="user">test</property> <!--注意:替换为您的MySQL用户名-->  
  35.     <property name="password">test</property> <!--注意:替换为您的MySQL密码-->  
  36.     <property name="sqlMode">STRICT_TRANS_TABLES</property>  
  37.   </dataSource>  
  38. </cobar:schema>  

我们注意到,上述配置实际上已经把图2中的数据库结构配置好了。dbtest主要映射的是dnTest1库(即192.168.0.1:3306/dbtest1库),而其中的tb2表则是按照规则rule1,被分配到dnTest2库(即192.168.0.1:3306/dbtest2库)和dnTest3库(即192.168.0.1:3306/dbtest3库)中。此外,规则rule1的定义可以在rule.xml中找到,代码如下:

[html] view plaincopy
 
  1. <?xml version="1.0" encoding="UTF-8"?>  
  2. <!DOCTYPE cobar:rule SYSTEM "rule.dtd">  
  3. <cobar:rule xmlns:cobar="http://cobar.alibaba.com/">  
  4.   
  5.   <!-- 路由规则定义,定义什么表,什么字段,采用什么路由算法。-->  
  6.   <tableRule name="rule1">  
  7.     <rule>  
  8.       <columns>id</columns>  
  9.       <algorithm><![CDATA[ func1(${id})]]></algorithm>  
  10.     </rule>  
  11.   </tableRule>  
  12.   
  13.   <!-- 路由函数定义,应用在路由规则的算法定义中,路由函数可以自定义扩展。-->  
  14.   <function name="func1" class="com.alibaba.cobar.route.function.PartitionByLong">  
  15.     <property name="partitionCount">2</property>  
  16.     <property name="partitionLength">512</property>  
  17.   </function>  
  18. </cobar:rule>  

结合schema.xml中的内容,我们可以看出分表的规则是,按照id字段把tb2表中的数据分配到dnTest2和dnTest3两个分区中,其中id小于512的数据会被放到dnTest2库的分区中,而其余的会被放到dnTest3库的分区中,更多路由算法可以参考《路由文档》。最后,我们来看一下server.xml的配置,代码如下。

[html] view plaincopy
 
  1. <?xml version="1.0" encoding="UTF-8"?>  
  2. <!DOCTYPE cobar:server SYSTEM "server.dtd">  
  3. <cobar:server xmlns:cobar="http://cobar.alibaba.com/">  
  4.    
  5.   <!--定义Cobar用户名,密码-->  
  6.   <user name="root">  
  7.     <property name="password">passwd</property>  
  8.     <property name="schemas">dbtest</property>  
  9.   </user>  
  10. </cobar:server>  

这里的server.xml配置比较简单,只配置了本地Cobar服务的数据库结构、用户名和密码。在启动Cobar服务之后,使用用户名root和密码passwd就可以登录Cobar服务。

4、运行Cobar

启动Cobar服务很简单,运用bin目录下的start.sh即可(停止使用shutdown.sh)。启动成功之后,可以在logs目录下的stdout.log中看到如下日志:

[html] view plaincopy
 
  1. 10:54:19,264 INFO  ===============================================  
  2. 10:54:19,265 INFO  Cobar is ready to startup ...  
  3. 10:54:19,265 INFO  Startup processors ...  
  4. 10:54:19,443 INFO  Startup connector ...  
  5. 10:54:19,446 INFO  Initialize dataNodes ...  
  6. 10:54:19,470 INFO  dnTest1:0 init success  
  7. 10:54:19,472 INFO  dnTest3:0 init success  
  8. 10:54:19,473 INFO  dnTest2:0 init success  
  9. 10:54:19,481 INFO  CobarManager is started and listening on 9066  
  10. 10:54:19,483 INFO  CobarServer is started and listening on 8066  
  11. 10:54:19,484 INFO  ===============================================  


接着,我们就可以使用“mysql -h127.0.0.1 -uroot -ppasswd -P8066 -Ddbtest”命令来登录Cobar服务了,再接下来的操作就和在其他MySQL Client中一样了。比如,我们可以使用“show databases”命令查看数据库,使用“show tables”命令查看数据表,如下图:

接着,我们按照下图中的SQL指定向数据表插入测试记录。

可以看到,这里的tb2中包含了id为1、2、513的3条记录。而实际上,这3条记录存储在不同的物理数据库上的,大家可以到物理库上验证一下。

至于Cobar的连接和使用方法和MySQL一样,Java程序中可以使用JDBC(建议5.1以上的版本),PHP中可以使用PDO。当然,Cobar还提供HA、集群等高级的功能,更多信息请参考其《产品文档。此外,产品文档中还为我们提供了详细的PPT文档《Cobar原理及应用.ppt》来介绍Cobar在实际生产环境中的使用方法,真可谓之用心良苦啊!

此外,特别解释一下大家可能比较关心的心跳检测问题,Cobar的心跳检测主要用在以下两个地方。

1、在配置数据节点的时候,我们需要使用心跳检测来探测数据节点的运行状况。Cobar中使用执行SQL的方式来进行探测,简单且实用。例如,我们可以把前面实例中的schema.xml中的dataNode配置成下面的样子。

[html] view plaincopy
 
  1. ... ...  
  2.   <!-- 数据节点定义,数据节点由数据源和其他一些参数组织而成。-->  
  3.   <dataNode name="dnTest1">  
  4.     <property name="dataSource">  
  5.       <dataSourceRef>dsTest[0]</dataSourceRef>  
  6.     </property>  
  7.     <!--Cobar与后端数据源连接池大小设置-->  
  8.     <property name="poolSize">256</property>  
  9.     <!--Cobar通过心跳来实现后端数据源HA,一旦主数据源心跳失败,便切换到备数据源上工作-->  
  10.     <!--Cobar心跳是通过向后端数据源执行一条SQL语句,根据该语句的返回结果判断数据源的运行情况-->  
  11.     <property name="heartbeat">select user()<property>  
  12.   </dataNode>  
  13. ... ...  

2、当我们需要对Cobar作集群(cluster),进行负载均衡的时候,我们也需要用到心跳机制。不过此处的配置则是在server.xml中,代码如下:

[html] view plaincopy
 
  1. ... ...  
  2.   <!--组建一个Cobar集群,只需在cluster配置中把所有Cobar节点(注意:包括当前Cobar自身)都配置上便可-->  
  3.   <cluster>  
  4.     <!--node名称,一个node表示一个Cobar节点,一旦配置了node,当前Cobar便会向此节点定期发起心跳,探测节点的运行情况-->  
  5.     <node name="cobar1">  
  6.       <!--Cobar节点IP, 表示当前Cobar将会向192.168.0.1上部署的Cobar发送心跳-->  
  7.       <property name="host">192.168.0.1</property>  
  8.       <!--节点的权重,用于客户端的负载均衡,用户可以通过命令查询某个节点的运行情况以及权重-->  
  9.       <property name="weight">1</property>  
  10.     </node>  
  11.     <!--当前Cobar将会向192.168.0.2上部署的Cobar发送心跳-->  
  12.     <node name="cobar2">  
  13.       <property name="host">192.168.0.2</property>  
  14.       <property name="weight">2</property>  
  15.     </node>  
  16.     <!--当前Cobar将会向192.168.0.3上部署的Cobar发送心跳-->  
  17.     <node name="cobar3">  
  18.       <property name="host">192.168.0.3</property>  
  19.       <property name="weight">3</property>  
  20.     </node>  
  21.     <!--用户还可以将Cobar节点分组,以便实现schema级别的细粒度负载均衡-->  
  22.     <group name="group12">  
  23.       <property name="nodeList">cobar1,cobar2</property>  
  24.     </group>  
  25.      <group name="group23">  
  26.       <property name="nodeList">cobar2,cobar3</property>  
  27.     </group>  
  28.   </cluster>  
  29. ... ...  


最后,简单看一下Cobar的实现原理。

首先是系统模块架构。

从上图中可以看到,Cobar的前、后端模块都实现了MySQL协议;当接受到SQL请求时,会依次进行解释(SQL Parser)和路由(SQL Router)工作,然后使用SQL Executor去后端模块获取数据集(后端模块还负责心跳检测功能);如果数据集来自多个数据源,Cobar则需要把数据集进行组合(Result Merge),最后返回响应。整个过程应该比较容易理解,

下面是Cobar的网络通讯模块架构。

从上图中可以看出,Cobar采用了主流的Reactor设计模式来处理请求,并使用NIO进行底层的数据交换,这大大提升系统的负载能力。其中,NIOAcceptor用于处理前端请求,NIOConnector则用于管理后端的连接,NIOProcessor用于管理多线程事件处理,NIOReactor则用于完成底层的事件驱动机制,就是看起来和Mina和Netty的网络模型比较相似。如果有兴趣,大家还可以到Cobar站点的下载页面(http://code.alibabatech.com/wiki/display/cobar/release)获取该项目的源码,真是太周到了,让我们为富有开源精神的阿里人掌声鼓励一下!

分享到:
评论

相关推荐

    cobar 文档汇总

    它主要用于解决大规模数据处理和高并发访问的问题,通过提供MySQL协议的前端服务器,实现数据库的分片、读写分离、负载均衡等功能,从而提高数据库系统的整体性能和可扩展性。Cobar的主要目标是为大数据量、高并发的...

    Cobar说明文档

    ### Cobar说明文档知识点梳理 ...综上所述,Cobar是一个高度灵活且功能强大的分布式数据库中间件,能够有效地解决大数据量带来的挑战,并且提供了丰富的配置选项和管理工具来帮助用户更好地管理和使用系统。

    alibaba cobar 帮助文档

    Cobar的主要目标是为大型互联网应用提供高可用性、高并发性和低延迟的数据存储解决方案。 **Cobar的核心特性:** 1. **分布式事务支持**:Cobar实现了基于两阶段提交的分布式事务处理,确保在分布式环境下的数据...

    cobar下载mysql分布式管理

    Cobar是分片数据库和表的代理,兼容MySQL protocal和MySQL SQL grama,底层存储只支持MySQL,支持前台业务更简单,稳定,高效和安全。 分片 您可以随着业务的增长添加新的MySQL的的实例。 可用性高 科巴服务器底层...

    阿里cobar中间件文档集合

    产品文档(未完成) - Cobar - Alibaba Open Sesame_action 路由算法 - Cobar - Alibaba Open Sesame_action rule - Cobar - Alibaba Open Sesame 数据源心跳配置 - Cobar - Alibaba Open Sesame_action 阿里巴巴...

    cobar架构与实践

    文档中还提到了Cobar在实施前后的对比,例如从Oracle单点数据库到MySQL集群的替换,以及Cobar引入后的性能问题解决、连接数过多的问题解决、可用性问题(例如Standby切换故障)的解决,以及成本和伸缩性问题的改善。...

    MySQL分布式集群之MyCAT权威指南

    Cobar是由 Alibaba 开源的 MySQL 分布式处理中间件,它可以在分布式的环境下看上去像传统数据库一样提供海量数据服务。 Cobar自诞生之日起, 就受到广大程序员的追捧,但是自2013年后,几乎没有后续更新。在此情况下...

    阿里巴巴分布式数据Cobar解决方案

    阿里巴巴针对MySQL的数据库解决方案,其中谈到了负载均衡、数据库中间件设计原理、高并发的解决方案,值得参考和借鉴。

    cobar的使用说明

    ### Cobar 使用说明详解 #### 一、产品约束 Cobar作为一款由阿里巴巴开源的数据库中间件,在设计之初便有着明确的功能边界与限制条件。在使用Cobar时,需注意以下约束: - **不支持跨库情况下的join、分页、排序...

    阿里巴巴Cobar

    总的来说,阿里巴巴Cobar是应对大规模分布式数据库场景的利器,它通过智能的数据管理和路由策略,为企业提供了高效、稳定、可扩展的数据库解决方案。通过深入学习和理解Cobar的相关知识,开发者能够更好地解决大数据...

    cobar-server1.2.7

    《Cobar Server 1.2.7:MySQL 分库分表解决方案详解》 在现代互联网应用中,数据量的增长往往超出单个数据库的处理能力,这时就需要采用分库分表的技术来解决。Cobar Server 1.2.7 正是这样一款用于数据库分布式...

    关于cobar数据库中间件的测试配置文档

    cobar开源有段时间了,不过我刚从同事处得知,出于对新技术的好奇,所以我自己在虚拟机上搭建了多个不同linux系统,并测试成功了,因为在测试时出现了不少问题,网上也没有相关问题解决文档,官方发布的文档细节方面...

    cobar服务器端安装文件 for linux

    它在Linux环境下运行,提供了一种高效、可扩展的解决方案,适用于处理高并发、大数据量的场景。Cobar的主要功能是将来自应用的SQL请求分发到多个后端数据库,实现读写分离和负载均衡,从而提升系统的整体处理能力。 ...

    mysql中间件研究(Atlas、cobar、TDDL、Mycat).docx

    MySQL 中间件研究(Atlas、Cobar、TDDL、Mycat) MySQL 中间件是指位于应用程序和 MySQL 数据库之间,负责对 MySQL 数据库的访问和管理的软件系统。该系统可以实现负载平衡、读写分离、failover 等功能,以提高 ...

    mysql中间件研究(Atlas_cobar_TDDL)

    mysql 中间件研究(Atlas、Cobar、TDDL) mysql 中间件研究是当前数据库系统中一个非常重要的课题,mysql-proxy 是官方提供的 mysql 中间件产品,可以实现负载平衡、读写分离、failover 等,但是它不支持大数据量的...

    mysql中间件研究(Atlas、cobar、TDDL、Mycat).doc

    【MySQL中间件详解:Atlas、cobar、TDDL与Mycat】 MySQL中间件是用于在应用程序和数据库之间提供服务的软件,它们通常用于解决数据库的扩展性、高可用性和读写分离等问题。本文将详细介绍四款知名的MySQL中间件:...

    cobar分表分库

    阿里巴巴cobar分表分库方案,cobar使用详细讲解,教用户手把手快速上手。

    Cobar - Alibaba Open Sesame

    **2.1 Cobar 解决的问题** - **分布式处理**:Cobar 是一个面向关系型数据的分布式处理系统,它能够通过将表放置在不同的数据库中来实现数据的分布存储。支持表的水平拆分和垂直拆分,以及两者的混合使用。 - **...

    cobar-server-1.2.7.tar

    Cobar 是一个高性能、分布式的关系型数据库中间件,它的全称是“Clustered MySQL Bar”。在阿里巴巴集团内部,Cobar 曾经被广泛应用于解决大规模数据处理和高并发访问的问题。Cobar 的主要目标是通过分库分表、读写...

Global site tag (gtag.js) - Google Analytics