- 浏览: 1970511 次
- 性别:
- 来自: 北京
文章分类
最新评论
-
x593106671:
写的真不错
对研发团队里技术分享的一些思考 -
Ann-phei:
大神 您好~我是博文视点编辑安娜,可否加我微信或QQ 8030 ...
ElasticSearch的Java Api基本操作入门指南 -
feifeiwudi:
feifeiwudi 写道发现了一个 Elasticsearc ...
ElasticSearch的Java Api基本操作入门指南 -
feifeiwudi:
发现了一个 Elasticsearch 2.3.3 JAVA ...
ElasticSearch的Java Api基本操作入门指南 -
风火轮子:
基于大数据技术推荐系统算法案例实战教程网盘下载:https:/ ...
大数据/数据挖掘/推荐系统/机器学习相关资源
前言
在开始讲解淘宝的TDDL(Taobao Distribute Data Layer)技术之前,请允许笔者先吐槽一番。首先要开喷的是淘宝的社区支持做的无比的烂,TaoCode开源社区上面,几乎从来都是有人提问,无人响应。再者版本迭代速度也同样差强人意,就目前而言TDDL5.0的版本已经全线开源(Group、Atom、Matrix)大家可以在Github上下载源码。
目录
一、互联网当下的数据库拆分过程
二、TDDL的架构原型
三、下载TDDL的Atom层和Group层源代码
四、Diamond简介
五、Diamond的安装和使用
六、动态数据源层的Master/Salve读写分离配置与实现
七、Matrix层的分库分表配置与实现(此章节由于特殊原因暂时隐藏)
一、互联网当下的数据库拆分过程
对于一个刚上线的互联网项目来说,由于前期活跃用户数量并不多,并发量也相对较小,所以此时企业一般都会选择将所有数据存放在一个数据库中进行访问操作。但随着后续的市场推广力度不断加强,用户数量和并发量不断上升,这时如果仅靠一个数据库来支撑所有访问压力,几乎是在自寻死路。所以一旦到了这个阶段,大部分Mysql DBA就会将数据库设置成读写分离状态,也就是一个Master节点对应多个Salve节点。经过Master/Salve模式的设计后,完全可以应付单一数据库无法承受的负载压力,并将访问操作分摊至多个Salve节点上,实现真正意义上的读写分离。但大家有没有想过,单一的Master/Salve模式又能抗得了多久呢?如果用户数量和并发量出现量级上升,单一的Master/Salve模式照样抗不了多久,毕竟一个Master节点的负载还是相对比较高的。为了解决这个难题,Mysql DBA会在单一的Master/Salve模式的基础之上进行数据库的垂直分区(分库)。所谓垂直分区指的是可以根据业务自身的不同,将原本冗余在一个数据库内的业务表拆散,将数据分别存储在不同的数据库中,同时仍然保持Master/Salve模式。经过垂直分区后的Master/Salve模式完全可以承受住难以想象的高并发访问操作,但是否可以永远高枕无忧了?答案是否定的,一旦业务表中的数据量大了,从维护和性能角度来看,无论是任何的CRUD操作,对于数据库而言都是一件极其耗费资源的事情。即便设置了索引,仍然无法掩盖因为数据量过大从而导致的数据库性能下降的事实,因此这个时候Mysql DBA或许就该对数据库进行水平分区(分表,sharding),所谓水平分区指的是将一个业务表拆分成多个子表,比如user_table0、user_table1、user_table2。子表之间通过某种契约关联在一起,每一张子表均按段位进行数据存储,比如user_table0存储1-10000的数据,而user_table1存储10001-20000的数据,最后user_table3存储20001-30000的数据。经过水平分区设置后的业务表,必然能够将原本一张表维护的海量数据分配给N个子表进行存储和维护,这样的设计在国内一流的互联网企业比较常见,如图1-1所示:
图1-1 水平分区
上述笔者简单的讲解了数据库的分库分表原理。接下来请大家认真思考下。原本一个数据库能够完成的访问操作,现在如果按照分库分表模式设计后,将会显得非常麻烦,这种麻烦尤其体现在访问操作上。因为持久层需要判断出对应的数据源,以及数据源上的水平分区,这种访问方式我们称之为访问“路由”。按照常理来说,持久层不应该负责数据访问层(DAL)的工作,它应该只关心one to one的操作形式,所以淘宝的TDDL框架诞生也就顺其自然了。
二、TDDL的架构原型
淘宝根据自身业务需求研发了TDDL(Taobao Distributed Data Layer)框架,主要用于解决分库分表场景下的访问路由(持久层与数据访问层的配合)以及异构数据库之间的数据同步,它是一个基于集中式配置的JDBC DataSource实现,具有分库分表、Master/Salve、动态数据源配置等功能。
就目前而言,许多大厂也在出一些更加优秀和社区支持更广泛的DAL层产品,比如Hibernate Shards、Ibatis-Sharding等。如果你要问笔者还为什么还要对TDDL进行讲解,那么笔者只能很无奈的表示公司要这么干,因为很多时候技术选型并不是笔者说了算,而是客户说了算。当笔者费劲所有努力在google上寻找TDDL的相关使用说明和介绍时,心里一股莫名的火已经开始在蔓延,对于更新缓慢(差不多一年没更新过SVN),几乎没社区支持(提问从不响应)的产品来说,除了蜗居在企业内部,必定走不了多远,最后的结局注定是悲哀的。好了,既然抱怨了一番,无论如何还是要坚持讲解完。TDDL位于数据库和持久层之间,它直接与数据库建立交道,如图1-2所示:
图1-2 TDDL所处领域模型定位
传说淘宝很早以前就已经对数据进行过分库分表处理,应用层连接多个数据源,中间有一个叫做DBRoute的技术对数据库进行统一的路由访问。DBRoute对数据进行多库的操作、数据的整合,让应用层像操作一个数据源一样操作多个数据库。但是随着数据量的增长,对于库表的分法有了更高的要求,例如,你的商品数据到了百亿级别的时候,任何一个库都无法存放了,于是分成2个、4个、8个、16个、32个……直到1024个、2048个。好,分成这么多,数据能够存放了,那怎么查询它?这时候,数据查询的中间件就要能够承担这个重任了,它对上层来说,必须像查询一个数据库一样来查询数据,还要像查询一个数据库一样快(每条查询要求在几毫秒内完成),TDDL就承担了这样一个工作(其他DAL产品做得更好),如图1-3所示:
图1-3 TDDL分库分表查询策略
上述笔者描述了TDDL在分库分表环境下的查询策略,那么接下来笔者有必要从淘宝官方copy它们自己对TDDL优点的一些描述,真实性不敢保证,毕竟没完全开源,和社区零支持,大家看一看就算了,别认真。
淘宝人自定的TDDL优点:
1、数据库主备和动态切换;
2、带权重的读写分离;
3、单线程读重试;
4、集中式数据源信息管理和动态变更;
5、剥离的稳定jboss数据源;
6、支持mysql和oracle数据库;
7、基于jdbc规范,很容易扩展支持实现jdbc规范的数据源;
8、无server,client-jar形式存在,应用直连数据库;
9、读写次数,并发度流程控制,动态变更;
10、可分析的日志打印,日志流控,动态变更;
注意:
TDDL必须要依赖diamond配置中心(diamond是淘宝内部使用的一个管理持久配置的系统,目前淘宝内部绝大多数系统的配置)。
接下来,笔者将会带领各位一起分析TDDL的体系架构。TDDL其实主要可以划分为3层架构,分别是Matrix层、Group层和Atom层。Matrix层用于实现分库分表逻辑,底层持有多个Group实例。而Group层和Atom共同组成了动态数据源,Group层实现了数据库的Master/Salve模式的写分离逻辑,底层持有多个Atom实例。最后Atom层(TAtomDataSource)实现数据库ip,port,password,connectionProperties等信息的动态推送,以及持有原子的数据源分离的JBOSS数据源)。
图1-4 TDDL体系结构
章节的最后,我们还需要对TDDL的原理进行一次剖析。因为我们知道持久层只关心对数据源的CRUD操作,而多数据源的访问,并不应该由它来关心。也就是说TDDL透明给持久层的数据源接口应该是统一且“单一”的,至于数据库到底如何分库分表,持久层无需知道,也无需编写对应的SQL去实行应对策略。这个时候对TDDL一些疑问就出现了,TDDL需要对SQL进行二次解析和拼装吗?答案是不解析仅拼装。说白了TDDL只需要从持久层拿到发出的SQL
再按照一些分库分表条件,进行特定的SQL扩充以此满足访问路路由操作。
以下是淘宝团队对TDDL的官方原理解释:
1、TDDL除了拿到分库分表条件外,还需要拿到order by、group by、limit、join等信息,SUM、
MAX、MIN等聚合函数信息,DISTINCT信息。具有这些关键字的SQL将会在单库和多库情况下进行,语义是不同的。TDDL必须对使用这些关键字的SQL返回的结果做出合适的处理;
2、TDDL行复制需要重新拼写SQL,带上sync_version字段;
3、不通过sql解析,因为TDDL遵守JDBC规范,它不可能去扩充JDBC规范里面的接口,所以只能通过SQL中加额外的字符条件(也就是HINT方式)或者ThreadLocal方式进行传递,前者使SQL过长,后者难以维护,开发debug时不容易跟踪,而且需要判定是在一条SQL执行后失效还是1个连接关闭后才失效;
4、TDDL现在也同时支持Hint方式和ThreadLocal方式传递这些信息;
三、下载TDDL的Atom层和Group层源代码
前面我们谈及了TDDL的动态数据源主要由2部分构成,分别是Atom和Group。Group用于实现数据库的Master/Salve模式的写分离逻辑,而Atom层则是持有数据源。非常遗憾的TDDL中还有一层叫做Matrix,该层是整个TDDL最为核心的地方,淘宝也并没有对这一层实现开源,而Matrix层主要是建立在动态数据源之上的分库分表实现。换句话说,TDDL是基于模块化结构的,开发人员可以选用TDDL中的部分子集。
大家可以从淘宝的TaoCode上下载TDDL的源码带,然后进行构件的打包。TDDL的项目主要是基于Maven进行管理的,所以建议大家如果不了解Maven的使用,还是参考下笔者的博文《Use Maven3.x》。
大家下载好TDDL的源代码后,通过IDE工具导入进来后可以发现,开源的TDDL的工程结构有如下几部份组成:
tddl-all –
—tbdatasource
—tddl-atom-datasource
—tddl-common
—tddl-group-datasource
—tddl-interact
—tddl-sample
大家可以使用Maven的命令“mvn package“将TDDL的源代码打包成构件。如果你的电脑上并没有安装Maven的插件到不是没有办法实现构件打包,你可以使用eclipse的导出命令,将源代码导出成构件形式也可以。
四、Diamond简介
使用任何一种框架都需要配置一些配置源信息,毕竟每一种框架都有自己的规范,使用者务必遵守这些规范来实现自己的业务与基础框架的整合。自然TDDL也不例外,也是有配置信息需要显式的进行配置,在TDDL中,配置可以基于2种方式,一种是基于本地配置文件的形式,另外一种则是基于Diamond的形式进行配置,在实际开发过程中,由于考虑到配置信息的集中管理所带来的好处,大部分开发人员愿意选择将TDDL的配置信息托管给Diamond,所以本文还是以Diamond作为TDDL的配置源。
diamond是淘宝内部使用的一个管理持久配置的系统,它的特点是简单、可靠、易用,目前淘宝内部绝大多数系统的配置,由diamond来进行统一管理。diamond为应用系统提供了获取配置的服务,应用不仅可以在启动时从diamond获取相关的配置,而且可以在运行中对配置数据的变化进行感知并获取变化后的配置数据。
五、Diamond的安装和使用
Diamond和TDDL不同,它已经实现了完全意义上的开源。大家可以从淘宝的TaoCode
上下载Diamond的源代码,SVN下载地址为http://code.taobao.org/svn/diamond/trunk。当大家成功下载好Diamond的源代码后,我们接下来就需要开始Diamond的环境搭建工作。
首先我们需要安装好Mysql数据库,以root用户登录,建立用户并赋予权限,建立数据库,然后建表,语句分别如下:
create database diamond;
grant all on diamond.* to zh@’%’ identified by ‘abc’;
use diamond
create table config_info (
‘id’ bigint(64) unsigned NOT NULL auto_increment,
‘data_id’ varchar(255) NOT NULL default ’ ’,
‘group_id’ varchar(128) NOT NULL default ’ ’,
‘content’ longtext NOT NULL,
‘md5′ varchar(32) NOT NULL default ’’,
‘gmt_create’ datetime NOT NULL default ’2010-05-05 00:00:00′,
‘gmt_modified’ datetime NOT NULL default ’2010-05-05 00:00:00′,
PRIMARY KEY (‘id’),
UNIQUE KEY ‘uk_config_datagroup’ (‘data_id’,'group_id’));
完成后,请将数据库的配置信息(IP,用户名,密码)添加到diamond-server工程的src/resources/jdbc.properties文件中的db.url,db.user,db.password属性上面,这里建立的库名,用户名和密码,必须和jdbc.properties中对应的属性相同。
tomcat是Damond的运行容器,在diamond-server源代码根目录下,执行mvn clean package -Dmaven.test.skip,成功后会在diamond-server/target目录下生成diamond-server.war。打包完成后,将diamond-server.war放在tomcat的webapps目录下。最后启动tomcat,即启动了Diamond。
http server用来存放diamond server等地址列表,可以选用任何http server,这里以tomcat为例。一般来讲,http server和diamond server是部署在不同机器上的,这里简单起见,将二者部署在同一个机器下的同一个tomcat的同一个应用中,注意,如果部署在不同的tomcat中,端口号一定是8080,不能修改(所以必须部署在不同的机器上)。
在tomcat的webapps中的diamond-server中建立文件diamond,文件内容是diamond-server的地址列表,一行一个地址,地址为IP,例如127.0.0.1,完成这些步骤后,就等于已经完成Diamond的安装。
六、动态数据源层的Master/Salve读写分离配置与实现
其实使用TDDL并不复杂,只要你会使用JDBC,那么TDDL对于你来说无非就只需要将JDBC的操作连接替换为TDDL的操作连接,剩余操作一模一样。并且由于TDDL遵循了JDBC规范,所以你完全还可以使用Spring JDBC、Hibernate等第三方持久层框架进行ORM操作。
我们来看看如何TDDL中配置TDDL的读写分离,Atom+Group组成了TDDL的动态数据源,这2层主要负责数据库的读写分离。
TGroupDataSource的配置
1、 配置读写分离权重:
KEY:com.taobao.tddl.jdbc.group_V2.4.1_“groupKey”(Matrix中为“dbKey”)
VALUE:dbKey:r10w0,dbKey2:r0w10
TAtomDataSource的配置(由3部分组成,global、app、user)
1、 基本数据源信息(global):
KEY:com.taobao.tddl.atom.global.“dbKey”
VALUE:(
ip=数据库IP
port=数据库端口
dbName=数据库昵称
dbType=数据库类型
dbStatus=RW)
2、 数据库密码信息(user):
KEY:com.taobao.tddl.atom.passwd.“dbName”.“dbType”.“dbUserName”
VALUE:数据库密码
3、 数据库连接信息(app,如果不配置时间单位,缺省为分钟):
KEY:com.taobao.tddl.atom.app.“appName”.“dbKey”
VALUE:(
userName=数据库用户
minPoolSize=最小连接数
maxPoolSize=最大连接数
idleTimeout=连接的最大空闲时间
blockingTimeout=等待连接的最大时间
checkValidConnectionSQL=select 1
connectionProperties=rewriteBatchedStatements=true&characterEncoding=UTF8&connectTimeout=1000&autoReconnect=true&socketTimeout=12000)
应用层使用TDDL示例:
public class UseTDDL {
private static final String APPNAME = "tddl_test";
private static final String GROUP_KEY = "tddltest";
private static TGroupDataSource tGroupDataSource;
/* 初始化动态数据源 */
static {
tGroupDataSource = new TGroupDataSource();
tGroupDataSource.setAppName(APPNAME);
tGroupDataSource.setDbGroupKey(GROUP_KEY);
tGroupDataSource.init();
}
@Test
public void testQuery() {
final String LOAD_USER = "SELECT userName FROM tddl_table WHERE userName=?";
Connection conn = null;
PreparedStatement pstmt = null;
ResultSet rs = null;
try {
conn = tGroupDataSource.getConnection();
pstmt = conn.prepareStatement(LOAD_USER);
pstmt.setString(1, "tddl-test2");
rs = pstmt.executeQuery();
while (rs.next())
System.out.println("data: " + rs.getString(1));
} catch (Exception e) {
e.printStackTrace();
} finally {
try {
if (null != rs)
rs.close();
if (null != pstmt)
pstmt.close();
if (null != conn)
conn.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
}
七、Matrix层的分库分表配置与实现
在上一章节中,笔者演示了如何在Diamond中配置数据库的读写分离,那么本章笔者则会演示如果配置TDDL的分库分表。
TDDL的Matrix层是建立在动态数据源之上的,所以分库分表的配置和读写分离的基本配置也是一样的,只不过我们需要新添加dbgroups和shardrule项。dbgroups项包含了我们所需要配置的所有AppName选项,而shardrule则是具体的分库分表规则。这里有一点需要提醒各位,在开源版本的TDDL中,配置TGroupDataSource读写分离是使用dbKey,然而在Matrix中则是使用appName。
1、配置Group组:
KEY:com.taobao.tddl.v1_“appName”_dbgroups
VALUE:appName1,appName2
2、配置分库分表规则:
KEY:com.taobao.tddl.v1_”appName”_shardrule
VALUE:(
<?xml version="1.0" encoding="gb2312"?>
<!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.org/dtd/spring-beans.dtd">
<beans>
<bean id="root" class="com.taobao.tddl.common.config.beans.AppRule" init-method="init">
<property name="readwriteRule" ref="readwriteRule" />
</bean>
<bean id="readwriteRule" class="com.taobao.tddl.common.config.beans.ShardRule">
<property name="dbtype" value="MYSQL" />
<property name="tableRules">
<map>
<entry key="tddl_table" value-ref="tddl_table" />
</map>
</property>
</bean>
<bean id="tddl_table" init-method="init"
class="com.taobao.tddl.common.config.beans.TableRule">
<!-- 数据库组index号 -->
<property name="dbIndexes" value="tddl_test,tddl_test2" />
<!--分库规则-->
<property name="dbRuleArray" value="(#id#.longValue() % 4).intdiv(2)"/>
<!--分表规则,需要注意的是,因为taobao目前dba的要求是所有库内的表名必须完全不同,因此这里多加了一个映射的关系
简单来说,分表规则只会算表的key.
俩库4表: db1(tab1+tab2) db2(tab3+tab4)
db1 == key: 0 value tab1
key: 1 value tab2
db2 == key: 0 value tab3
key: 1 value tab4
-->
<property name="tbRuleArray" value="#id#.longValue() % 4 % 2"/>
<property name="tbSuffix" value="throughAllDB:[_0-_3]" />
</bean>
</beans>
)
TDDL的分库分表配置形式完全是采用Spring的配置形式,这一点大家应该是非常熟悉的。那么接下来我们一步一步的分析TDDL的分库分表规则。
在元素<map/>中我们可以定义我们所需要的分表,也就是说,当有多个表需要实现分表逻辑的时候,我们可以在集合中进行定义。当然我们还需要外部引用<bean/>标签中定义的具体的表逻辑的分库分表规则。
在分库分表规则中,我们需要定义数据库组index号,也就是说我们需要定义我们有多少的appNames,接下来我们就可以定义分库和分表规则了。TDDL的分库分表规则完全是采用取余方式,比如<property name="dbRuleArray" value="(#id#.longValue() % 4).intdiv(2)"/>,value属性中包含有具体的分库规则,其中“#id#”作为我们的分库分表条件,此值在数据库中对应的类型必须是整类,然后进行取余后再进行intdiv。或许有些朋友看不太明白这个是什么意思,我们用简单的一点的话来说就是,“#id#.longValue() % 4).intdiv(2)”的含义是我们需要分2个库和4个表,那么我们怎么知道我们的数据到底落盘到哪一个库呢?打个比方,如果我们的id等于10,首先10%4等于2,然后2/2等于1,TDDL分库规则下标从0开始,那么我们的数据就是落盘到第2个库。
当大家明白TDDL的分库规则后,我们接下来再来分析分表规则<property name="tbRuleArray" value="#id#.longValue() % 4 % 2"/>。和分库规则类似的是,我们都采用取余算法首先进行运算,只不过分表尾运算也是使用取余,而不是除算。打个比方,如果我们的id等于10,首先10%4等于2,然后2%2等于0,那么我们的数据就是落盘到第2个库的第1张表。
应用层使用TDDL示例:
public class UseTDDL {
private static final String APPNAME = "tddl_test";
private static final TDataSource dataSource;
/* 初始化动态数据源 */
static {
dataSource = new TDataSource();
dataSource.setAppName(APPNAME);
dataSource.setUseLocalConfig(false);
dataSource.setDynamicRule(false);
dataSource.init();
}
@Test
public void query() {
final String LOAD_USER = "SELECT userName FROM tddl_table WHERE id = ?";
Connection conn = null;
PreparedStatement pstmt = null;
ResultSet rs = null;
try {
conn = dataSource.getConnection();
pstmt = conn.prepareStatement(LOAD_USER);
pstmt.setLong(1, 3);
rs = pstmt.executeQuery();
while (rs.next())
System.out.println("data: " + rs.getString(1));
} catch (Exception e) {
e.printStackTrace();
} finally {
try {
if (null != rs)
rs.close();
if (null != pstmt)
pstmt.close();
if (null != conn)
conn.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
@Test
public void insert() {
final String LOAD_USER = "insert into tddl_table values(?, ?)";
Connection conn = null;
PreparedStatement pstmt = null;
try {
conn = dataSource.getConnection();
pstmt = conn.prepareStatement(LOAD_USER);
pstmt.setLong(1, 10);
pstmt.setString(2, "JohnGao");
pstmt.execute();
System.out.println("insert success...");
} catch (Exception e) {
e.printStackTrace();
} finally {
try {
if (null != pstmt)
pstmt.close();
if (null != conn)
conn.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
}
http://gao-xianglong.iteye.com/blog/2019729
发表评论
-
万字总结Java 9~15新特性
2021-09-11 21:36 548Java9 发布于 2017 年 9 月 21 日 。作为 ... -
架构制图:工具与方法论
2021-07-18 20:08 1070架构制图:工具与方法论 前言 “架构制图”这词乍 ... -
性能优化
2021-07-18 19:56 994性能问题和Bug不同,后 ... -
【冬察冬见】FFmpeg系列学习笔记
2021-03-16 18:32 746【冬察冬见】FFmpeg系列 ... -
有关创新的一些思考
2021-03-04 16:41 548引子 创造力是人类最变通的工具,创造机会 ... -
浅谈面试官的培养
2021-03-04 16:38 516技术面试是一个工程师成长到一定阶段后必然要承担的一项工作,优 ... -
冬察冬见·全视角再议晋升
2021-03-02 17:48 472冬察冬见·全视角再议晋升 【前言】 又是一年春来 ... -
冬察冬见·晋升-晋升的那些事儿1
2021-03-04 11:34 22842020.08.20 集团技术通道各个子通道通过直播向所有 ... -
物联网MQTT实战
2020-11-04 16:08 7350、MQTT服务器选型 比较流行的开源 MQTT ... -
大小公司都适用的架构选型工具箱(涵盖上百个组件)
2020-10-17 21:20 425本篇内容涵盖14个方面,涉及上百个框架和工具。会有你喜 ... -
elasticsearch使用踩坑
2020-06-17 21:20 485es 在数据量很大的情况下(数十亿级别)如何提高查询效率啊? ... -
【冬察冬见】读书日话高效读书
2020-04-23 10:47 391【冬察冬见】读书日话 ... -
【冬察冬见·荐书】4·23世界读书日 80本书单推荐承包你一年的书单
2020-04-22 18:52 426前言 笔者平均每年保持90-100本书的学习进度,09年 ... -
分布式系统ID的生成方法之UUID、数据库、算法、Redis、Leaf方案
2020-02-05 21:52 348前言 一般单机或者单数据库的项目可能规模比较小,适应 ... -
快速上手 AB Test
2020-01-14 10:05 448什么是 A/B Testing? 关于 A/B 有很多层 ... -
优雅的微服务架构下的鉴权
2020-01-10 17:57 1367从单体应用架构到分布式应用架构再到微服务架构,应用的安全访问 ... -
知识图谱的构建
2020-01-07 20:57 1023随着互联网业务的发展,产生了大量的数据,数据经过分析会推动业 ... -
宜信微服务架构落地及其演进
2020-01-06 09:46 605一、应用服务架构演进及微服务架构介绍 1.1 应用架构的 ... -
MySQL性能优化神技
2019-10-27 14:43 624MySQL 应用优化。包括数据类型,数据表查询/修改,索引和 ... -
REST协议解密(原创)
2019-10-14 10:32 733REST协议解密 REST 全称是什么?RE ...
相关推荐
标题中的“48_你们当时是如何把系统不停机迁移到分库分表的?”提示了本次讨论的主题,即如何在不中断服务的情况下,对数据库进行分库分表操作。这通常是一个复杂的过程,涉及到数据库架构的调整、数据迁移、双写...
2. **数据迁移与同步**:在分表分库后,数据迁移和表结构同步是关键。Python可以编写脚本,通过SQL语句实现数据的导入导出,使用`pandas`库进行数据预处理和分析,确保数据的一致性。 3. **分布式数据库工具**:...
内容包括数据库分片的基础知识、ShardingJDBC的配置与使用、真实场景下的分库分表策略、以及如何通过ShardingJDBC进行数据治理和性能优化。 适用人群: 数据库管理员和后端开发者 对数据库性能优化感兴趣的技术人员 ...
"对分库分表的一些想法"这个标题暗示了我们即将探讨的是数据库优化的一种策略——分片(Sharding)。这是一种将大型数据库横向分割为多个较小数据库的技术,以提高查询性能、减少单个数据库的压力并改善整体系统的可...
本项目"基于jdbcDriver的MySQL分库分表实现-OShard.zip"提供了使用Java JDBC驱动来实现MySQL数据库分库分表的示例。下面将详细阐述相关知识点。 1. **MySQL数据库**:MySQL是一款开源、免费的关系型数据库管理系统...
MySQL数据库在处理大数据量时,性能可能会受到严重影响,此时就需要采用分库分表策略来优化。Apache ShardingSphere,作为一款开源的分布式数据库中间件,提供了完善的分库分表解决方案,帮助开发者解决这一问题。本...
描述"mycat对mysql数据库进行分库分表demo-mycat-demo-parent"进一步确认了这是一个关于MyCat与MySQL数据库结合使用的演示项目,旨在展示如何利用MyCat实现数据库的分库分表操作。分库分表是解决大数据量时性能瓶颈...
总之,"springboot + mybatis+mysql+shareding-jdbc分库分表实"项目旨在展示如何利用SpringBoot、MyBatis和Sharding-JDBC在MySQL上实现数据库的分库分表,提高系统的并发处理能力和数据存储能力。通过理解和实践这个...
在Mycat中,配置分库分表的关键步骤包括: 1. **配置数据源**:定义多个数据库实例,这些实例可以是独立的数据库服务器或者集群。 2. **定义Schema**:创建逻辑上的数据库,可以映射到一个或多个实际的数据源。 3...
在这个场景中,我们关注的是如何通过MySQL的binlog(二进制日志)实现异步增量复制,以达到分库分表的目的,并利用Kafka作为中间数据传输层。这个项目"luna-mysql"提供了一个具体的解决方案。下面将详细阐述涉及的...
淘宝根据自己的业务特点开发了TDDL(Taobao Distributed Data Layer 外号:头都大了 ©_Ob)框架,主要解决了分库分表对应用的透明化以及异构数据库之间的数据复制,它是一个基于集中式配置的 jdbc datasource实现,...
企业经营数据分析——思路、方法、应用与工具》为从事企业经营数据分析工作的人员以及企业中的高层管理者提供数据分析的思路和方法。《企业经营数据分析——思路、方法、应用与工具》的内容来自笔者长期从业经验的...
**MyCat 分库分表中间件使用手册** MyCat 是一款开源的分布式数据库系统,它作为数据库中间件,主要用于解决大数据量场景下的数据库扩展问题。本手册基于 MyCat 1.6.0 版本,旨在帮助用户了解并熟练掌握其安装、...
《商务数据分析与应用——基于R(第2版)数据文件和程序代码》是针对商务分析领域的一本实用教材,旨在帮助读者掌握如何运用R语言进行高效的数据分析和应用。R语言作为一款强大的统计分析工具,已被广泛应用于商业...
【标题】"mybatis-mate 企业级模块详解:分库分表与数据安全实践" 在当前的大数据时代,企业对数据库的管理需求日益增强,尤其是对于数据安全和高性能访问的需求。Mybatis-Mate 是一个专门针对这些问题设计的企业级...
【标题】中的“基于matlab7.x的系统分析与设计——小波分析01(课件)”表明了这是一个关于使用MATLAB 7.x版本进行系统分析与设计的课程,重点在于小波分析这一数学工具。小波分析是信号处理和数据分析领域的一种...
《数字调制解调技术的MATLAB与FPGA实现——Xilinx VHDL版》是一部针对数字通信领域的专业著作,其核心内容围绕着如何利用MATLAB进行理论仿真以及如何通过FPGA实现硬件加速来探讨数字调制解调技术。在本资源中,作者...
《数字滤波器的MATLAB与FPGA实现——Altera Verilog版》是一本深入探讨数字滤波器设计与实现的专著,尤其关注在MATLAB环境中的理论建模和Altera FPGA上的Verilog硬件描述语言实现。这本书针对的是那些希望将理论知识...