转自:http://blog.csdn.net/bluishglc/article/details/6161475
一、基本思想
Sharding的基本思想就要把一个数据库切分成多个部分放到不同的数据库(server)上,从而缓解单一数据库的性能问题。不太严格的讲,对于海量数据的数据库,如果是因为表多而数据多,这时候适合使用垂直切分,即把关系紧密(比如同一模块)的表切分出来放在一个server上。如果表并不多,但每张表的数据非常多,这时候适合水平切分,即把表的数据按某种规则(比如按ID散列)切分到多个数据库(server)上。当然,现实中更多是这两种情况混杂在一起,这时候需要根据实际情况做出选择,也可能会综合使用垂直与水平切分,从而将原有数据库切分成类似矩阵一样可以无限扩充的数据库(server)阵列。下面分别详细地介绍一下垂直切分和水平切分.
垂直切分的最大特点就是规则简单,实施也更为方便,尤其适合各业务之间的耦合度非
常低,相互影响很小,业务逻辑非常清晰的系统。在这种系统中,可以很容易做到将不同业
务模块所使用的表分拆到不同的数据库中。根据不同的表来进行拆分,对应用程序的影响也
更小,拆分规则也会比较简单清晰。(这也就是所谓的”share nothing”)。
水平切分于垂直切分相比,相对来说稍微复杂一些。因为要将同一个表中的不同数据拆
分到不同的数据库中,对于应用程序来说,拆分规则本身就较根据表名来拆分更为复杂,后
期的数据维护也会更为复杂一些。
让我们从普遍的情况来考虑数据的切分:一方面,一个库的所有表通常不可能由某一张表全部串联起来,这句话暗含的意思是,水平切分几乎都是针对一小搓一小搓(实际上就是垂直切分出来的块)关系紧密的表进行的,而不可能是针对所有表进行的。另一方面,一些负载非常高的系统,即使仅仅只是单个表都无法通过单台数据库主机来承担其负载,这意味着单单是垂直切分也不能完全解决问明。因此多数系统会将垂直切分和水平切分联合使用,先对系统做垂直切分,再针对每一小搓表的情况选择性地做水平切分。从而将整个数据库切分成一个分布式矩阵。
二、切分策略
如前面所提到的,切分是按先垂直切分再水平切分的步骤进行的。垂直切分的结果正好为水平切分做好了铺垫。垂直切分的思路就是分析表间的聚合关系,把关系紧密的表放在一起。多数情况下可能是同一个模块,或者是同一“聚集”。这里的“聚集”正是领域驱动设计里所说的聚集。在垂直切分出的表聚集内,找出“根元素”(这里的“根元素”就是领域驱动设计里的“聚合根”),按“根元素”进行水平切分,也就是从“根元素”开始,把所有和它直接与间接关联的数据放入一个shard里。这样出现跨shard关联的可能性就非常的小。应用程序就不必打断既有的表间关联。比如:对于社交网站,几乎所有数据最终都会关联到某个用户上,基于用户进行切分就是最好的选择。再比如论坛系统,用户和论坛两个模块应该在垂直切分时被分在了两个shard里,对于论坛模块来说,Forum显然是聚合根,因此按Forum进行水平切分,把Forum里所有的帖子和回帖都随Forum放在一个shard里是很自然的。
对于共享数据数据,如果是只读的字典表,每个shard里维护一份应该是一个不错的选择,这样不必打断关联关系。如果是一般数据间的跨节点的关联,就必须打断。
需要特别说明的是:当同时进行垂直和水平切分时,切分策略会发生一些微妙的变化。比如:在只考虑垂直切分的时候,被划分到一起的表之间可以保持任意的关联关系,因此你可以按“功能模块”划分表格,但是一旦引入水平切分之后,表间关联关系就会受到很大的制约,通常只能允许一个主表(以该表ID进行散列的表)和其多个次表之间保留关联关系,也就是说:当同时进行垂直和水平切分时,在垂直方向上的切分将不再以“功能模块”进行划分,而是需要更加细粒度的垂直切分,而这个粒度与领域驱动设计中的“聚合”概念不谋而合,甚至可以说是完全一致,每个shard的主表正是一个聚合中的聚合根!这样切分下来你会发现数据库分被切分地过于分散了(shard的数量会比较多,但是shard里的表却不多),为了避免管理过多的数据源,充分利用每一个数据库服务器的资源,可以考虑将业务上相近,并且具有相近数据增长速率(主表数据量在同一数量级上)的两个或多个shard放到同一个数据源里,每个shard依然是独立的,它们有各自的主表,并使用各自主表ID进行散列,不同的只是它们的散列取模(即节点数量)必需是一致的。(本文着重介绍sharding的基本思想和理论上的切分策略,关于更加细致的实施策略和参考事例请参考我的另一篇博文:数据库分库分表(sharding)系列(一) 拆分实施策略和示例演示 )
1.事务问题:
解决事务问题目前有两种可行的方案:分布式事务和通过应用程序与数据库共同控制实现事务下面对两套方案进行一个简单的对比。
方案一:使用分布式事务
优点:交由数据库管理,简单有效
缺点:性能代价高,特别是shard越来越多时
方案二:由应用程序和数据库共同控制
原理:将一个跨多个数据库的分布式事务分拆成多个仅处
于单个数据库上面的小事务,并通过应用程序来总控
各个小事务。
优点:性能上有优势
缺点:需要应用程序在事务控制上做灵活设计。如果使用
了spring的事务管理,改动起来会面临一定的困难。
2.跨节点Join的问题
只要是时行切分,跨节点Join的问明是不可避免的。但是良好的设计和切分却可以减少此类情况的发生。解决这一问题的普遍做法是分两次查询实现。在第一次查询的结果集中找出关联数据的id,根据这些id发起第二次请求得到关联数据。
3.跨节点的count,order by,group by以及聚合函数问题
这些是一类问题,因为它们都需要基于全部数据集合进行计算。多数的代理都不会自动处理合并工作。解决方案:与解决跨节点join问题的类似,分别在各个节点上得到结果后在应用程序端进行合并。和join不同的是每个结点的查询可以并行执行,因此很多时候它的速度要比单一大表快很多。但如果结果集很大,对应用程序内存的消耗是一个问题。
参考资料:
《MySQL性能调优与架构设计》
注:本文图片摘自《MySQL性能调优与架构设计》一 书
相关推荐
辣椒油树脂检验表格(食品添加剂食用香精质量验收记录表).docx
字体路径文件
Screenshot_2025-03-14-16-46-14-26.jpg
交警队伍管理制度.docx
乳酸链球菌素检验表格(食品添加剂食用香精质量验收记录表).docx
编译的axel windows工具,有需要的拿去 使用命令例子如下 cmd 界面下cd 到axel.exe 文件路径 比如下载image net 1k axel -n 8 -o ./ https://image-net.org/data/ILSVRC/2012/ILSVRC2012_img_train.tar --insecure 编译过程的记录为 https://blog.csdn.net/Magicapprentice/article/details/146250906?sharetype=blogdetail&sharerId=146250906&sharerefer=PC&sharesource=Magicapprentice&spm=1011.2480.3001.8118 可以参照这个链接从零开始自己编译
羧甲基淀粉钠检验表格(食品添加剂食用香精质量验收记录表).docx
光学多层膜系统模拟仿真matlab代码 这段代码是一个光学多层膜系统的模拟程序,计算了TE模和TM模的反射率,并绘制了反射率随波长和入射角变化的等高线图。 这里是代码的主要流程: 1. 加载材料参数数据(Al2O3、Si3N4、SiO2、Ag)和波长数据(lambda)。 2. 循环遍历不同的入射角度(theta0)。 3. 对于每个入射角度,计算TE模和TM模的传输矩阵,包括各个层的传输矩阵。 4. 计算反射率,并将TE模和TM模的反射率取平均作为总的反射率。 5. 将总的反射率随波长和入射角度的变化绘制成等高线图。 这段代码非常详细,而且注释也很清晰,让人容易理解。 不过最后一行的中文注释应该是解释如何使用`colormap`函数来设置绘图的颜色映射,可以将其翻译为“设置颜色映射为Jet色彩”。 ,多层膜系统模拟; TE模和TM模反射率计算; 波长和入射角变化; 传输矩阵; 平均反射率; 绘制等高线图; 颜色映射设置。,光学多层膜系统模拟仿真:Matlab代码实现
中国城市统计年鉴全集(1985-2022).zip。内容来源于网络分享,如有侵权请联系我删除。
双向DC DC全钒液流蓄电池充放电储能matlab simulink仿真模型,采用双闭环控制,充放电电流和电压均可控,直流母线端电压可控,电流为负则充电,电流为正则放电,可以控制电流实现充放电 (1)完整复现文献全钒液流模型,多个全钒液流电池串联成电池组,提供模型参数,电压等级可调 (2)可通过电流环控制电池充放电电流,可实现不同充放电电流,控制速度快(电流闭环) (3)可通过电压环控制电池两端充放电电压,可实现不同充放电电流,控制速度快(电压闭环) ,全钒液流电池; 双向DC-DC; 充放电控制; 电流环控制; 电压环控制; MATLAB Simulink仿真模型; 电池组; 模型参数; 电压等级可调; 电流闭环; 电压闭环,Matlab Simulink仿真模型:全钒液流电池双闭环充放电控制储能系统
windows平台mysql版本安装包 mysql-installer-community
分享课程——BEV模型部署全栈教程(3D检测+车道线+Occ)课程
基于FPGA流水线结构并行FFT的设计与实现-王英喆.caj
内核驱动开发,调试监控IRP请求包发送接收工具
comsol三元锂离子电池模型 NCA111三元锂离子电池21700 电化学-热耦合模型 老化模型 容量衰减模型 参数已经设置好 自己更改参数即可进行使用学习 可进行多倍率充放电仿真 有对应参考文献 A17 ,comsol模型;三元锂离子电池;NCA111电池;电化学-热耦合模型;老化模型;容量衰减模型;参数设置;仿真学习;参考文献,COMSOL三元锂离子电池模型与NCA111电池仿真研究
野火征途Pro FPGA开发板 实现基于帧差法的运动目标检测与跟踪 摄像头:OV5640 显示屏:TFT LCD,VGA,HDMI ,野火征途Pro; FPGA开发板; 帧差法; 运动目标检测与跟踪; OV5640摄像头; TFT LCD; VGA; HDMI,野火征途Pro FPGA开发板:运动目标检测与跟踪的视觉处理
基于PLC控制的自动洗车系统 采用s7-1200设计 lunwenPPT都有 博图仿真 ,基于PLC控制; 自动洗车系统; S7-1200设计; LunwenPPT; 博图仿真,基于S7-1200 PLC控制的自动洗车系统设计与仿真
基于Springboot网吧管理系统【源码+数据库+运行文档】 后端技术栈:SpringBoot ,SpringBoot就是SSM项目的升级版,后端语言Java 前端技术栈:Vue,前端底层都是HTML+JavaScript 数据库:MySQL是目前企业最流行的数据库 SpringBoot通过“约定优于配置”自动化处理繁琐设置,内置Tomcat等服务器实现快速部署,提供Starter POMs简化依赖管理,集成大量开发工具与监控功能,极大提升开发效率,让开发者聚焦业务逻辑而非配置,故成为现代快速开发Web应用的首选框架。 Vue.js因轻量高效、双向数据绑定、组件化开发模式、灵活的插件生态以及细致的文档而受青睐。它通过虚拟DOM提高页面渲染性能,实现视图与数据的分离,便于团队协作和项目维护,尤其适合构建复杂的单页应用程序,在提升开发效率的同时保障用户体验。 MySQL是一款开源、免费的关系型数据库管理系统,以其高性能、高可扩展性、广泛的跨平台支持和活跃的社区著称。是 web 开发和企业应用的热门选择。
内容概要:本文介绍了一种用于洪水淹没模拟的空间缩减与重建(SRR)方法。SRR 方法由两部分组成:SRR-RL 和 SRR-Reco。前者旨在识别模型域内的代表性位置(RL),以便用少量数据驱动模型(如深度学习模型)代替整个网格模拟;后者则根据代表性的水位信息重建洪水淹没表面。此外,SRR 方法还包括 SRR-Search 函数,用于确定河流排水路径和主要河段中心线。该方法已被验证应用于昆士兰州伯内特河下游的真实世界案例研究,并证明了其高效性。但其精度可能在离选定点较远或退水期间存在‘死储存’的地方有所降低。 适用人群:环境工程学者,洪水风险研究人员,水文学家及对洪水模拟有兴趣的研究人员和技术开发者。 使用场景及目标:该方法适用于需要快速高效的模拟大规模或实时洪水情况的研究场景,能够显著减少模型训练所需的水量监测点,从而提升建模效率。特别有助于缺乏详细洪水历史资料区域的研究。 其他说明:本研究提出了新的数据处理手段,不仅提高了传统二维流体力学仿真之外的应用可能性,而且为构建智能防洪预警系统提供了理论依据。此外,该工具可通过提供的开源仓库下载获取并进行实际操作尝试。