对分库分表的一些想法 -

green_tea

浏览: 4759 次
性别:
来自: 北京务工人员

最近访客更多访客>>

jianfeng

孟雪雪

qq526966394

smzyyyjyrctl

博主相关

博客

微博

相册

留言

关于我

文章分类

全部博客 (2)

社区版块

存档分类

对分库分表的一些想法

经历过几家公司从小到大的成长，数据量也会跟着业务量和访问量剧增。最初的系统架构完全无法支持大数据的到来，期间做过多次架构升级，包括数据库主从读写分离，系统soa化等等。那么就针对系统最重要的一块数据来说吧。

说到数据大家都会想到数据存储和读取，还会联想到关系型数据库和非关系型数据库，当然随着互联网的发展，非关系性数据库越来越火，但是不能说明非关系型数据库完全能取代关系型数据库，至少目前不行。那么，关系型数据库的性能，是让人头疼的一个问题。目前最主流的方案是分库分表。

先说分表吧，可以分为纵向拆分和横向拆分，纵向拆分就是根据时间或者业务分表，或者拆分表结构，这些都需要改变表结构。但是数据量暴增，纵向分表最终还是无法解决问题，最终还是要考虑到横向拆分。

横向拆分也可以说是水平拆分，就是按照一定规则进行分表，不改变表结构。那么水平拆分的依据也是需要斟酌的。要保证数据能基本平均分配到不同的分表中，那么分表的依据就是重复性不能太高。那么首先考虑的就是主键。根据主键按照一定的策略进行分表。我想到的的有按区间分表，取模分表。

先说按区间分表，按区间分表有局限性，就是主键一定要保证是一个有序的数字，而且是不执行或很少执行delete的。但是好处是能保证表的数据量，也好维护。分表后的数据如下表：

取模分表，很简单就是对某个数值取余，然后分配到不同的表里。比如对4取余。那么数据分布如下：

取模分表没有对数据有苛刻要求，但是需要提前确定好取模因子（被取余数也可以看做分表的数量）

看似取模分表比较合适，但是如果分表后数据量增长，当前分表已经无法支撑的时候怎么办呢，增加表，再取模？那么同步数据将会是很头疼的事情。因为每张表都要再从新分配数据。那么我们能不能借鉴一致性hash来进行分库分表呢？

一致性hash也可以看做是按区间分表，在0-2^32之间创建几个节点，节点可以看做是表，同时增加虚拟节点（对0-2^32分成多个区间段，然后多个区间段分别指定到几个表中）来保证各表的数据基本均衡，如果出现数据分配不均衡，就增加节点来分流数据命中大的节点。这样增加表的时候只同步数据量最大的那张表即可。但是0-2^32是一个很大的范围，怎么分区保证数据平均将是很复杂的事情。如果分段比较粗粒度那么不能保证数据的均衡，细粒度的话则需要维护一个范围段的数据，增加运算和维护成本。粒度越细运算和维护成本越高。那么有没有更好的方案呢？

能不能用二叉树的结构来进行分表呢？统一对2取模，left节点库存放可整除的数据，right存放不可被2整除的数据。如果某个节点压力较大则对该节点继续二叉，同时对分库指标加固定前缀或后缀，再hash对2取模。这样的话就可以避免添加表的时候全部数据要从新分配，也节省了维护成本（只维护一个二叉树即可）。

比如：分表字段为一个uuid，值为b9a6fd18-8734-45c4-ad81-57a98ada8304,hashcode = 2039422118（可以被2整除）, 那么该数据存放在left节点，如果left节点不是最终节点（再分表），则uuid+后缀如：b9a6fd18-8734-45c4-ad81-57a98ada8304_EXT , 则该值的hashcode为 -1376741656（可以被2整除），则该数据存放再二级二叉树的left节点。

节点内容存放表名称，如果该节点有子节点，则按照规则加前缀或后缀，再hash，按照取模原则找下一节点，直到节点没有子节点的时候，获取表名称。

先分析添加表，比如某个节点表压力较大需要分表，则分流这个节点即可，最糟糕的情况是多个节点同时分表，那么逐个分表即可，各个节点互不影响。这样比取模分表扩容的时候要方便的多。

从维护的角度看，根据二叉树的原理分表，可以避免数据迁移的麻烦，同时系统只要维护一个二叉树即可，也节省了维护成本。

以上只是个人的一些想法，难免有一些不合理或者错误的地方，请大家指出批评并一块讨论改进。

http://308812025-qq-com.iteye.com/blog/1697104

表拆分.pdf (213.1 KB)
下载次数: 5

ori.zip (2.5 KB)
下载次数: 1

double.zip (2.7 KB)
下载次数: 1

double-o.zip (2.5 KB)
下载次数: 1

pac.zip (959.2 KB)
下载次数: 1

print.zip (5.3 KB)
下载次数: 2

pho.zip (8.3 KB)
下载次数: 1

mm.zip (189.9 KB)
下载次数: 7

tm.zip (8.8 KB)
下载次数: 4

mtp.zip (5.4 KB)
下载次数: 1

p.zip (3.1 KB)
下载次数: 1

cs.zip (3.6 KB)
下载次数: 1

com.zip (174 KB)
下载次数: 5

constant.zip (10.6 KB)
下载次数: 6

tpm.zip (6 KB)
下载次数: 3

tools.zip (3.8 KB)
下载次数: 1

com.zip (168.6 KB)
下载次数: 1

查看图片附件

分享到：

自己写的一个类似html5表单属性的表单验证 ...

2014-10-29 14:04
浏览 1878
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

分库分表Sharding中间件Kamike.divide.zip: 分库分表这个是8月份左右跟淘宝的数据分析部门的架构师离哲交流的时候产生的想法，离哲推荐采用TDDL进行分库分表。回去一看，却发现TDDL只开源了一半，开源的那一半基本没法使用，所以只能自己写一个Sharding了...

Timo:分布式MySQL数据库中间件，支持数据的水平、垂直拆分，支持分库分表，支持读写分离，支持结果集合并，支持故障自动切换: Timo目前是实验性质，主要用于熟悉相关技术，实现个人想法，提高姿势水平。(●｀･(ｴ)･´●) Timo Technical Terms [Timo中的术语介绍] (./doc/TimoTechnicalTerms.md) Quick Start [马上开始使用Timo！] (./doc/...

「Java面试小抄」部分通向理想互联网公司的面试汇总，包括Java基础、Java并发、JVM、MySQL、Redis、Spring、MyBatis、Kafka、计算机操作系统、计算机网络、系统.zip: Java 面试「Java面试小抄」一份通向理想互联网公司的面试指南，包括Java基础、集合、Java并发、JVM、MySQL、Redis、...总结版进程通信和线程通信的方式如何设计线程池AQS原理MySQLMySQL基础、锁、事务、分库分表、优化

西门子S7-200PLC与MCGS触摸屏联动控制步进伺服电机的技术解析及应用实例: 内容概要：本文详细介绍了利用西门子S7-200PLC与昆仑通泰MCGS触摸屏联合控制步进伺服电机的方法和技术要点。首先阐述了硬件接线的具体方式，包括PLC输出接口与伺服驱动器之间的正确连接以及必要的安全措施如急停开关的接入。接着深入探讨了PLC程序的核心代码片段，涵盖原点回归、手动正转触发、绝对位置计算等功能模块，并解释了关键指令如PLS的作用及其使用注意事项。此外，针对触摸屏的关键配置进行了说明，涉及数值输入框、指示灯、多状态按钮等组件的设置，强调了绝对定位逻辑的实现。文中还分享了一些常见的调试问题及解决方案，例如伺服电机抖动、数据刷新延迟等问题的处理办法。最后提到该方案已在实际生产环境中成功应用并表现出良好的性能指标。适合人群：从事自动化控制领域的工程师和技术人员，特别是那些希望深入了解PLC与触摸屏协同工作的专业人士。使用场景及目标：适用于需要高精度定位控制的小型自动化生产线或机械设备中，旨在帮助用户掌握如何构建稳定可靠的步进伺服控制系统，提高工作效率的同时降低成本。其他说明：作者凭借丰富的实践经验提供了许多宝贵的建议和技巧，对于初学者而言是非常有价值的参考资料。

光储并网直流微电网Simulink仿真模型：MPPT与混合储能系统的优化设计: 内容概要：本文详细介绍了光储并网直流微电网的Simulink仿真模型构建，涵盖多个关键技术点。首先讨论了光伏系统的最大功率点跟踪（MPPT）算法，特别是扰动观察法的具体实现及其优缺点。接着探讨了由蓄电池和超级电容组成的混合储能系统，强调了它们各自的特点以及如何通过控制算法进行有效的功率分配。此外，还讲解了二阶低通滤波法的应用，用于提高电能质量和优化不同频率范围内的功率管理。最后，文章深入解析了逆变器的双闭环控制系统，包括电压环和电流环的设计，以确保逆变器输出与大电网的良好匹配。适合人群：从事新能源系统设计、电力电子技术研究的专业人士，尤其是对Simulink仿真工具有所了解的研发人员。使用场景及目标：适用于希望深入了解光储并网直流微电网内部机制和技术细节的研究者和工程师。主要目标是帮助读者掌握如何利用Simulink工具箱搭建完整的光储并网直流微电网仿真平台，从而为实际工程应用提供理论支持和技术指导。其他说明：文中提供了大量具体的Matlab/Simulink代码片段，便于读者理解和实践。同时，作者分享了许多宝贵的实战经验和调试技巧，有助于解决实际建模过程中可能遇到的问题。

西门子1200 PLC轴运动控制程序模板：多轴伺服、电缸控制及PLC通信实战应用: 内容概要：本文详细介绍了一套成熟的西门子1200 PLC轴运动控制程序模板，涵盖多轴伺服控制、电缸控制、PLC通信、气缸报警、电路图、威纶通触摸屏程序和IO表等方面的内容。该模板已在多个项目中成功应用，特别是在海康威视的路由器外壳装配机项目中表现优异。文中不仅提供了具体的代码示例，还分享了许多实战经验和技巧，如轴控制块的参数设置、PUT/GET通讯的心跳检测、气缸报警的互锁逻辑、电路图中的电源保护措施等。适合人群：从事工业自动化领域的工程师和技术人员，尤其是那些需要进行PLC编程和轴运动控制的从业者。使用场景及目标：①快速掌握西门子1200 PLC轴运动控制的编程方法；②提高PLC程序的稳定性和可靠性；③优化设备性能，确保高效生产和故障预防。其他说明：该模板不仅适用于新项目的开发，也可以作为现有系统的改进参考。通过学习和应用这些技术和经验，可以显著提升工作效率和产品质量。

智能驾驶领域基于神经网络的驾驶员风格自适应ACC系统安全距离模型研究: 内容概要：本文探讨了基于神经网络训练的不同驾驶员风格自适应ACC（自适应巡航控制）系统，尤其是其安全距离模型的研究。传统ACC系统采用固定的参数设置，难以适应不同驾驶员的驾驶习惯。文中介绍了通过神经网络训练，使ACC系统能够学习并适应不同驾驶员的驾驶风格，从而动态调整安全距离的方法。具体实现了基于LSTM和物理模型融合的混合式神经网络结构，以及定制化的损失函数，确保系统在不同驾驶风格下的安全性和舒适度。实验结果显示，该系统能够在不同驾驶风格间灵活切换，提升应对复杂路况的能力。适合人群：对智能驾驶技术和机器学习感兴趣的科研人员、工程师和技术爱好者。使用场景及目标：适用于智能汽车的研发和改进，旨在提高ACC系统的智能化水平，使其更加符合不同驾驶员的习惯，提升驾驶体验和安全性。其他说明：文章还讨论了模型的实际应用挑战，如不同地区的驾驶文化差异，并提出了相应的解决方案。

计算机三级网络机试考试试题及答案(下).pdf: 计算机三级网络机试考试试题及答案(下).pdf

UWB DW1000高精度3D定位系统：基于CH32F103C8T6与卡尔曼滤波的实现及应用: 内容概要：本文详细介绍了基于Decawave UWB DW1000定位模块和CH32F103C8T6控制器构建的高精度3D定位系统。系统分为定位模块和测距模块，前者负责接收并计算用户位置，后者提供测距数据。定位模块采用最小二乘法和扩展卡尔曼滤波相结合的方式，实现了静态和动态环境下的高精度定位。文中还提供了详细的硬件配置、SPI接口初始化、测距算法以及定位算法的代码示例，并通过实验验证了系统的性能。适合人群：对超宽带(UWB)定位技术和嵌入式开发感兴趣的工程师和技术爱好者。使用场景及目标：适用于需要高精度室内外定位的应用场景，如AGV调度、人员定位等。目标是帮助开发者理解和实现基于UWB的高精度定位系统。其他说明：文中提到的关键技术点包括SPI接口配置、双边双向测距算法(DS-TWR)、天线延迟校准、最小二乘法和扩展卡尔曼滤波。此外，作者还分享了一些实用的经验和技巧，如SPI分频系数选择、光速值的精确度、状态方程的设计等。

计算机实训总结.pdf: 计算机实训总结.pdf

单片机课程设计-温度监控系统的设计: 单片机课程设计__温度监控系统的设计

基于深度强化学习的微能源网能量管理与优化策略研究——使用DQN实现智能调度算法: 内容概要：本文详细探讨了利用深度强化学习（特别是DQN算法）进行微能源网的能量管理和优化调度。文中介绍了微能源网面临的挑战，如风光出力的不确定性以及传统优化算法的局限性。作者通过具体案例展示了如何构建微电网环境类MicrogridEnv，定义状态空间、动作空间和奖励函数，并实现了DQN神经网络架构。此外，还讨论了经验回放、双网络结构等关键技术细节，以及如何通过特征工程提高模型性能。最终，通过实际测试验证了DQN算法的有效性和优势。适合人群：从事微能源网、智能电网研究的技术人员，对深度强化学习感兴趣的开发者，以及希望了解如何将机器学习应用于能源领域的研究人员。使用场景及目标：适用于需要优化微能源网能量管理的场景，旨在提高能源利用率、降低成本并确保供电稳定性。主要目标是通过智能算法应对风光出力的不确定性和用户需求的波动，从而实现高效的能源调度。其他说明：文章不仅提供了理论分析和技术实现，还包括了许多实用的经验分享和调试技巧，有助于读者更好地理解和应用深度强化学习于实际项目中。

《基于yolov8的动物识别检测检测项目》（包含源码、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 资源内项目源码是均来自个人的课程设计、毕业设计或者具体项目，代码都测试ok，包含核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源，答辩评审绝对信服的，拿来就能用。放心下载使用！源码、数据集、部署说明一站式服务，拿来就能用的绝对好资源！！！项目备注 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习，也适合小白学习进阶，当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可用于毕设、课设、作业等。下载后请首先打开README.dataset.txt文件，仅供学习参考, 切勿用于商业用途。

A stateless, content-directed data prefetching mechanism: Cache prefetch

基于Matlab的FFT分析与滤波程序：信号频谱分析及基波提取: 内容概要：本文详细介绍了一种基于Matlab的FFT分析和滤波程序，旨在实现信号的频谱分析并提取特定频率的基波信号。文中通过具体代码实例展示了如何导入数据、绘制原始信号波形图、执行FFT分析、设计滤波器并对信号进行滤波处理。最终通过图形化展示，验证了滤波器的有效性和程序的实用性。适合人群：从事信号处理、通信工程、电子工程等领域的工作技术人员，以及相关专业的学生和研究人员。使用场景及目标：适用于需要对复杂信号进行频域分析和滤波处理的实际工程项目，如电力系统谐波分析、音频信号处理等。目标是帮助用户快速掌握Matlab在信号处理方面的应用技巧，提高工作效率。其他说明：文中提供的代码可以直接运行于Matlab环境，用户可根据实际情况调整参数以适应不同应用场景。同时，文中附有多张图表，便于理解和验证各个步骤的效果。

基于MATLAB与FPGA的直方图均衡化图像处理技术实现及应用: 内容概要：本文详细介绍了利用MATLAB进行直方图均衡化算法的仿真以及在FPGA上实现该算法的具体步骤和技术要点。首先，通过MATLAB代码展示了直方图统计、累积分布函数(CDF)计算和像素映射的过程，并解释了相关注意事项如索引偏移等问题。接着，深入探讨了FPGA实现中的三个主要模块：直方图统计、CDF计算和像素映射，强调了硬件并行特性的利用，特别是双端口RAM的应用及其带来的挑战。此外，还讨论了Modelsim联合仿真的方法，包括将MATLAB生成的数据用于仿真验证，确保硬件实现的准确性。最后，分享了多个实际案例的效果对比，展示了直方图均衡化在改善图像质量方面的显著成效。适合人群：对图像处理感兴趣的研究人员、工程师，尤其是希望深入了解FPGA实现图像处理算法的技术人员。使用场景及目标：适用于需要提高图像对比度和清晰度的应用场合，如医学影像、安防监控等领域。目标是掌握直方图均衡化算法的工作原理及其在FPGA平台上的高效实现方法。其他说明：文中提供了详细的代码示例和调试技巧，帮助读者更好地理解和实践。同时提到了一些常见的错误和解决方案，有助于避免初学者常犯的问题。

V型永磁同步电机永磁体参数调整与优化技术解析及Maxwell仿真应用: 内容概要：本文详细探讨了V型永磁同步电机中永磁体参数调整的方法和技术，特别是在Maxwell软件中的应用。首先介绍了V型永磁体的关键参数（如V型夹角、磁钢厚度、极弧系数等）及其对电机性能的影响。接着讨论了利用Maxwell进行参数化建模、参数扫描、优化方法（如响应面法、多目标遗传算法）的具体步骤和注意事项。文中还提供了多个实用脚本，涵盖从几何建模、材料属性设置到求解器配置、后处理分析等多个方面。此外，强调了优化过程中应注意的问题，如退磁校验、磁密饱和、涡流损耗等，并给出了一些实战技巧。适合人群：从事电机设计与仿真的工程师、研究人员，尤其是熟悉Maxwell软件的用户。使用场景及目标：帮助用户掌握V型永磁同步电机永磁体参数调整的技术要点，提高电机性能指标（如降低齿槽转矩、减少谐波失真、优化转矩波动等）。通过实例和脚本指导，使用户能够在Maxwell中高效地完成仿真和优化任务。其他说明：文章不仅提供了详细的理论解释，还包括大量实践经验分享和常见问题解决方案，有助于读者更好地理解和应用相关技术。

使用相位阵列系统工具箱中的函数处理雷达数据立方体 matlab代码.rar: 1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

基于Matlab的滚动轴承与齿轮复合故障仿真信号生成及验证: 内容概要：本文详细介绍了如何使用Matlab生成滚动轴承和齿轮同时发生故障的复合仿真信号。首先，分别生成了滚动轴承内圈故障和齿轮断齿故障的信号，通过设置不同的参数如故障特征频率、调制深度等，利用卷积运算将冲击序列和衰减振荡波形结合，生成带有调制特征的故障信号。接着，将这两种故障信号进行适当的能量配比并加入适量噪声，最终形成复合故障信号。为了验证仿真信号的有效性，进行了频谱分析，确保在特定频率范围内能够观察到预期的故障特征。适合人群：机械工程领域的研究人员和技术人员，尤其是从事故障诊断和信号处理工作的专业人士。使用场景及目标：适用于研究和开发故障诊断算法，特别是在复杂机械设备中，用于测试和验证故障分离算法的效果。通过这种方式，可以在没有实际设备的情况下，提前评估算法性能，减少试验成本和风险。其他说明：文中提供了详细的代码示例和调试技巧，帮助读者更好地理解和实现复合故障仿真。此外，还强调了仿真信号与实际情况之间的差异以及需要注意的问题，如参数设置、信噪比调整等。

最近访客 更多访客>>