对分库分表的一些想法 -

green_tea

浏览: 4765 次
性别:
来自: 北京务工人员

最近访客更多访客>>

jianfeng

孟雪雪

qq526966394

smzyyyjyrctl

博主相关

博客

微博

相册

留言

关于我

文章分类

全部博客 (2)

社区版块

存档分类

对分库分表的一些想法

经历过几家公司从小到大的成长，数据量也会跟着业务量和访问量剧增。最初的系统架构完全无法支持大数据的到来，期间做过多次架构升级，包括数据库主从读写分离，系统soa化等等。那么就针对系统最重要的一块数据来说吧。

说到数据大家都会想到数据存储和读取，还会联想到关系型数据库和非关系型数据库，当然随着互联网的发展，非关系性数据库越来越火，但是不能说明非关系型数据库完全能取代关系型数据库，至少目前不行。那么，关系型数据库的性能，是让人头疼的一个问题。目前最主流的方案是分库分表。

先说分表吧，可以分为纵向拆分和横向拆分，纵向拆分就是根据时间或者业务分表，或者拆分表结构，这些都需要改变表结构。但是数据量暴增，纵向分表最终还是无法解决问题，最终还是要考虑到横向拆分。

横向拆分也可以说是水平拆分，就是按照一定规则进行分表，不改变表结构。那么水平拆分的依据也是需要斟酌的。要保证数据能基本平均分配到不同的分表中，那么分表的依据就是重复性不能太高。那么首先考虑的就是主键。根据主键按照一定的策略进行分表。我想到的的有按区间分表，取模分表。

先说按区间分表，按区间分表有局限性，就是主键一定要保证是一个有序的数字，而且是不执行或很少执行delete的。但是好处是能保证表的数据量，也好维护。分表后的数据如下表：

取模分表，很简单就是对某个数值取余，然后分配到不同的表里。比如对4取余。那么数据分布如下：

取模分表没有对数据有苛刻要求，但是需要提前确定好取模因子（被取余数也可以看做分表的数量）

看似取模分表比较合适，但是如果分表后数据量增长，当前分表已经无法支撑的时候怎么办呢，增加表，再取模？那么同步数据将会是很头疼的事情。因为每张表都要再从新分配数据。那么我们能不能借鉴一致性hash来进行分库分表呢？

一致性hash也可以看做是按区间分表，在0-2^32之间创建几个节点，节点可以看做是表，同时增加虚拟节点（对0-2^32分成多个区间段，然后多个区间段分别指定到几个表中）来保证各表的数据基本均衡，如果出现数据分配不均衡，就增加节点来分流数据命中大的节点。这样增加表的时候只同步数据量最大的那张表即可。但是0-2^32是一个很大的范围，怎么分区保证数据平均将是很复杂的事情。如果分段比较粗粒度那么不能保证数据的均衡，细粒度的话则需要维护一个范围段的数据，增加运算和维护成本。粒度越细运算和维护成本越高。那么有没有更好的方案呢？

能不能用二叉树的结构来进行分表呢？统一对2取模，left节点库存放可整除的数据，right存放不可被2整除的数据。如果某个节点压力较大则对该节点继续二叉，同时对分库指标加固定前缀或后缀，再hash对2取模。这样的话就可以避免添加表的时候全部数据要从新分配，也节省了维护成本（只维护一个二叉树即可）。

比如：分表字段为一个uuid，值为b9a6fd18-8734-45c4-ad81-57a98ada8304,hashcode = 2039422118（可以被2整除）, 那么该数据存放在left节点，如果left节点不是最终节点（再分表），则uuid+后缀如：b9a6fd18-8734-45c4-ad81-57a98ada8304_EXT , 则该值的hashcode为 -1376741656（可以被2整除），则该数据存放再二级二叉树的left节点。

节点内容存放表名称，如果该节点有子节点，则按照规则加前缀或后缀，再hash，按照取模原则找下一节点，直到节点没有子节点的时候，获取表名称。

先分析添加表，比如某个节点表压力较大需要分表，则分流这个节点即可，最糟糕的情况是多个节点同时分表，那么逐个分表即可，各个节点互不影响。这样比取模分表扩容的时候要方便的多。

从维护的角度看，根据二叉树的原理分表，可以避免数据迁移的麻烦，同时系统只要维护一个二叉树即可，也节省了维护成本。

以上只是个人的一些想法，难免有一些不合理或者错误的地方，请大家指出批评并一块讨论改进。

http://308812025-qq-com.iteye.com/blog/1697104

表拆分.pdf (213.1 KB)
下载次数: 5

ori.zip (2.5 KB)
下载次数: 1

double.zip (2.7 KB)
下载次数: 1

double-o.zip (2.5 KB)
下载次数: 1

pac.zip (959.2 KB)
下载次数: 1

print.zip (5.3 KB)
下载次数: 2

pho.zip (8.3 KB)
下载次数: 1

mm.zip (189.9 KB)
下载次数: 7

tm.zip (8.8 KB)
下载次数: 4

mtp.zip (5.4 KB)
下载次数: 1

p.zip (3.1 KB)
下载次数: 1

cs.zip (3.6 KB)
下载次数: 1

com.zip (174 KB)
下载次数: 5

constant.zip (10.6 KB)
下载次数: 6

tpm.zip (6 KB)
下载次数: 3

tools.zip (3.8 KB)
下载次数: 1

com.zip (168.6 KB)
下载次数: 1

查看图片附件

分享到：

自己写的一个类似html5表单属性的表单验证 ...

2014-10-29 14:04
浏览 1881
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

分库分表Sharding中间件Kamike.divide.zip: 分库分表这个是8月份左右跟淘宝的数据分析部门的架构师离哲交流的时候产生的想法，离哲推荐采用TDDL进行分库分表。回去一看，却发现TDDL只开源了一半，开源的那一半基本没法使用，所以只能自己写一个Sharding了...

Timo:分布式MySQL数据库中间件，支持数据的水平、垂直拆分，支持分库分表，支持读写分离，支持结果集合并，支持故障自动切换: Timo目前是实验性质，主要用于熟悉相关技术，实现个人想法，提高姿势水平。(●｀･(ｴ)･´●) Timo Technical Terms [Timo中的术语介绍] (./doc/TimoTechnicalTerms.md) Quick Start [马上开始使用Timo！] (./doc/...

「Java面试小抄」部分通向理想互联网公司的面试汇总，包括Java基础、Java并发、JVM、MySQL、Redis、Spring、MyBatis、Kafka、计算机操作系统、计算机网络、系统.zip: Java 面试「Java面试小抄」一份通向理想互联网公司的面试指南，包括Java基础、集合、Java并发、JVM、MySQL、Redis、...总结版进程通信和线程通信的方式如何设计线程池AQS原理MySQLMySQL基础、锁、事务、分库分表、优化

spring-ai-oracle-store-1.0.0-M7.jar中文文档.zip: # 【spring-ai-oracle-store-1.0.0-M7.jar中文文档.zip】中包含：中文文档：【spring-ai-oracle-store-1.0.0-M7-javadoc-API文档-中文(简体)版.zip】 jar包下载地址：【spring-ai-oracle-store-1.0.0-M7.jar下载地址(官方地址+国内镜像地址).txt】 Maven依赖：【spring-ai-oracle-store-1.0.0-M7.jar Maven依赖信息(可用于项目pom.xml).txt】 Gradle依赖：【spring-ai-oracle-store-1.0.0-M7.jar Gradle依赖信息(可用于项目build.gradle).txt】源代码下载地址：【spring-ai-oracle-store-1.0.0-M7-sources.jar下载地址(官方地址+国内镜像地址).txt】 # 本文件关键字： spring-ai-oracle-store-1.0.0-M7.jar中文文档.zip,java,spring-ai-oracle-store-1.0.0-M7.jar,org.springframework.ai,spring-ai-oracle-store,1.0.0-M7,org.springframework.ai.vectorstore.oracle,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,springframework,spring,ai,oracle,store,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压【spring-ai-oracle-store-1.0.0-M7.jar中文文档.zip】，再解压其中的【spring-ai-ora

3dmax插件丢失贴图.ms: 3dmax插件

azure-ai-openai-1.0.0-beta.3.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

（专升本）C语言历年考试题及答案2.doc: （专升本）C语言历年考试题及答案2.doc

spring-ai-mongodb-atlas-store-1.0.0-M5.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

基于Matlab/Simulink的DSTATCOM无功补偿风电并网模型仿真与优化: 内容概要：本文介绍了利用Matlab/Simulink搭建的带有DSTATCOM无功补偿的风电并网模型及其仿真结果。模型中包含了双馈风机（DFIG）和鼠笼感应风机（SCIG），并通过DSTATCOM实现了对电压波动的有效抑制。文中详细描述了DSTATCOM的控制策略，包括电压-无功闭环控制、PI控制器的设计以及低电压穿越功能的实现。此外，还讨论了仿真过程中遇到的一些常见问题及解决方案，如参数选择不当引起的过冲现象、仿真加速技巧等。适合人群：从事电力系统、风电并网研究的技术人员和研究人员。使用场景及目标：适用于希望深入了解风电并网系统中无功补偿机制的研究人员和技术人员，旨在提高对DSTATCOM控制策略的理解，掌握解决电压不稳定问题的方法。其他说明：文中提供了详细的控制算法代码片段，有助于读者更好地理解和复现实验结果。同时，作者分享了一些实用的经验和技巧，如参数调整、仿真加速方法等，对于实际应用具有重要参考价值。

【基于矢量射线的衍射积分（VRBDI）】基于矢量射线的衍射积分（VRBDI）和仿真工具附Matlab代码.rar: 1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

langchain4j-ollama-0.26.1.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

### 中国智能制造产业发展报告（2023-2024年）总结、智能制造概述: 内容概要：本文详细介绍了2023-2024年度中国智能制造产业发展情况。报告由多个部门和机构联合编写，涵盖智能制造总述、AI赋能制造业转型升级、全球智能制造发展形势、中国智能制造概况、产业分析、发展规划及优秀案例。报告指出，智能制造已成为提升制造业竞争力的国家战略，强调了新一代信息技术与制造业深度融合的重要性。文中分析了中国智能制造的优势、面临的挑战及未来的发展目标，强调了政策引领、试点先行和跨域协同的重要性。同时，报告探讨了AI在智能制造中的应用，特别是大模型对制造业的推动作用，并列举了多个行业和地区的智能制造政策和具体案例，展示了智能制造在中国的广泛应用和未来发展潜力。适用人群：政府相关部门、智能制造领域的研究人员、企业高管和技术人员、高等院校相关专业的师生等。使用场景及目标：①帮助政府和企业了解智能制造的最新发展动态和政策导向；②为制造业企业提供智能化转型的参考案例和技术解决方案；③为高校和研究机构提供智能制造领域的研究素材和方向；④促进智能制造技术的普及和应用，推动制造业高质量发展。阅读建议：此报告内容详尽，涵盖了智能制造的多个方面，读者应重点关注中国智能制造的优势、面临的挑战、发展目标及相关政策。同时，结合实际工作或研究需求，深入研读具体章节和案例，以获得更有针对性的知识和启示。

自动驾驶车辆运动控制中PID参数优化的强化学习探索：基于DDPG算法的解决方案: 内容概要：本文探讨了在自动驾驶车辆运动控制中，传统PID控制算法由于参数固定的局限性，难以适应复杂的路况和车速变化的问题。为了克服这一挑战，文章介绍了如何利用基于Actor-Critic框架的DDPG（深度确定性策略梯度）算法来动态调整PID控制参数。具体来说，Actor网络负责输出优化后的PID参数，而Critic网络则评估这些参数的效果。通过不断的学习和调整，使车辆能够在各种情况下表现出更好的控制性能。此外，文中还详细描述了奖励函数的设计，确保控制不仅精确而且平稳。适合人群：从事自动驾驶研究的技术人员、对强化学习应用于实际控制系统感兴趣的学者及工程师。使用场景及目标：适用于希望提升自动驾驶车辆在复杂道路条件下的稳定性和灵活性的研究项目。目标是在不同路况和车速条件下，通过动态调整PID参数，提高车辆的控制精度和平顺性。其他说明：文章提供了具体的代码示例，帮助读者理解和实现相关算法。同时也指出了在实际应用中可能遇到的问题及其解决办法，如参数调整的边界约束、状态输入的数据平滑处理等。

spring-ai-opensearch-store-1.0.0-M5.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

spring-ai-model-chat-memory-jdbc-1.0.0-M7.jar中文-英文对照文档.zip: # 【spring-ai-model-chat-memory-jdbc-1.0.0-M7.jar中文-英文对照文档.zip】中包含：中文-英文对照文档：【spring-ai-model-chat-memory-jdbc-1.0.0-M7-javadoc-API文档-中文(简体)-英语-对照版.zip】 jar包下载地址：【spring-ai-model-chat-memory-jdbc-1.0.0-M7.jar下载地址(官方地址+国内镜像地址).txt】 Maven依赖：【spring-ai-model-chat-memory-jdbc-1.0.0-M7.jar Maven依赖信息(可用于项目pom.xml).txt】 Gradle依赖：【spring-ai-model-chat-memory-jdbc-1.0.0-M7.jar Gradle依赖信息(可用于项目build.gradle).txt】源代码下载地址：【spring-ai-model-chat-memory-jdbc-1.0.0-M7-sources.jar下载地址(官方地址+国内镜像地址).txt】 # 本文件关键字： spring-ai-model-chat-memory-jdbc-1.0.0-M7.jar中文-英文对照文档.zip,java,spring-ai-model-chat-memory-jdbc-1.0.0-M7.jar,org.springframework.ai,spring-ai-model-chat-memory-jdbc,1.0.0-M7,org.springframework.ai.chat.memory.jdbc,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,springframework,spring,ai,model,chat

tokenizers-0.25.0.jar中文文档.zip: # 【tokenizers-***.jar***文档.zip】中包含： ***文档：【tokenizers-***-javadoc-API文档-中文(简体)版.zip】 jar包下载地址：【tokenizers-***.jar下载地址(官方地址+国内镜像地址).txt】 Maven依赖：【tokenizers-***.jar Maven依赖信息(可用于项目pom.xml).txt】 Gradle依赖：【tokenizers-***.jar Gradle依赖信息(可用于项目build.gradle).txt】源代码下载地址：【tokenizers-***-sources.jar下载地址(官方地址+国内镜像地址).txt】 # 本文件关键字： tokenizers-***.jar***文档.zip,java,tokenizers-***.jar,ai.djl.huggingface,tokenizers,***,ai.djl.engine.rust,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,djl,huggingface,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压【tokenizers-***.jar***文档.zip】，再解压其中的【tokenizers-***-javadoc-API文档-中文(简体)版.zip】，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件； # Maven依赖： ``` <dependency> <groupId>ai.djl.huggingface</groupId> <artifactId>tokenizers</artifactId> <version>***</version> </dependency> ``` # Gradle依赖： ``` Gradle: implementation group: 'ai.djl.huggingface', name: 'tokenizers', version: '***' Gradle (Short): implementation 'ai.djl.huggingface:tokenizers:***' Gradle (Kotlin): implementation("ai.djl.huggingface:tokenizers:***") ``` # 含有的 Java package（包）： ``` ai.djl.engine.rust ai.djl.engine.rust.zoo ai.djl.huggingface.tokenizers ai.djl.huggingface.tokenizers.jni ai.djl.huggingface.translator ai.djl.huggingface.zoo ``` # 含有的 Java class（类）： ``` ai.djl.engine.rust.RsEngine ai.djl.engine.rust.RsEngineProvider ai.djl.engine.rust.RsModel ai.djl.engine.rust.RsNDArray ai.djl.engine.rust.RsNDArrayEx ai.djl.engine.rust.RsNDArrayIndexer ai.djl.engine.rust.RsNDManager ai.djl.engine.rust.RsSymbolBlock ai.djl.engine.rust.RustLibrary ai.djl.engine.rust.zoo.RsModelZoo ai.djl.engine.rust.zoo.RsZooProvider ai.djl.huggingface.tokenizers.Encoding ai.djl.huggingface.tokenizers.HuggingFaceTokenizer ai.djl.huggingface.tokenizers.HuggingFaceTokenizer.Builder ai.djl.hu

【企业智能化转型】腾讯云DeepSeek大模型知识引擎：提升企业人效与业务增长的智能解决方案: 内容概要：本文介绍了腾讯云DeepSeek大模型知识引擎在企业服务中的应用，旨在提升企业人效和业务增长。大模型具备理解、学习、生成和推理能力，已在智能客服、智能办公等领域落地。文章详细介绍了三种主要应用模式——标准模式、工作流模式和Agent模式，分别适用于不同需求场景。此外，还展示了知识引擎在企业行政问答、专业知识查询、质检、保险建议书生成等具体业务中的成功案例。针对大模型应用中的难点，如企业知识更新快、知识格式多样等问题，腾讯云提供了全链路解决方案，涵盖知识获取、处理、检索、理解和生成。最后，文章强调了大模型知识引擎的安全防护措施，确保数据资产的安全。适合人群：企业管理人员、信息技术部门负责人、数据科学家、AI开发者等关注企业智能化转型的专业人士。使用场景及目标：①通过智能客服、智能办公等场景提高员工工作效率；②利用标准模式、工作流模式和Agent模式满足不同业务需求；③解决企业知识更新快、知识格式多样等实际难题，提升业务处理的准确性和效率；④保障企业数据安全，防止敏感信息泄露。其他说明：本文还探讨了大模型在金融舆情摘要、投顾服务、投研服务、车险评残业务等领域的潜在应用场景，展示了大模型知识引擎的广泛适用性和强大功能。

电源.SCHLIB: 电源.SCHLIB

基于小脑模型神经网络的轨迹跟踪研究附Matlab代码.rar: 1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

最近访客 更多访客>>