在京东这一段时间做了很多数据的迁徙,做一些总结。(以sqlserver迁徙至mysql为例)
迁徙的需求:业务数据从sqlserver迁徙至mysql,尽量减少系统停用的时间。
迁徙流程:
中间件接写,开启changelog |
原来sqlserver的读取写入统一由中间件接管,保证读写统一。中间件写入时把变更信息记录到changelog表。changelog(主键,变更主键,变更表,变更类型,状态,创建时间,修改时间),状态为0 |
全量迁徙 |
准备sqlserver离线库,上线全量迁徙程序,把离线库数据全量迁徙至mysql。 sql插入全使用insert or update可重复执行。 |
全量迁徙检验 |
检验sqlserver离线库和mysql数据是否一致 1.计数检验 2.唯一标识是否存在检验 3.字段检验 可以根据数据的重要性和实际情况选择检验的程度 检验要做到一条不差,如果有差值要找到差的原因,跟踪解决。 视情况可以考虑,检验中是否在进行修复。 |
增量迁徙 |
上线增量程序,根据changelog逐条从sqlserver迁徙至mysql,更新状态为1。 不管哪上字段变更,都是执行整表的insert or update。特殊考虑删除。 |
增量迁徙检验 |
上线迁徙检验程序,按照changelog执行字段级检验,如果两边一致,置为状态2,如果不一致,置为状态0 |
切读流量到mysql |
通过流量检验数据正确性,如果有问题可以切回sqlserver。 |
切写流量 |
在深夜某个写流量少的点,停止sqlserver写入,待增量迁徙检验完成后,开启mysql写入。完成迁徙。如果还有应该依赖原sqlserver,还需要下面两步。写mysql的同时,写入changelog |
回写迁徙 |
上线回写程序,根据changelog逐条从mysql迁徙至sqlserver,更新状态为1。 不管哪上字段变更,都是执行整表的insert or update。特殊考虑删除。 |
回写迁徙检验 |
上线回写检验程序,按照changelog执行字段级检验,如果两边一致,置为状态2,如果不一致,置为状态0 |
迁徙相关技术点
用批量in查询代替单个查询 |
处理数据前,把相关数据批量加载到内存,然后处理在内存中的数据。 减少和数据库交互的次数,每次in要有数量控制(50),实际测试表明对比单个查询会有10倍效率提升。 |
性能调优参数化 |
如读写线程数,读写批量值等效率参数要做成可配置的,在实际环境中进行调优 |
线程协作 |
使用线程协作来单独控制读写线程数量,读线程取得要处理的数据,写线程进行数据处理及写入,耗时的是写线程。通过加大写线程数来提升性能。 |
程序部署 |
整体迁徙程序可以通过jsp远端进行控制线程,方便上线。 增量程序是一直在运行的worker,通过changelog来进行驱动。 |
相关推荐
- **经验方程建立**:建立了温度对鱼类迁徙影响的经验方程。 - **模拟预测**:基于模型一中产生的10000个温度变化样本,模拟了每种情况下的鱼类迁徙情况,确定了未来50年内鱼类最可能分布的位置——冰岛与法罗群岛...
3. Statistical Knowledge Model(统计分析模型):结合业务逻辑和数据逻辑,运用统计学方法(如概率论、假设检验)构建动态模型,如迁徙分析模型和马尔可夫模型。 4. Smart Knowledge Model(智能分析模型):利用...
同时,迁徙人口数据的结合,还可以帮助追踪潜在的传播路径,为疫情的预防和控制提供关键信息。 再者,大数据与人工智能的结合,使疫情预测成为可能。利用机器学习算法,可以建立预测模型,提前预估未来一段时间内的...
要深入学习和掌握GPS测绘技术在GIS中的应用,除了阅读本文,还可以参考相关专业书籍和学术论文,如《GPS技术原理与应用》、《地理信息系统原理》等,同时参加专业培训,获取实践操作经验,以便更好地理解和运用这项...
它不仅为领导致辞提供了视觉支持,而且能够有效地将公司一年来的工作成果和经验教训,以图文并茂的形式直观地展现给与会人员。此外,年会通常是一年中员工最集中、领导层最全面的一次聚会,因此,PPT模板的选用与...
15. **违约概率估计**:包括单一借款人和信用等级总体的违约概率,可通过内部违约经验、映射外部数据或统计违约模型进行估计。 16. **信用评分模型**:如线性概率模型、Logit模型、Probit模型等,使用特征变量计算...
总结来说,云计算与大数据在新冠疫情防控中的应用,不仅展示了信息技术在应对公共卫生危机时的强大能力,也为未来类似的挑战提供了可借鉴的经验。这两项技术的应用,不仅有效控制了疫情传播,还在一定程度上降低了...
通过建立经验公式,研究者确定了温度如何影响鱼类迁徙,并利用Model I中的温度变化样本模拟了鱼类可能的迁移路径。模拟结果表明,鱼类种群趋向于迁移到温度适宜的北部海域。这一发现为渔业公司提供了宝贵的指导信息...
大表数据可以通过分区、索引、缓存等技术来办理,数据库性能调优策略包括索引优化、SQL语句优化、数据迁徙、水平切面等。 20. 散布式系统,数据库设计方面,应注意哪些方面? 散布式系统的数据库设计需要注意权限...
客户行为的线上化迁徙进程已经加速,各种无接触、线上化、云端化行为爆发式涌现。因此,能否提供线上化服务已成为衡量保险公司能否应对挑战的“试金石”。 其次是运营模式的变化。传统的线下渠道管理模式会变,在线...
- **优势总结**:强调模型的优势,例如准确预测未来的温度变化和鱼类迁徙。 - **改进建议**:提出了未来研究中可能的改进方向。 #### 关键词解析 - **ARIMA**:自回归积分滑动平均模型,用于时间序列预测。 - **鱼...
【先天性行为与学习行为】 ...总结来说,本学案旨在帮助学生理解动物的先天性行为和学习行为,强调它们对动物生存和适应环境的重要性,同时训练学生的观察、分析和实验技能,培养他们对生命的关爱之情。
最后,**文档记录与报告**在整个施工过程中扮演重要角色,所有的环保措施、监测数据和执行情况都应详细记录,以备审查和总结经验。 综上所述,环保施工组织设计在安徽某市污水主干网管道工程中起着决定性作用,通过...
数字化技术的应用,如5G通信、物联网、大数据分析等,使得交通运输行业能够更好地应对突发情况,为公众提供了更加安全、便捷的服务。 总结来说,2021年春节期间,交通运输行业特别是快递业在特殊环境下展现了极强的...
- 强调风险的量化管理,将统计分析与专家经验相结合,构建全面风险管理体系。 - 目标是最大化资本收益,与银行追求利润的目标一致。 - 重点关注两个主题:风险成本和风险资本。 - 国际先进银行采用此方法成功...
粒子群算法通过模拟自然界中生物群体的捕食、迁徙等行为,能够快速找到问题的近似最优解。本文通过引入改进机制,提高了粒子群算法的搜索效率和解的质量,使其更加适用于微电网的多目标优化调度问题。 改进粒子群...
在**课堂反馈**环节,教师应引导学生总结所学内容,概述他们的收获和疑问,同时进行教学反思,以便于不断优化教学策略,确保学生对知识的深入理解和掌握。 总之,"2017秋八年级生物上册5.2.2先天性行为和学习行为...
- **农谚**:农民在长期农业生产实践中总结出来的生活经验和智慧结晶。 - **销声匿迹**:指事物消失得无影无踪。 - **萌发**:种子或孢子发芽,也可比喻事物的发生。 - **悬殊**:差距很大。 - **风雪载途**:...