大数据的批量更新方法 - 爱，促进自我完善！ - ITeye博客

`

李时增

浏览: 157955 次
性别:
来自: 益阳

最近访客更多访客>>

一共丢七只羊

elashu

koudingpie

xionghu

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

qzg196：楼主啊我用的4.0的服务器版。为什么配置好后地址已经跳转 ...
CAS-3.2.1自定义客户端登录界面----完整篇
月色无夜：楼主你附带在项目中的证书导入密码是什么？
CAS-3.2.1自定义客户端登录界面----完整篇
zws_miss： AuthenticationViaFormAction 这 ...
CAS-3.2.1自定义客户端登录界面----完整篇
hotapple： ...
tomcat下摘要认证（数据库配置用户角色）+java代码模拟请求
cherishit： https的安装配置在哪里呵? 求拔刀相助
linux下：apache2.2.27 + tomcat7.0 + openssl-1.0.1g（集群+session共享|摘要认证|HTTPS）

大数据的批量更新方法

博客分类：

数据库
java

大数据表更新

阅读更多

大数据量的批量更新方法
1. 先说我遇到的难题，数据库用户表中有2400万条数据，而我需要更新所有用户的信息，前提我不能用update table_user set xxx='?',xxa='?';全表更新因为公司有规定一次提交的事物不能超过50W，显然这里已经超过了50W达到2400W的事物数据(全表更新数据特大的时候需要执行相当长的时间)，那么我将怎么更新呢？

2. 现在来说说我用什么方法去批量更新吧！思路：首先查询满足条件的数据量是多少（我的是2400万），然后决定每1万做一页，每一页由一个线程负责执行（项目规定最多同时只有30个线程跑，其余2370个线程在等待，这是个很好的控制，不然服务器受不了会挂的）；这样执行速度比全表更新还要快很多，我测试过更新2400万数据只要30分钟，而全表更新最快要60分钟，慢的时候更新不出来。

3. 第二步中显然我有意忽略了几个重点部分

查询数据量很简单，直接count一下全表
记住我的文章标题，我是批量更新，且看我真实sql:

上面没有提到我的update语句，有两个一个是更新第一段时是>=#rowidMin#与<=#rowidMax#，更新第二段时是>#rowidMin#与<=#rowidMax#这样是避免重复更新，这里贴出来：

0
顶

1
踩

分享到：

递归去除集合中的空格（集合中可能包括集合 ... | SVN环境搭建

2016-08-09 14:47
浏览 2991
评论(0)
分类:数据库
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

C#大数据批量插入Access程序: 本程序" C#大数据批量插入Access程序 "就是针对这种需求而设计的，它允许开发者高效地将大量数据导入到Access数据库中。 Access数据库虽然在处理大规模数据时可能不如SQL Server等大型数据库系统强大，但在某些场景...

Spark和Flink平台大数据批量处理的性能分析.pdf: 本篇论文名为《Spark和Flink平台大数据批量处理的性能分析》，主要探讨了当前大数据处理中广泛使用的两个开源框架Apache Spark和Apache Flink在批量处理方面的性能差异和相似之处。文章通过分析Spark和Flink这两个大...

几种数据库的大数据批量插入: "大数据批量插入之数据库篇" 在大数据时代，数据批量插入是数据库操作中不可或缺的一部分。特别是在处理大量数据时，批量插入可以大大提高数据库的写入效率。今天，我们将讨论几种数据库的大数据批量插入，包括 ...

Oracle大数据批量导出工具: 在Oracle数据库上导出上千万上亿数据的工具 cmd 到本目录然后执行如下命令： ...例如：sqluldr2.exe user=u/pass@db query="select * from u.tablename" table=tablename head=yes FILE=d:\inf.csv

Java开发实战之腾讯大数据批量导入Aaron: Java开发腾讯大数据批量导入【Aaron】，Java开发腾讯大数据

Excel读取和大数据批量导入数据库ASPNET源码: 本程序比较简单，就实现了excel的读取、存入数据库，其实写入数据库用的SqlBulkCopy大数据批量导入二、菜单功能页面就实现了两个功能 1、不需要使用数据，直接读取excel并显示出来； 2、读取excel并写入数据库...

JDBC批量插入更新删除等操作: 批量更新的原理与批量插入类似，都是通过`PreparedStatement`的`addBatch()`方法将多个更新操作加入到一个批处理队列中，然后调用`executeBatch()`方法执行这些更新操作。这种方式可以显著减少网络往返次数，提高...

c#几种数据库的大数据批量插入（SqlServer、Oracle、SQLite和MySql）: 在C#中，进行大数据批量插入到不同的数据库如SQL Server、Oracle、SQLite和MySQL时，开发者需要考虑每个数据库系统的特性和API。以下是对这四种数据库批量插入操作的详细讲解： 1. **SQL Server批量插入** SQL ...

EF批量更新、批量插入、批量删除使用的是EFUtilities,免费的操作简单，速度超级快: 为了提高性能，开发人员可以利用第三方库，如EFUtilities，来进行批量的插入、更新和删除操作。 EFUtilities是针对Entity Framework设计的一个扩展，它的主要目的是优化大数据操作的性能。这个库提供了一种简单且...

批量导入数据，大数据导入: 在IT行业中，批量导入数据和大数据导入是两个关键任务，特别是在数据分析、数据库管理和大数据处理领域。这些操作对于高效地处理海量信息至关重要。本篇将详细阐述这两个知识点。首先，批量导入数据是指一次性处理...

表格纵向合并汇总-千万级大数据批量excel表格合并汇总: 支持批量，一键自动合并支持xlsx、csv、xls 支持按表头合并支持表头不一致，意义相同的表头合并支持自定义列、自定义sheet 支持跳过表头尾说明行支持自定义子表数据行数支持添加数据来源列支持跳过空白列支持...

行业分类-设备装置-大数据的写入方法和装置、读取方法和装置及处理系统.zip: "行业分类-设备装置-大数据的写入方法和装置、读取方法和装置及处理系统.zip"这一压缩包中，主要涵盖了大数据存储和访问的核心技术。下面我们将详细探讨这些关键知识点。 1. **大数据的写入方法**：大数据写入通常...

c#实现几种数据库的大数据批量插入: 在C#中，进行大数据批量插入到不同的数据库如SQL Server、Oracle、SQLite和MySQL是常见的需求，这可以显著提高数据处理效率。以下将详细介绍如何在这些数据库中实现批量插入。首先，我们关注C#中一个关键接口`...

springboot + jpa 批量存储示例: JPA没有内置的批量保存方法，但我们可以利用`saveAll()`方法来实现批量插入或更新。例如，我们有一个用户列表，想要一次性保存到数据库： ```java List<User> userList = ... // 初始化用户列表 userRepository....

基于增量贝叶斯分类的自适应访问大数据的统计方法.zip: 在大数据环境下，数据量持续增长，传统的批量学习方法难以应对，因为它们需要一次性加载所有数据进行训练，这在资源和时间上都是不切实际的。增量学习则允许模型随着新数据的不断到来而逐步更新，减少了对内存的需求...

大数据平台建设方法解决方案.pptx: 大数据平台建设方法解决方案大数据平台建设方案旨在帮助企业适应数字化转型，有效地管理和利用海量的数据资源。随着互联网、移动设备和物联网的迅速发展，数据量呈现爆炸式增长，预计到2020年全球数据使用量将达到...

分析智能电网大数据流式处理方法与状态监测异常检测.docx: 因此，传统的批量数据处理方法已不能满足这一需求，大数据流式处理方法应运而生。在数据流式处理的系统架构中，通常包含数据采集、数据处理、流式计算和数据存储四个关键环节。在数据采集阶段，分布式采集系统负责...

绿色-批量大数据筛选剔除非微信用户.zip: "绿色-批量大数据筛选剔除非微信用户.zip" 这个压缩包文件，显然为我们提供了一个针对特定目标——非微信用户的批量数据过滤工具。下面将详细探讨相关知识点。首先，我们要理解“批量”这一概念。在大数据领域，...

试论智能电网大数据流式处理方法与状态异常检测.pdf: 【智能电网大数据流式处理方法】智能电网大数据流式处理是一种高效的数据管理和分析技术，它在供电企业中扮演着至关重要的角色。随着城市用电需求的增长和多样化的用电要求，供电企业需要更科学地管理和整合数据信息...

Global site tag (gtag.js) - Google Analytics