`

MySQL中快速插入大数据量和语句优化的相关技巧

 
阅读更多

来源:http://it.100xuexi.com/view/otdetail/20120610/f3fe424f-506a-4277-87dd-0a97a8d0c729.html
MySQL大数据量快速插入方法和语句优化是本文我们主要要介绍的内容,接下来我们就来一一介绍,希望能够对您有所收获!

INSERT语句的速度
插入一个记录需要的时间由下列因素组成,其中的数字表示大约比例:
连接:(3)
发送查询给服务器:(2)
分析查询:(2)
插入记录:(1x记录大小)
插入索引:(1x索引)
关闭:(1)
这不考虑打开表的初始开销,每个并发运行的查询打开。
表的大小以logN (B树)的速度减慢索引的插入。

加快插入的一些方法:
如果同时从同一个客户端插入很多行,使用含多个VALUE的INSERT语句同时插入几行。这比使用单行INSERT语句快(在某些情况下快几倍)。如果你正向一个非空表添加数据,可以调节bulk_insert_buffer_size变量,使数据插入更快。参见5.3.3节,“服务器系统变量”。
如果你从不同的客户端插入很多行,能通过INSERT DELAYED语句加快速度。参见13.2.4节,“INSERT语法”。
用MyISAM,如果在表中没有删除的行,能在SELECT语句正在运行的同时插入行。
当从一个文本文件装载一个表时,使用LOAD DATA INFILE。这通常比使用很多INSERT语句快20倍。参见13.2.5节,“LOAD DATA INFILE语法”。
当表有很多索引时,有可能要多做些工作使得LOAD DATA INFILE更快些。使用下列过程:

有选择地用CREATE TABLE创建表。
执行FLUSH TABLES语句或命令mysqladmin flush-tables。使用myisamchk --keys-used=0 -rq /path/to/db/tbl_name。这将从表中取消所有索引的使用。
用LOAD DATA INFILE把数据插入到表中,因为不更新任何索引,因此很快。 如果只想在以后读取表,使用myisampack压缩它。参见15.1.3.3节,“压缩表特性”。
 
用myisamchk -r -q /path/to/db/tbl_name重新创建索引。这将在写入磁盘前在内存中创建索引树,并且它更快,因为避免了大量磁盘搜索。结果索引树也被完美地平衡。 执行FLUSH TABLES语句或mysqladmin flush-tables命令。
请注意如果插入一个空MyISAM表,LOAD DATA INFILE也可以执行前面的优化;主要不同处是可以让myisamchk为创建索引分配更多的临时内存,比执行LOAD DATA INFILE语句时为服务器重新创建索引分配得要多。

也可以使用ALTER TABLE tbl_name DISABLE KEYS代替myisamchk --keys-used=0 -rq/path/to/db/tbl_name,使用ALTER TABLE tbl_name ENABLE KEYS代替myisamchk -r -q/path/to/db/tbl_name。使用这种方式,还可以跳过FLUSH TABLES。
锁定表可以加速用多个语句执行的INSERT操作:
1. LOCK TABLES a WRITE;   
2. INSERT INTO a VALUES (1,23),(2,34),(4,33);   
3. INSERT INTO a VALUES (8,26),(6,29);   
4. UNLOCK TABLES;  
这样性能会提高,因为索引缓存区仅在所有INSERT语句完成后刷新到磁盘上一次。一般有多少INSERT语句即有多少索引缓存区刷新。如果能用一个语句插入所有的行,就不需要锁定。

对于事务表,应使用BEGIN和COMMIT代替LOCK TABLES来加快插入。
锁定也将降低多连接测试的整体时间,尽管因为它们等候锁定最大等待时间将上升。例如:
1. Connection 1 does 1000 inserts  
2. Connections 2, 3, and 4 do 1 insert  
3. Connection 5 does 1000 inserts  
如果不使用锁定,2、3和4将在1和5前完成。如果使用锁定,2、3和4将可能不在1或5前完成,但是整体时间应该快大约40%。
INSERT、UPDATE和DELETE操作在MySQL中是很快的,通过为在一行中多于大约5次连续不断地插入或更新的操作加锁,可以获得更好的整体性能。如果在一行中进行多次插入,可以执行LOCK TABLES,随后立即执行UNLOCK TABLES(大约每1000行)以允许其它的线程访问表。这也会获得好的性能。
INSERT装载数据比LOAD DATA INFILE要慢得多,即使是使用上述的策略。
为了对LOAD DATA INFILE和INSERT在MyISAM表得到更快的速度,通过增加key_buffer_size系统变量来扩大 键高速缓冲区。参见7.5.2节,“调节服务器参数”。

INSERT语法
1. INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE]  
2. [INTO] tbl_name [(col_name,...)]  
3. VALUES ({expr | DEFAULT},...),(...),...  
4. [ ON DUPLICATE KEY UPDATE col_name=expr, ... ] 
或:
1. INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE]  
2. [INTO] tbl_name  
3. SET col_name={expr | DEFAULT}, ...  
4. [ ON DUPLICATE KEY UPDATE col_name=expr, ... ] 
或:
1. INSERT [LOW_PRIORITY | HIGH_PRIORITY] [IGNORE]  
2. [INTO] tbl_name [(col_name,...)]  
3. SELECT ...  
4. [ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

一、DELAYED 的使用
使用延迟插入操作DELAYED调节符应用于INSERT和REPLACE语句。当DELAYED插入操作到达的时候,服务器把数据行放入一个队列中,并立即给客户端返回一个状态信息,这样客户端就可以在数据表被真正地插入记录之前继续进行操作了。如果读取者从该数据表中读取数据,队列中的数据就会被保持着,直到没有读取者为止。

接着服务器开始插入延迟数据行(delayed-row)队列中的数据行。在插入操作的同时,服务器还要检查是否有新的读取请求到达和等待。如果有,延迟数据行队列就被挂起,允许读取者继续操作。当没有读取者的时候,服务器再次开始插入延迟的数据行。这个过程一直进行,直到队列空了为止。

几点要注意事项:
INSERT DELAYED应该仅用于指定值清单的INSERT语句。服务器忽略用于INSERT DELAYED...SELECT语句的DELAYED。服务器忽略用于INSERT DELAYED...ON DUPLICATE UPDATE语句的DELAYED。
因为在行被插入前,语句立刻返回,所以您不能使用LAST_INSERT_ID()来获取AUTO_INCREMENT值。AUTO_INCREMENT值可能由语句生成。

对于SELECT语句,DELAYED行不可见,直到这些行确实被插入了为止。
DELAYED在从属复制服务器中被忽略了,因为DELAYED不会在从属服务器中产生与主服务器不一样的数据。注意,目前在队列中的各行只保存在存储器中,直到它们被插入到表中为止。这意味着,如果您强行中止了mysqld(例如,使用kill -9)或者如果mysqld意外停止,则所有没有被写入磁盘的行都会丢失。

二、IGNORE的使用
IGNORE是MySQL相对于标准SQL的扩展。如果在新表中有重复关键字,或者当STRICT模式启动后出现警告,则使用IGNORE控制ALTER TABLE的运行。
如果没有指定IGNORE,当重复关键字错误发生时,复制操作被放弃,返回前一步骤。
如果指定了IGNORE,则对于有重复关键字的行,只使用第一行,其它有冲突的行被删除。并且,对错误值进行修正,使之尽量接近正确值。insert ignore into tb(...) value(...)这样不用校验是否存在了,有则忽略,无则添加。
 
三、ON DUPLICATE KEY UPDATE的使用
如果您指定了ON DUPLICATE KEY UPDATE,并且插入行后会导致在一个UNIQUE索引或PRIMARY KEY中出现重复值,则执行旧行UPDATE。例如,如果列a被定义为UNIQUE,并且包含值1,则以下两个语句具有相同的效果:
1. mysql> INSERT INTO table (a,b,c) VALUES (1,2,3)  
2. -> ON DUPLICATE KEY UPDATE cc=c+1;  
3. mysql> UPDATE table SET cc=c+1 WHERE a=1;  
4.  
如果行作为新记录被插入,则受影响行的值为1;如果原有的记录被更新,则受影响行的值为2。
注释:如果列b也是唯一列,则INSERT与此UPDATE语句相当:
1. mysql> UPDATE table SET cc=c+1 WHERE a=1 OR b=2 LIMIT 1; 
如果a=1 OR b=2与多个行向匹配,则只有一个行被更新。通常,您应该尽量避免对带有多个唯一关键字的表使用ON DUPLICATE KEY子句。您可以在UPDATE子句中使用VALUES(col_name)函数从INSERT…UPDATE语句的INSERT部分引用列值。换句话说,如果没有发生重复关键字冲突,则UPDATE子句中的VALUES(col_name)可以引用被插入的col_name的值。本函数特别适用于多行插入。VALUES()函数只在INSERT…UPDATE语句中有意义,其它时候会返回NULL。

示例:
1. mysql> INSERT INTO table (a,b,c) VALUES (1,2,3),(4,5,6)  
2. -> ON DUPLICATE KEY UPDATE c=VALUES(a)+VALUES(b); 
本语句与以下两个语句作用相同:
1. mysql> INSERT INTO table (a,b,c) VALUES (1,2,3)  
2. -> ON DUPLICATE KEY UPDATE c=3;  
3. mysql> INSERT INTO table (a,b,c) VALUES (4,5,6)  
4. -> ON DUPLICATE KEY UPDATE c=9; 
当您使用ON DUPLICATE KEY UPDATE时,DELAYED选项被忽略。
关于MySQL大数据量快速插入方法和语句优化的操作就介绍到这里了,希望本次的介绍能够对您有所收获!

作者:lyd518 CSDN博客


分享到:
评论

相关推荐

    MySQL 大数据量快速插入方法和语句优化分享

    在处理大数据量的数据库操作时,优化MySQL的插入方法和语句显得至关重要,尤其是在事务处理中。本篇文章主要探讨如何高效地实现大数据量的快速插入,以及如何通过语句优化提高性能。 首先,针对事务表,推荐使用...

    MySQL大数据量快速插入方法和语句优化

    MySQL大数据量快速插入方法和语句优化是本文我们主要要介绍的内容,接下来我们就来一一介绍,希望能够对您有所收获!插入一个记录需要的时间由下列因素组成,其中的数字表示大约比例:连接:(3)发送查询给服务器:...

    mysql大批量数据插入

    使用批量插入语句是实现 MySQL 大批量数据插入的有效方法,能够提高数据插入的速度和效率。 知识点: 1. MySQL 大批量数据插入的需求和挑战 2. 使用批量插入语句实现大批量数据插入 3. 批量插入语句的格式和使用...

    C#在MySQL大量数据下的高效读取、写入详解

    在C#中与MySQL数据库进行大规模数据交互时,性能优化是关键,特别是在处理千万级别的数据。本文将探讨如何高效地读取和写入大量数据,主要分为三个步骤:解决读取问题、数据处理和数据插入。 ### 第一步:解决读取...

    MySQL大数据量分页查询方法及其优化

    ### MySQL大数据量分页查询方法及其优化 在处理大规模数据集时,MySQL的分页查询是非常常见的需求之一。为了提高查询效率,减少响应时间和资源消耗,开发者需要掌握多种不同的分页查询方法及其优化技巧。本文将详细...

    MySQL语句优化的原则

    ### MySQL语句优化的核心原则与实践 #### 一、索引的重要性及合理设计 1. **索引的作用**:索引能够显著加快数据检索的...通过以上原则和技术的应用,可以有效地优化MySQL查询性能,提高系统的整体响应速度和吞吐量。

    高效处理MySQL中的大数据量插入与查询策略

    ### 高效处理MySQL中的大数据量插入与查询策略 在数据驱动的世界中,数据库系统面临着巨大的挑战,尤其是在处理大量数据时。对于像MySQL这样的关系型数据库管理系统而言,大数据量的插入和查询操作可能会成为性能...

    C#.NET中如何批量插入大量数据到数据库中

    3. **分批次插入**:如果数据量非常大,可以考虑分批插入,每次处理一部分数据,避免一次性加载所有数据导致内存压力过大。 4. **优化数据库设计**:确保目标表有良好的索引和分区策略,可以进一步提高插入速度。 ...

    mysql大数据量优化

    MySQL数据库在处理大数据量时,性能优化至关重要。以下是一些关键的优化策略和技术: 1. **连接查询与子查询优化**: - **连接查询**(JOIN):当需要从多个表中获取关联数据时,使用连接查询通常比子查询更有效率...

    批量插入大量数据

    在数据库操作中,批量插入大量数据是常见的性能优化策略,特别是在大数据处理或系统初始化时。批量插入能够显著减少网络通信次数,提升效率,降低数据库事务的开销。本例展示了如何在4秒内高效地插入10万条数据,...

    大数据量测试数据(MySQL)

    在这个主题中,我们关注的是如何利用MySQL进行大数据量的测试和优化。提供的压缩包文件包含了一系列的SQL脚本和数据备份,用于创建表格、导入数据并进行性能测试。 首先,`employees.sql` 文件是核心,它包含了创建...

    mysql数据插入效率比较

    在MySQL数据库中,数据插入效率是数据库性能优化的关键因素,特别是在大数据量的场景下。本文主要探讨了四种不同的数据插入方式及其效率差异。 1. 单条插入:这是最基本的方式,通过for循环逐条执行INSERT语句。...

    提高mysql插入数据的速度.pdf

    例如,可以在一个INSERT语句中一次性插入多行数据,而不是一条一条地插入。使用“INSERT INTO table_name VALUES (...), (...), (...);”的格式可以实现这一点。 2. 调整MySQL配置参数: - `bulk_insert_buffer_...

    【No206】最新精选蚂蚁-MySQL语句性能优化视频教程下载

    随着数据量的增长和技术的发展,如何提高MySQL数据库的性能成为了企业和开发者关注的重点之一。SQL语句作为与数据库交互的主要方式,其执行效率直接影响到应用的整体性能。 #### 二、SQL语句优化基础 1. **查询...

    向数据库插入blob数据实例源码--在mysql中通过

    综上所述,本实例展示了如何在MySQL数据库中创建Blob字段、插入和查询Blob数据。源码中可能包含了类似的实现,通过解压提供的"向数据库插入blob数据实例源码"压缩包,你可以查看并运行完整的Java代码示例。

    MySQL批量SQL插入各种性能优化.docx

    MySQL数据库在处理大量数据插入时,性能优化是至关重要的,尤其是在报表系统等需要频繁批量插入数据的应用场景。以下是一些针对MySQL批量SQL插入的性能优化策略: 1. **批量插入数据** - 传统的做法是逐条插入数据...

    python工具-excel批量导入mysql (几千万数据半小时可搞定)

    由于大数据量可能导致内存溢出,我们可以分批写入数据,比如每次处理10000行: ```python def batch_insert(connection, df, table_name, chunksize=10000): for chunk in df.iterrows(chunksize=chunksize): ...

    利用poi获取excel数据批量插入大量数据到mysql

    注意,你需要根据实际情况替换`excelFilePath`、`dbUrl`、`username`、`password`以及SQL语句中的`your_table`、`column1`、`column2`等信息。此外,`cellToString`方法需要针对不同类型的单元格进行处理,如日期、...

    MySQL批量SQL插入性能优化详解

    MySQL批量SQL插入性能优化是数据库管理员和开发人员面临的重要任务,特别是在处理大数据量的系统时。本文将深入探讨几种能够显著提升MySQL InnoDB存储引擎插入性能的方法。 首先,一种有效的优化策略是通过合并多条...

Global site tag (gtag.js) - Google Analytics