- 浏览: 253396 次
- 性别:
- 来自: 长沙
文章分类
最新评论
-
maozilee:
njoiop 写道看得懂吗,看到这个还不错(http://ww ...
使用百度地图API将谷歌地图坐标转换为百度地图坐标 -
njoiop:
看得懂吗,看到这个还不错(http://www.haoserv ...
使用百度地图API将谷歌地图坐标转换为百度地图坐标 -
di1984HIT:
不错。,不错
MySQL 5.5中使用UNIX_TIMESTAMP分区【按天】 -
zhouhongyan123:
js地址变了!! http://developer.baidu ...
GPS定位转百度坐标,精度很高! -
tanier53:
那我最近也在做大批量导入这个功能,你说得比较好,但我有疑问数据 ...
用Java向数据库中插入大量数据时的优化
mysql 5.1已经到了beta版,官方网站上也陆续有一些文章介绍,比如上次看到的Improving Database Performance with Partitioning。在使用分区的前提下,可以用mysql实现非常大的数据量存储。今天在mysql的站上又看到一篇进阶的文章 —— 按日期分区存储。如果能够实现按日期分区,这对某些时效性很强的数据存储是相当实用的功能。下面是从这篇文章中摘录的一些内容。
错误的按日期分区例子
最直观的方法,就是直接用年月日这种日期格式来进行常规的分区:
-
mysql> create table rms (d date)
-
-> partition by range (d)
-
-> (partition p0 values less than ('1995-01-01'),
-
-> partition p1 VALUES LESS THAN ('2010-01-01'));
上面的例子中,就是直接用"Y-m-d"的格式来对一个table进行分区,可惜想当然往往不能奏效,会得到一个错误信息:
ERROR 1064 (42000): VALUES value must be of same type as partition function near '),
partition p1 VALUES LESS THAN ('2010-01-01'))' at line 3
上述分区方式没有成功,而且明显的不经济,老练的DBA会用整型数值来进行分区:
-
mysql> CREATE TABLE part_date1
-
-> ( c1 int default NULL,
-
-> c2 varchar(30) default NULL,
-
-> c3 date default NULL) engine=myisam
-
-> partition by range (cast(date_format(c3,'%Y%m%d') as signed))
-
-> (PARTITION p0 VALUES LESS THAN (19950101),
-
-> PARTITION p1 VALUES LESS THAN (19960101) ,
-
-> PARTITION p2 VALUES LESS THAN (19970101) ,
-
-> PARTITION p3 VALUES LESS THAN (19980101) ,
-
-> PARTITION p4 VALUES LESS THAN (19990101) ,
-
-> PARTITION p5 VALUES LESS THAN (20000101) ,
-
-> PARTITION p6 VALUES LESS THAN (20010101) ,
-
-> PARTITION p7 VALUES LESS THAN (20020101) ,
-
-> PARTITION p8 VALUES LESS THAN (20030101) ,
-
-> PARTITION p9 VALUES LESS THAN (20040101) ,
-
-> PARTITION p10 VALUES LESS THAN (20100101),
-
-> PARTITION p11 VALUES LESS THAN MAXVALUE );
-
Query OK, 0 rows affected (0.01 sec)
搞定?接着往下分析
-
mysql> explain partitions
-
-> select count(*) from part_date1 where
-
-> c3> date '1995-01-01' and c3 <date '1995-12-31'\G
-
*************************** 1. row ***************************
-
id: 1
-
select_type: SIMPLE
-
table: part_date1
-
partitions: p0,p1,p2,p3,p4,p5,p6,p7,p8,p9,p10,p11
-
type: ALL
-
possible_keys: NULL
-
key: NULL
-
key_len: NULL
-
ref: NULL
-
rows: 8100000
-
Extra: Using where
-
1 row in set (0.00 sec)
万恶的mysql居然对上面的sql使用全表扫描,而不是按照我们的日期分区分块查询。原文中解释到MYSQL的优化器并不认这种日期形式的分区,花了大量的篇幅来引诱俺走上歧路,过分。
正确的日期分区例子
mysql优化器支持以下两种内置的日期函数进行分区:
- TO_DAYS()
- YEAR()
看个例子:
-
mysql> CREATE TABLE part_date3
-
-> ( c1 int default NULL,
-
-> c2 varchar(30) default NULL,
-
-> c3 date default NULL) engine=myisam
-
-> partition by range (to_days(c3))
-
-> (PARTITION p0 VALUES LESS THAN (to_days('1995-01-01')),
-
-> PARTITION p1 VALUES LESS THAN (to_days('1996-01-01')) ,
-
-> PARTITION p2 VALUES LESS THAN (to_days('1997-01-01')) ,
-
-> PARTITION p3 VALUES LESS THAN (to_days('1998-01-01')) ,
-
-> PARTITION p4 VALUES LESS THAN (to_days('1999-01-01')) ,
-
-> PARTITION p5 VALUES LESS THAN (to_days('2000-01-01')) ,
-
-> PARTITION p6 VALUES LESS THAN (to_days('2001-01-01')) ,
-
-> PARTITION p7 VALUES LESS THAN (to_days('2002-01-01')) ,
-
-> PARTITION p8 VALUES LESS THAN (to_days('2003-01-01')) ,
-
-> PARTITION p9 VALUES LESS THAN (to_days('2004-01-01')) ,
-
-> PARTITION p10 VALUES LESS THAN (to_days('2010-01-01')),
-
-> PARTITION p11 VALUES LESS THAN MAXVALUE );
-
Query OK, 0 rows affected (0.00 sec)
以to_days()函数分区成功,我们分析一下看看:
-
mysql> explain partitions
-
-> select count(*) from part_date3 where
-
-> c3> date '1995-01-01' and c3 <date '1995-12-31'\G
-
*************************** 1. row ***************************
-
id: 1
-
select_type: SIMPLE
-
table: part_date3
-
partitions: p1
-
type: ALL
-
possible_keys: NULL
-
key: NULL
-
key_len: NULL
-
ref: NULL
-
rows: 808431
-
Extra: Using where
-
1 row in set (0.00 sec)
可以看到,mysql优化器这次不负众望,仅仅在p1分区进行查询。在这种情况下查询,真的能够带来提升查询效率么?下面分别对这次建立的part_date3和之前分区失败的part_date1做一个查询对比:
-
mysql> select count(*) from part_date3 where
-
-> c3> date '1995-01-01' and c3 <date '1995-12-31';
-
+----------+
-
| count(*) |
-
+----------+
-
| 805114 |
-
+----------+
-
1 row in set (4.11 sec)
-
-
mysql> select count(*) from part_date1 where
-
-> c3> date '1995-01-01' and c3 <date '1995-12-31';
-
+----------+
-
| count(*) |
-
+----------+
-
| 805114 |
-
+----------+
-
1 row in set (40.33 sec)
可以看到,分区正确的话query花费时间为4秒,而分区错误则花费时间40秒(相当于没有分区),效率有90%的提升!所以我们千万要正确的使用分区功能,分区后务必用explain验证,这样才能获得真正的性能提升。
热切期待msyql 5.1稳定版发布!
发表评论
-
BoneCP学习笔记——配置参数
2012-09-01 00:01 1381一、BoneCP配置文件格式( ... -
常用MySQL配置以及修改最大连接数的3种方法
2012-08-30 10:20 2404修改 MYSQL 最大连接数的3种方法: 方法一:进入M ... -
MySQL 忘记密码重置密码
2011-12-20 11:30 1009分别在Windows下和Linux下重置了MYSQL的root ... -
CentOS下配置MySQL (Linux文件系统移动MySQL数据库的位置)
2011-12-12 17:08 2249一、下载MySQL的安装文件 完全安装MySQL需要下 ... -
#2002 无法登录 MySQL 服务器
2011-12-12 17:03 5916#2002 – 服务器没有响应 (或者本地 MySQL ... -
CentOS 5.5使用yum安装Apache+PHP+MySQL
2011-12-12 12:26 1724本文摘自互联网,COPY主义,也要申明一下! ... -
CentOS yum安装mysql后 Can’t connect to local MySQL server through socket ‘/var/lib/
2011-12-12 12:22 3251CentOS Can’t connect to loca ... -
MySQL的奇异表现
2011-10-28 16:44 937发现mysql的 类型如果为varchar,那么,它依然能够进 ... -
启用MySQL慢查询查看日志配置方法
2011-10-07 12:49 1378MySQL慢查询记录日志对于跟踪PHP+MySQL体系下的 ... -
mysql_secure_installation
2011-10-07 12:43 3759打开终端,输入 ... -
MySQL更改默认数据文件存储目录
2011-10-07 12:39 2732很多朋友都遇到过在CentOS Linux下用RPM或是 ... -
Innodb如何使用内存
2011-09-24 12:36 0译这个文章的目的: 最近经常被问起Innodb是 ... -
mysql给同一个表添加多个索引的测试
2011-09-27 21:05 1312分别给xc表添加ind_name和ind_status ... -
MySQL慢查询的2种分析方案
2011-09-27 21:04 840以下的文章主要介绍的是MySQL慢查询分析方法,前一段日 ... -
MySQL 5.5中使用UNIX_TIMESTAMP分区【按天】
2011-09-25 00:09 5203RT不用多说,同行一看 ... -
MySQL性能优化——设计篇
2011-09-23 22:36 0设计篇 最近项目中,我们常常碰到单表过5亿的情况出现, ... -
MySQL 5.5 使用 Event定期自动维护/执行Procedure
2011-09-27 21:04 3634最近有个项目,对于数据库的并发性要求很高,对于事物,Rollb ... -
准备升级到:MySQL 5.5!
2011-09-23 15:55 2196MySQL进入Oracle产品体系 ... -
MySQL灾难恢复之官方方法
2011-09-23 15:51 1085备份你可以用 mysqldump 工具。 定时,你可以 ... -
MySQL Replace INTO的高级使用
2011-09-23 12:58 975REPLACE的运行与INSERT很相 ...
相关推荐
2. **分区功能增强**:在 MySQL 5.1 中,用户可以对大表进行分区,以提高查询性能。分区可以基于哈希、范围、列表或线性哈希等多种方式。 3. **复制功能优化**:MySQL 5.1 提供了半同步复制,确保主库上的事务在被...
- 表分区是MySQL 5.1引入的新特性,允许将大表分成多个逻辑部分,提高查询性能,简化管理和备份。 5. **触发器和存储过程**: - MySQL 5.1支持创建触发器和存储过程,提供了更复杂的业务逻辑处理能力,可以在...
分区可以根据哈希、范围、列表或按时间(如日期)进行。 3. **触发器**:MySQL 5.1支持触发器,这是一种数据库对象,可以在特定的数据库操作(如INSERT、UPDATE、DELETE)前后自动执行指定的SQL语句,增加了数据库...
详细介绍mysql5.1 分区技术,通过对list range hash key四种分区技术的举例阐述Mysql分区,18.2.1. RANGE分区 18.2.2. LIST分区 18.2.3. HASH分区 18.2.4. KEY分区 18.2.5. 子分区 18.2.6. MySQL分区处理NULL值的...
其次,MySQL 5.1加强了分区功能。分区允许大型表的数据分散到多个物理存储上,从而提高查询速度。支持多种分区策略,如范围、哈希、列表和复合分区,可以根据不同的业务需求灵活选择。 在查询优化方面,MySQL 5.1的...
- 在日志记录系统中,可以按日期范围分区,方便存储和查询历史数据。 - 在订单系统中,可以按客户ID或订单号进行哈希分区,实现快速访问特定客户或订单数据。 6. **MySQL 5.1的分区改进**: - 增加了对更多数据...
这篇文档将基于提供的"mysql5.1CHM.zip"压缩包,深入探讨MySQL 5.1的主要特性和开发相关的知识。 1. **SQL语言与查询优化**: MySQL 5.1支持标准的SQL语法,包括SELECT、INSERT、UPDATE、DELETE等操作。其查询优化...
MySQL 5.1是MySQL数据库管理系统的一个重要版本,它提供了许多功能和改进,旨在提高性能、稳定性和可扩展性。本参考手册详细介绍了这个版本的各项特性和使用方法,是学习和工作中不可或缺的参考资料。 首先,MySQL ...
这份“MYSQL5.1+简体中文参考文档”是开发者和数据库管理员的重要参考资料,它包含了关于 MySQL 5.1 的详细信息,包括 SQL 语法、数据库配置、管理操作以及性能调优等内容。 一、SQL 语法 MySQL 5.1 支持标准的 SQL...
2. **分区功能**:MySQL 5.1引入了表分区,允许将大表划分为更小、更易管理的部分,从而提高查询性能和管理效率。 3. **触发器和存储过程**:MySQL 5.1支持触发器和存储过程,可以实现复杂的业务逻辑,减少应用程序...
对于“可视化MySQL5.1中文版”标签,这意味着该版本提供了中文界面和文档,使得中国用户可以更方便地使用和理解MySQL的功能。可视化工具如phpMyAdmin、MySQL Workbench等可以帮助用户直观地管理数据库,创建、编辑和...
2. **分区功能**:MySQL5.1扩展了分区功能,允许用户将大表分成多个逻辑部分,以提高查询速度和管理效率。支持多种分区类型,如范围分区、哈希分区、列表分区等,可以根据日期、ID或其他列值进行分区。 3. **复制...
2. **分区功能**:MySQL 5.1引入了表分区功能,允许将大表分成多个逻辑部分,提高查询性能和管理效率。根据时间、范围、哈希等多种方式进行分区,可以优化特定类型的查询。 3. **查询优化器**:MySQL 5.1的查询优化...
MySQL 5.1中文文档是针对广大中文用户精心编译的一份技术资料,旨在帮助那些英语不精通或者希望用母语进行学习的开发者更轻松地掌握MySQL数据库管理系统。MySQL是一款广泛应用的关系型数据库系统,以其开源、免费、...
2. **MySQL 5.1版本特点**:MySQL 5.1带来了增强的性能和可扩展性,包括InnoDB存储引擎的改进,支持更大的表和索引,以及分区功能。此外,它还引入了存储过程、触发器、视图和事务处理等高级数据库特性。 3. **安装...
1. **分区功能增强**:MySQL 5.1支持更广泛的分区策略,如线性哈希、范围和列表分区,这有助于改善大数据量表的查询性能和管理效率。 2. **存储引擎多样化**:InnoDB作为默认的事务处理引擎,在5.1版本中得到进一步...
在这个例子中,"MySQL5.1官方中文版"应该是包含了安装程序的压缩包。 2. **解压文件**:下载完成后,使用解压缩工具(如WinRAR或7-Zip)打开压缩包,提取所有文件。文件“说明.htm”可能会包含详细的安装指南和注意...
这个压缩包中的“mysql5.1参考手册.chm”是该版本的中文参考手册,对于学习和理解MySQL 5.1的特性和操作至关重要。 MySQL是一款开源的关系型数据库管理系统(RDBMS),它基于SQL标准并提供了高性能、高可靠性和易用...
MySQL 5.1支持RANGE、LIST、HASH、KEY分区,理解不同分区策略的适用场景。 8. **安全性**:理解用户权限管理,如GRANT和REVOKE命令,以及如何创建和管理SSL连接以增强数据传输的安全性。 9. **备份与恢复**:定期...