`
grzrt
  • 浏览: 188779 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

MySQL水平分区表初体验总结

 
阅读更多

本文总结个这段时间研究MySQL水平分区表总结,列举分区表的相关操作和通过实际数据对分区表读写的性能比较.

在网上看了很多文章,都太过于概念,注意集中在介绍分区表的优点,而不注重时间操作,跟大学教授论文似的,唯一由于的一片文章和大家分享一下吧http://fanqiang.chinaunix.net/db/mysql/2006-05-08/4135.shtml.

MySQL分区表操作代码(本案例按月分区):

1.        创建分区表:

        CREATE TABLE `表名` (

      `EQUIPMENTID`char(17) NOT NULL,

      `ATTRIBUTEID`char(4) NOT NULL,

      `VALUE`varchar(20) NOT NULL,

      `COLLECTTIME`datetime NOT NULL

) ENGINE=InnoDB(适用大部分引擎,可根据需要调整) DEFAULT CHARSET=latin1

PARTITION BY RANGE(to_days(`时间字段名`))

(PARTITION pminVALUES LESS THAN (to_days('2010-01-01')),

PARTITION p201001VALUES LESS THAN (to_days('2010-02-01')) ,

PARTITION p201002VALUES LESS THAN (to_days('2010-03-01')) ,

PARTITION p201003VALUES LESS THAN (to_days('2010-04-01')) ,

PARTITION p201004VALUES LESS THAN (to_days('2010-05-01')) ,

PARTITION p201005VALUES LESS THAN (to_days('2010-06-01')) ,

PARTITION p201006VALUES LESS THAN (to_days('2010-07-01')) ,

PARTITION p201007VALUES LESS THAN (to_days('2010-08-01')) ,

PARTITION p201008VALUES LESS THAN (to_days('2010-09-01')) ,

PARTITION p201009VALUES LESS THAN (to_days('2010-10-01')) ,

PARTITION p201010VALUES LESS THAN (to_days('2010-11-01')),

PARTITION p201011VALUES LESS THAN (to_days('2010-12-01')),

PARTITION p201012VALUES LESS THAN (to_days('2011-01-01')),

PARTITION pmax VALUESLESS THAN MAXVALUE );

 

2.        为现有表创建分区:

        alter table 表名

PARTITION BY RANGE(to_days(`时间字段名`))

(PARTITION pminVALUES LESS THAN (to_days('2010-01-01')),

PARTITION p201001VALUES LESS THAN (to_days('2010-02-01')) ,

PARTITION p201002VALUES LESS THAN (to_days('2010-03-01')) ,

PARTITION p201003VALUES LESS THAN (to_days('2010-04-01')) ,

PARTITION p201004 VALUESLESS THAN (to_days('2010-05-01')) ,

PARTITION p201005VALUES LESS THAN (to_days('2010-06-01')) ,

PARTITION p201006VALUES LESS THAN (to_days('2010-07-01')) ,

PARTITION p201007VALUES LESS THAN (to_days('2010-08-01')) ,

PARTITION p201008VALUES LESS THAN (to_days('2010-09-01')) ,

PARTITION p201009VALUES LESS THAN (to_days('2010-10-01')) ,

PARTITION p201010VALUES LESS THAN (to_days('2010-11-01')),

PARTITION p201011VALUES LESS THAN (to_days('2010-12-01')),

PARTITION p201012VALUES LESS THAN (to_days('2011-01-01')),

PARTITION pmax VALUESLESS THAN MAXVALUE );

 

3.        删除表中的指定分区(删除分区会导致分区数据丢失,建议先备份):

ALTERTABLE 表名DROP PARTITION p0;

 

4.        追加表分区

需要先删除MAXVALUE分区后增加分区后再重建MAXVALUE分区,删除前需要先备份MAXVALUE分区数据.

ALTER TABLE 表名 DROPPARTITION pmax;

ALTER TABLE表名

ADD PARTITION (

PARTITION p201201VALUES LESS THAN (to_days('2012-2-1')),

PARTITION pmax VALUESLESS THAN MAXVALUE);

 

5.     查看标分区信息

SELECT

                 partition_namepart, 

                 partition_expressionexpr, 

                 partition_descriptiondescr, 

                 table_rows 

FROM

                 INFORMATION_SCHEMA.partitions 

WHERE

                TABLE_SCHEMA= schema()

        AND

TABLE_NAME='表名'; 

 

6.     查看查询语句涉及分区信息

explainpartitions

select …from 表名 where …;

性能对比:

1.        测试环境

CPU: Intel 奔腾双核 E5300

硬盘: 西数(320GB/7200/16M 蓝盘)

内存: 南亚易胜 DDR2 800MHz 1GB + 三星 DDR2 800MHz 1GB

操作系统:Windows XP

MySQL版本: 5.1.57(5.1+版本支持分区表)

 

2.        表信息

表结构:

类型

长度

 

EQUIPMENTID

char

17

主键1

ATTRIBUTEID

char

4

主键2

VALUE

varchar

20

 

COLLECTTIME

datetime

 

主键3

 

总记录数:580W

分区信息(红色为主要测试区域):

part

expr

descr

table_rows

pmin

to_days(COLLECTTIME)

734138

2686

p201001

to_days(COLLECTTIME)

734169

2511883

p201002

to_days(COLLECTTIME)

734197

192497

p201003

to_days(COLLECTTIME)

734228

811103

p201004

to_days(COLLECTTIME)

734258

82894

p201005

to_days(COLLECTTIME)

734289

109297

p201006

to_days(COLLECTTIME)

734319

555065

p201007

to_days(COLLECTTIME)

734350

742949

p201008

to_days(COLLECTTIME)

734381

525900

p201009

to_days(COLLECTTIME)

734411

89

p201010

to_days(COLLECTTIME)

734442

71665

p201011

to_days(COLLECTTIME)

734472

85964

p201012

to_days(COLLECTTIME)

734503

1612

p201101

to_days(COLLECTTIME)

734534

176

p201102

to_days(COLLECTTIME)

734562

253

p201103

to_days(COLLECTTIME)

734593

44824

p201104

to_days(COLLECTTIME)

734623

62324

p201105

to_days(COLLECTTIME)

734654

50658

p201106

to_days(COLLECTTIME)

734684

0

p201107

to_days(COLLECTTIME)

734715

0

p201108

to_days(COLLECTTIME)

734746

0

p201109

to_days(COLLECTTIME)

734776

0

p201110

to_days(COLLECTTIME)

734807

0

p201111

to_days(COLLECTTIME)

734837

0

p201112

to_days(COLLECTTIME)

734868

0

p201201

to_days(COLLECTTIME)

734899

0

p201202

to_days(COLLECTTIME)

734928

0

pmax

to_days(COLLECTTIME)

MAXVALUE

921

 

3.        查询效率对比

对比表:无分区表名nopart_data,有分区表名part_data

查询条件:select count(*) from 表名 where COLLECTTIME > 起始时间 and COLLECTTIME < 终止时间

查询耗时按照3次平均值统计
统计表:

开始时间

结束时间

查询结果

无分区耗时

有分区耗时

涉及分区

全部

5848859

6.26s

9.58s

全部

2010-5-1

2010-6-1

109086

7.04s

0.48s

pmin,p201005

2010-6-1

2010-7-1

554695

8.34s

0.38s

pmin,p201006

2010-7-1

2010-8-1

742565

7.57s

0.43s

pmin,p201007

2010-5-1

2010-7-1

663781

7.07s

0.51s

pmin,p201005,p201006

2010-6-1

2010-8-1

1297260

6.84s

1.93s

pmin,p201006,p201007

2010-5-1

2010-8-1

1406346

6.97s

2.30s

pmin,p201006,p201007,p201008

小结:

1)    分区表查询在查询上有明显优势.但在跨区查询时会有查询时间消耗,因此需要注意分区的疏密程度.

2)    每次查询都会查询pmin(第一个分区),因此需要尽量减少这个分区的数据.

 

4.        写入数据效率对比

COLLECTTIME

无分区耗时

有分区耗时

2010-5-22 15:36

0.05s

0.03s

2010-6-22 15:36

0.02s

0.05s

2010-7-22 15:36

0.03s

0.03s

小结:

1) 分区对单条数据的插入操作无较大影响.

 

以上是我对MySQL的初体验总结,没啥心得体会,只有一点点成就感,希望和大家分享.

另外分区表尚存在问题:

1,是否可将分区表设置在不同硬盘,innodb可行?

2,是否可根据多条件进行水平分区,类似group by 列1,列2...

3,是否能将分区设置成不同引擎,例如当前使用中的分区为innodb,老的分区使用MyISAM

分享到:
评论

相关推荐

    MYSQL学习资料

    MySQL水平分区表实际操作总结 Mysql水平分表 mysql水平分表和垂直分表和数据库分区 sysbench mysql 坚持不懈 sysbench安装和使用 SHOW INNODB STATUS 探秘 体验Innodb with Memcached –安装 数据切分及整合方案 ...

    mysql 性能优化与架构设计(word版)

    1. 分区与分片:通过水平分区(如哈希、范围、列表分区)或垂直分区(数据拆分)可降低单表规模,提高查询效率。分片则可以将数据分散到多个服务器,实现水平扩展。 2. 主从复制:主从复制是MySQL常见的高可用和...

    mysql数据库

    6. **可扩展性**:随着业务的增长,MySQL可以通过主从复制、分区、分片等技术进行水平或垂直扩展。 7. **丰富的API支持**:MySQL提供了多种编程语言的API,如Java的JDBC、Python的PyMySQL、PHP的PDO等,方便开发者...

    实战体验几种MysqlCluster 方案.zip

    在本实战体验中,我们将探讨几种不同的MysqlCluster配置方案,结合Java开发环境,来理解其工作原理和优势。以下是关于MySQL Cluster的一些关键知识点: 1. **分片(Sharding)**:MySQL Cluster通过数据分片实现...

    mysql-essential-5.0.91-win32

    此外,MySQL 5.0还引入了分区功能,允许大型表的数据水平分割,从而提高查询性能和管理效率。这对于大数据量的处理至关重要,尤其是对于需要进行复杂分析和报告的业务系统。 在SQL语法方面,MySQL 5.0支持更丰富的...

    MySQL优化 实战视频课程

    - **水平分区**:根据某列值将大表拆分成多个小表,提高查询效率。 - **垂直分区**:将一张大表按照列进行拆分,降低单个表的宽度。 - **组合使用**:结合水平和垂直分区技术,实现更高效的数据库管理。 #### 五、...

    mysql 5.6 原版

    2. **分区表支持**:为了进一步提高查询性能和管理大型数据库的效率,MySQL 5.6增强了对分区表的支持,使得用户能够更灵活地管理和优化数据分布。 3. **多范围读取优化**(Multi-Range Read Optimization, MRR):这...

    尚硅谷MySQL高级(周阳)_pdf_xmind_mmap

    5. **分区与分表**:如何通过分区策略改善大数据量表的查询性能,以及水平分表和垂直分表的方法。 6. **复制与集群**:MySQL的主从复制原理及配置,高可用性和读写分离策略,以及集群搭建与管理。 7. **备份与恢复...

    effective mysql中文版 高清版 很清晰

    《Effective MySQL》是一本深入探讨MySQL数据库管理与优化的专业书籍,中文版的高清版提供了清晰易读的阅读体验。本书旨在帮助读者提升在MySQL环境中的工作效率,通过一系列实用的建议和最佳实践,来优化数据库性能...

    Mysql_Optimizationl.rar_mysql 优化

    - **分区与分片**:大表可以通过垂直分区(字段划分)或水平分区(数据划分)来分散负载,分片则是在多个服务器上分配数据。 - **缓存策略**:使用如Redis或Memcached等缓存系统,减少对数据库的直接访问。 4. **...

    优化MySQL数据库性能的八大妙手.rar

    本文将详细介绍优化MySQL数据库性能的八大妙手,帮助你提升数据库效率,减少延迟,提高用户体验。 一、索引优化 索引是提高查询速度的关键。正确地创建和使用索引可以显著加快数据检索。应为经常用于搜索和排序的列...

    mysql-essential-5.0.51a-win32.rar

    3. **分区功能**:允许在单个表上进行水平分割,以提高查询性能和管理大量数据的能力。 4. **视图和存储过程**:提高了代码复用和复杂查询的管理。 5. **触发器和存储函数**:增强了数据库的业务逻辑处理能力。 6. *...

    ServerS8MySQL_千年_

    5. **扩展性与可维护性**:随着游戏用户数量的增长,MySQL可以通过集群、分片等技术进行水平扩展,以满足更大规模的数据存储和处理需求。同时,MySQL有着丰富的文档和社区支持,方便开发者进行问题排查和系统维护。 ...

    交友热线 for mysql

    例如,当用户数量达到一定规模时,可以通过水平分表将用户数据分散到多个物理表中,以降低单表压力,提高查询效率。此外,还可以使用主从复制实现数据备份和负载均衡,确保服务的连续性和可靠性。 最后,考虑到社交...

    Linux下的MySQL调优.ppt

    3. **应用程序与架构优化**:垂直或水平拆分数据库,实现读写分离,使用复制和负载均衡,优化频繁更新的表结构。 4. **查询优化**:合理利用索引,特别是联合索引;减小交互次数,使用固定格式SQL,缩短事务,避免...

    MySQL权威指南中英文版

    对于英语水平较高的读者,英文原版提供了更精确的技术表达和更流畅的阅读体验。而对于中文读者,中译本则消除了语言障碍,使得掌握MySQL知识变得更加轻松。 综上所述,《MySQL权威指南中英文版》是一本集理论与实践...

    高性能mysql第三版.pdf

    5. **分区技术**:通过将大表分成较小的部分来改善查询性能。 ### 四、查询优化技巧 1. **避免使用SELECT ***:明确指定需要检索的列名而不是使用`SELECT *`,这样可以减少数据传输量。 2. **使用EXPLAIN分析查询...

    搜题系统mysql数据库设计.zip

    在构建一个搜题系统时,数据库设计是至关重要的一步,因为它决定了系统的数据存储、查询效率以及...数据库设计的合理性直接影响到搜题系统的整体性能和用户体验,因此在设计之初就要充分考虑未来可能出现的扩展和变化。

    MySQL性能管理及架构设计

    分区技术可以有效分散单表压力、提高查询效率。常见的分区方式有范围分区(RANGE)、列表分区(LIST)及哈希分区(HASH)等。例如: - 使用范围分区按日期进行数据划分,便于历史数据归档; - 基于用户ID采用哈希...

Global site tag (gtag.js) - Google Analytics