`
frank1998819
  • 浏览: 758414 次
  • 性别: Icon_minigender_1
  • 来自: 南京
文章分类
社区版块
存档分类

InnoDB引擎表的主键选型 (转)

 
阅读更多

导读

MySQL采用开放可插入式存储引擎架构,提供类似电源插线板的功能,其后接入的存储引擎就类似电器设备,而我们大家常用的存储以MyISAM和InnoDB为主,早期大家主要使用MyISAM引擎支持业务,随MySQL支持业务范围越来越广,存储的数据对企业越来越重要,尤其PC服务器支持的最大内存越来越大,内存的价格也越来越便宜,逐渐采用InnoDB引擎为主.二种风格迥异的存储引擎,各自内部存储算法和数据操纵实现等都竞相不同,另外InnoDB引擎与其他商业数据库产品存储引擎也不太相同,为此我们必须根据使用的存储引擎特点,设计合理的数据存储结构和数据操纵方式。本文将围绕InnoDB存储引擎的主键设计而展开,告诉大家怎样设计表的主键才是合理的做法。

 

讨论InnoDB引擎表的主键选型的要求之前,我们大家先简单温习下InnoDB引擎表的元数据和索引数据存储结构特点。

InnoDB引擎表的数据和索引都是存储在同一个文件中,InnoDB引擎的页大小默认为16K,且页空间使用率为15/16,为此每页能存储的数据量是有限的。主键和数据的关系是数据存储在簇索引的叶子节点中,接下来我们看下主键和数据的组织结构关系,如图1-1:

图 1-1

对于非簇索引,又是如何存储的呢?通过翻译官方文章,得知:每个非簇索引的叶子节点存储的数据都包含簇索引的值,然后通过簇索引的值,可以查找到对应的元数据,我们继续看一下非簇索引的存储结构,以及与簇索引之间的关系,如图1-2:

图 1-2

紧接着,我们来理清楚InnoDB引擎表的簇索引为哪三类:

l 主键也即是我们文章说的簇索引;

l 若表中无主键,但是存在唯一索引,且字段定义为非空,则作为簇索引;

l 表无主键,也无 非空唯一索引,则内部默认隐含性创建一个长度为6个字节的字段作为簇索引字段;

通过上述探讨和分析,弄清楚了数据存储页的空间值和利用率、簇索引和非簇索引的存储结构,以及簇索引和元数据、簇索引和非簇索引的存储关系,以及簇索引为哪三类,那么我们建议大家一定要为InnoDB引擎表创建一个主键,没必要搞一个唯一性索引且字段定义属性非空,而不创建主键的表结构,我们再分析优秀主键具备的素质:值域范围够用且存储长度越短、值的唯一性和易比较性、数值的有序性增加,三个素质的各自优点,单独详细分析。

l 主键的值域够用且长度越短,将产生三个方面的优势

(1). 相同数据行数的表,数据容量越小,占用磁盘空间越少,为此可以节约物理或逻辑IO和减少内存占用;

(2). 普通索引的长度也将更短,可以减少通过普通索引搜索数据的物理或逻辑IO;

(3). 减少索引数据存储的页块裂变,从而提高页的利用率,以及减少物理IO;

l 主键的唯一性

(1). 主键的值要求必须唯一,且非空;

(2). 主键值每次插入或修改,都必须判断是否有相同值,为此减少索引值需要比对的长度,可以提高性能,或者间接地让其转换成比对数值大小的方式,提高其比对判断的效率;

l 主键值插入的有序性,将产生二个方面的优势

(1). 主键存储的块与块之间是有序的,然后块内有也是有序的,主键值的有序插入,可以减少块内的排序,节约磁盘物理IO;

(2). 主键值的有序性,可以提高数据舒顺序取速度,提高服务器的吞吐量,也可以节约物理IO;

上述讨论的数据存储结构及关系,以及主键字段要求的素质等理论知识之外,我们还需要考虑实际生产环境的业务、架构等综合因素,我们实际生产环境可能会使用四类属性作为主键:

(1). 自增序列;

(2). UUID()函数生成的随机值;

(3). 用户注册的唯一性帐号名称,字符串类型,一般长度为:40个字符;

(4). 基于一套机制生成类似自增的值,比如序列生成器

那么我们接下来,再分析下这四类属性各自作为表主键的优缺点:

(1). 自增序列:从小到大 或从大到小的顺序模式增加新值;数据类型也利于进行主键值比较;存储空间占用也相对最小,一般设置为:4个字节的INT类型或 8个字节的BIGINT类型;若是想进行数据水平拆分的话,也可以借助设置mysqld实例的2个参数:auto_increment_increment 和 auto_increment_offset;另外,唯一缺点就是自增序列是一个表级别的全局锁,在5.0系列大规模并发写的时候,因锁释放机制的问题容易出现瓶颈,但是5.1系列做了改进,基本上不存在此问题;

(2). UUID()函数:值为随机性+固定部分,其值产生是无序的,且同一台服务器上产生的值相同部分为77.8%;产生的值字符个数为36,按utf8编码计算,占用的存储空间为36个字节;对于数据水平拆分支持,无需特殊设置;

(3). 使用用户注册的帐号名称,字符串类型,其值的产生依赖用户输入,为此数据基本上为无序增加,字符串的长度也是不定的,只能通过前段技术控制最短最大长度值的限制,对水平拆分支持,无需做特殊设置;

(4). 序列生成器的架构,类似自增序列,不过需要借助额外的开发工作量,以及提供一个第三方的服务,可以规避自增序列的字增全局锁的问题,提高并发,对数据水平拆分可以更好地支持;

(5). 双主复制架构的概率性碰到的场景:主服务器的数据执行成功,而没有复制到在线备用服务器时,出问题的概率确实存在,其他类型的做法,也必须人工干涉解决,都无简单且合理的自动化办法,以上四种办法都无法规避;

通过四种属性值作为主键的优缺点分析,以及对比前面我们阐述的主键需要的优秀素质,若是不考虑水平拆分的问题,带来额外设置上的麻烦,则自增序列是最佳的主键字段选择;用户的注册帐号本身要求唯一性且非空的场景下,则可以作为主键字段的选择;若是考虑水平拆分的问题,则采用自增序列生成器的架构,非常易用和可靠的实现方式,产生的值是最佳主键字段的选择;

结束

使用什么类型的字段属性作为主键,最关键核心的要考虑存储引擎:如何存储元数据、如何检索元数据、如何维护其内部的索引组织结构,以及我们要实现的业务是什么,最后共同决定我们,如何设计一张用于存储数据的表,以及决定操纵数据的SQL语句如何编写,再结合业务特点就决定了我们的索引如何创建,建议大家多关注InnoDB引擎内部实现原理和机制,可以阅读官方提供的一个文档InnoDB引擎内部实现,以及多分析和关注业务特点。

附录:java自增序列生成器

我们在做数据库设计的时候,一般都会为数据库设计一个主键,来方便查询,更多的时候这个主键是代理主键,也就是说并没有实际意义。所以通常我们会把这个主键设计为自增的方式。比如Mysql中,我们可以设置为:autoIncresement, Oracle中可以利用Sequence..... 但是有些数据库是不支持这种自增的方式的,也就是说:自增必须我们自己通过程序来实现,比如sybase。 那么这种我们通过程序来控制自增长的过程,就叫序列键生成。简单的说:用一张表来记录其它表的主键的当前值,进来通过程序来达到自增的目的。

 

除了数据库不支持自增方式以后,还有另外一种情况会使用到序列键生成,那就是多张表的代理主键的值不能重复时。比如现在有2张表:T1,T2,他们的主键分别是pk1,pk2.如果说我们的业务要求pk1,pk2两列的值不能出现重复时,那么用我们以往的自增方式显然是办不到的,这个时候就需要生成序列键。

 

好了进入正题,我们先建立一张表,SQL语句如下:

 

  1. CREATETABLE `id_gen` (
  2. `GEN_KEY` varchar(20) NOTNULL,
  3. `GEN_VALUE` int(11) DEFAULT 0,
  4. PRIMARYKEY (`GEN_KEY`)
  5. ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
  1. CREATETABLE `id_gen` (
  2. `GEN_KEY` varchar(20) NOTNULL,
  3. `GEN_VALUE` int(11) DEFAULT 0,
  4. PRIMARYKEY (`GEN_KEY`)
  5. ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

 

 

 

我们要主键的 keyname与它当前的value保存到这个表中,每次我们取值之前,先update一下value,再取出来value。有的人会说:为什么我们每次不先取value再更新列?现在试想一下,如果当你取完值以后,系统被中断了,这时你还没有来得及更新value,那么下次取的到仍就是同一个值,如果上一个值已经被正确使用了,那么就出现了重复值,与我们设计的初衷就不符了。如果先更新,再取值的话,算被中断,顶多是浪费了一个值而已。 从上面的分析,我们不难看出,这个序列键生成器,在整个系统中只需要一个。那么,很快我们就想到了单例模式,那么我们就开始设置我们的生成器。

 

 

 

  1. package com.pattern.id.generator;
  2. import java.sql.Connection;
  3. import java.sql.DriverManager;
  4. import java.sql.PreparedStatement;
  5. import java.sql.ResultSet;
  6. import java.sql.SQLException;
  7. publicclass KeyGenerator {
  8. privatestatic KeyGenerator keyGen = new KeyGenerator();
  9. private KeyGenerator() {
  10. };
  11. /**
  12. * 工厂方法
  13. *
  14. * @return
  15. */
  16. publicstatic KeyGenerator getInstance() {
  17. return keyGen;
  18. }
  19. /**
  20. * 获取下一个value
  21. *
  22. * @return
  23. */
  24. publicsynchronizedint getNextKey(String keyName) {
  25. return getNextKeyFromDB(keyName);
  26. }
  27. privateint getNextKeyFromDB(String keyName) {
  28. Connection conn = null;
  29. try {
  30. Class.forName("com.mysql.jdbc.Driver");
  31. conn = DriverManager
  32. .getConnection("jdbc:mysql://localhost:3306/frameworkdb?user=root&password=123456");
  33. String updateSql = "update id_gen set GEN_VALUE = GEN_VALUE+1 where GEN_KEY = ? ";
  34. PreparedStatement upateStmt = conn.prepareStatement(updateSql);
  35. upateStmt.setString(1, keyName);
  36. upateStmt.execute();
  37. String sql = "select GEN_VALUE from id_gen where GEN_KEY = ? ";
  38. PreparedStatement stmt = conn.prepareStatement(sql);
  39. stmt.setString(1, keyName);
  40. ResultSet rs = stmt.executeQuery();
  41. while (rs.next()) {
  42. return rs.getInt(1);
  43. }
  44. } catch (ClassNotFoundException e) {
  45. // TODO Auto-generated catch block
  46. e.printStackTrace();
  47. } catch (SQLException e) {
  48. // TODO Auto-generated catch block
  49. e.printStackTrace();
  50. }finally{
  51. try {
  52. conn.close();
  53. } catch (SQLException e) {
  54. // TODO Auto-generated catch block
  55. e.printStackTrace();
  56. }
  57. }
  58. return0;
  59. }
  60. }

 

 

  1. package com.pattern.id.generator;
  2. import java.sql.Connection;
  3. import java.sql.DriverManager;
  4. import java.sql.PreparedStatement;
  5. import java.sql.ResultSet;
  6. import java.sql.SQLException;
  7. publicclass KeyGenerator {
  8. privatestatic KeyGenerator keyGen = new KeyGenerator();
  9. private KeyGenerator() {
  10. };
  11. /**
  12. * 工厂方法
  13. *
  14. * @return
  15. */
  16. publicstatic KeyGenerator getInstance() {
  17. return keyGen;
  18. }
  19. /**
  20. * 获取下一个value
  21. *
  22. * @return
  23. */
  24. publicsynchronizedint getNextKey(String keyName) {
  25. return getNextKeyFromDB(keyName);
  26. }
  27. privateint getNextKeyFromDB(String keyName) {
  28. Connection conn = null;
  29. try {
  30. Class.forName("com.mysql.jdbc.Driver");
  31. conn = DriverManager
  32. .getConnection("jdbc:mysql://localhost:3306/frameworkdb?user=root&password=123456");
  33. String updateSql = "update id_gen set GEN_VALUE = GEN_VALUE+1 where GEN_KEY = ? ";
  34. PreparedStatement upateStmt = conn.prepareStatement(updateSql);
  35. upateStmt.setString(1, keyName);
  36. upateStmt.execute();
  37. String sql = "select GEN_VALUE from id_gen where GEN_KEY = ? ";
  38. PreparedStatement stmt = conn.prepareStatement(sql);
  39. stmt.setString(1, keyName);
  40. ResultSet rs = stmt.executeQuery();
  41. while (rs.next()) {
  42. return rs.getInt(1);
  43. }
  44. } catch (ClassNotFoundException e) {
  45. // TODO Auto-generated catch block
  46. e.printStackTrace();
  47. } catch (SQLException e) {
  48. // TODO Auto-generated catch block
  49. e.printStackTrace();
  50. }finally{
  51. try {
  52. conn.close();
  53. } catch (SQLException e) {
  54. // TODO Auto-generated catch block
  55. e.printStackTrace();
  56. }
  57. }
  58. return0;
  59. }
  60. }



 

 

 

 

  1. <p>关于上面的代码,我不想做过多解释,都是JDBC的基础知识,关于JDBC资源,应该一层层来,我这里写示例代码就直接性关闭Connection。现在我们来写个测试类,来测试一下,
  2. 看我们这个类是否能正常工作。</p><p>
  3. </p><p></p><pre name="code"class="java">package com.pattern.id.generator;
  4. publicclass ClientTest {
  5. /**
  6. * @param args
  7. */
  8. publicstaticvoid main(String[] args) {
  9. KeyGenerator gen = KeyGenerator.getInstance();
  10. int value = gen.getNextKey("test");
  11. System.out.println(value);
  12. }
  13. }
  1. <p>关于上面的代码,我不想做过多解释,都是JDBC的基础知识,关于JDBC资源,应该一层层来,我这里写示例代码就直接性关闭Connection。现在我们来写个测试类,来测试一下,
  2. 看我们这个类是否能正常工作。</p><p>
  3. </p><p></p><pre name="code"class="java">package com.pattern.id.generator;
  4. publicclass ClientTest {
  5. /**
  6. * @param args
  7. */
  8. publicstaticvoid main(String[] args) {
  9. KeyGenerator gen = KeyGenerator.getInstance();
  10. int value = gen.getNextKey("test");
  11. System.out.println(value);
  12. }
  13. }

分享到:
评论

相关推荐

    云原生MySQL高可用方案技术选型1

    然而,InnoDB Cluster也有一些限制,比如要求所有表必须使用InnoDB引擎和唯一主键,以支持冲突检测。此外,维护InnoDB Cluster需要一定的成本,包括定期备份和监控,以及深入理解其工作原理。 总之,云原生环境下的...

    数据库表设计。。。。。。。。

    7. **性能优化**:这包括合理设置存储引擎(如InnoDB和MyISAM),调整事务隔离级别,优化SQL查询,使用存储过程和触发器,以及监控和分析数据库性能。 8. **安全性**:权限管理是数据库设计的重要环节,应设定不同...

    数据库设计说明书

    MySQL 5.1.53作为数据库系统,并且需要支持InnoDB引擎;使用PHPMyAdmin、SQLyog或Navicat for MySQL作为查询浏览工具等。 - **系统环境**:文档详细列出了系统所需的运行环境,包括操作系统、数据库版本和相关工具的...

    mysq count优化.docx

    然而,在某些场景下,尤其是使用InnoDB作为存储引擎时,`COUNT(*)`可能会导致性能瓶颈。本文将深入探讨`COUNT(*)`性能差的原因,并提供几种优化策略。 ##### 1.1 COUNT(*)性能不佳的原因 - **InnoDB与MyISAM的区别...

    sql教室管理系统

    - 选择合适的存储引擎,如InnoDB,支持事务处理。 - 设计索引策略,加速查询速度。 #### 四、系统实施 **实施步骤:** - 建立基本信息代码,包括实体的属性定义。 - 实现系统功能,如教室预订、课程安排、数据统计...

    MySQL性能优化概述

    总结来说,MySQL性能优化是一个多方面的过程,涉及到硬件选型、软件配置、数据表设计、索引管理等多个方面。通过合理的规划和细致的调整,可以显著提升MySQL的整体性能。希望以上内容对大家在进行MySQL性能优化时...

    Estructura-de-dades---MySQL

    7. **存储引擎**:MySQL支持多种存储引擎,如InnoDB(支持事务和行级锁定)和MyISAM(非事务处理,快速读取)。选择合适的存储引擎取决于应用的特性,如并发访问、数据一致性或读写速度。 8. **数据库优化**:性能...

    Mairadb cluster percona cluster mysql for galera集群部署手册

    这主要是因为 **Percona Cluster** 目前仅支持 **InnoDB** 表,并且建议每个表都拥有自增主键。 - 节点脱离问题: 在使用过程中,可能会遇到节点脱离集群的情况,这通常是因为多个节点同时对同一记录进行了更新。...

    利用MyEclipse构建Struts+Hibernate+Spring的J2EE系统经典例子

    首先,在MySQL中创建了一个名为`skybase`的数据库,并在其中定义了一个`user`表,该表包含`id`、`username`和`password`三个字段,其中`id`为主键且自动递增。表结构定义如下: ```sql CREATE TABLE `user` ( `id`...

    高性能服务端优化之路

    - **优化MySQL参数**:例如设置`innodb_flush_log_at_trx_commit`为0,减少每次事务提交时的日志刷新频率,提高性能但牺牲了一定的安全性。 - **使用高性能硬件**:采用物理主机而非虚拟机,使用SSD磁盘提升I/O...

Global site tag (gtag.js) - Google Analytics