三个分表:
CREATE TABLE `test_1` (
id INT(11) NOT NULL DEFAULT '0',
email varchar(50) NOT NULL ,
PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=UTF8;
CREATE TABLE `test_2` (
id INT(11) NOT NULL DEFAULT '0',
email varchar(50) NOT NULL ,
PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=UTF8;
CREATE TABLE `test_3` (
id INT(11) NOT NULL DEFAULT '0',
email varchar(50) NOT NULL ,
PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=UTF8;
一个总表:
CREATE TABLE `test` (
`id` INT(11) NOT NULL DEFAULT '0'
email varchar(50) NOT NULL
key `i_id` (`id`),
) ENGINE=MRG_MyISAM UNION=(test_1,test_2,test_3) DEFAULT CHARSET=UTF8;
在总表test上面select *的话,会取出三个分表中的数据。
在插入数据的时候根据对象的hash code 取模运算,如果余数为 3 那么就插入 test_3 这个表中。
一般总表不存数据 ,只是定义结构,为了防止别人插入数据 在建表语句后面添加
INSERT_METHOD=NO
在java程序里面首先需要建立总表和分表,由于分了100个表,如果手动下sql,那会烦死人的,所以通过程序生成这些表
package com.chen.crawler.utils; /** * 数据工具类 * @author xxx * */ public class DbUtils { private static final String USER_DB = "user"; private static final DBEngine userDBEngine ; private static Connection conn = null; private static Logger logger = Logger.getLogger(DbUtils.class.getName()); static{ userDBEngine = DBFactory.getDBEngine(USER_DB); try { conn = DBEngine.getConnection(USER_DB); } catch (SQLException e) { e.printStackTrace(); } boolean tableExists = TableExists("userinfo_1"); if(!tableExists){ CreateMargeTable("userinfo"); for(int i = 0 ; i < 100; i++){ CreateTables("userinfo_"+i); } } } private DbUtils(){ } private static boolean TableExists(String tableName){ String sql = "show tables like '"+tableName+"'"; try { conn = DBEngine.getConnection(USER_DB); java.sql.PreparedStatement pstmt = conn.prepareStatement(sql); ResultSet resultSet = pstmt.executeQuery(); while (resultSet.next()) { tableName = resultSet.getString(1); if(tableName!=null && tableName.length()>1){ return true; }else{ return false; } } } catch (SQLException e) { e.printStackTrace(); return false; } return false; } /** *建总表 */ private static void CreateMargeTable(String tableName){ String sql = "CREATE TABLE `" + tableName + "` ("+ "`userId` bigint(15) NOT NULL ,"+ "`nickname` varchar(50) NOT NULL COMMENT '用户昵称',"+ "`qq` varchar(15) NOT NULL COMMENT 'QQ号码',"+ "`gender` tinyint(2) NOT NULL COMMENT '性别 1 :男 2:女'," "`astro` varchar(5) NOT NULL COMMENT '星座的编码',"+ "`address` varchar(50) NOT NULL COMMENT '地址',"+ " KEY (`userId`),"+ " KEY `i_nickname` (`nickname`),"+ " KEY `i_address` (`address`)"+ " ) ENGINE=MRG_MyISAM INSERT_METHOD=NO DEFAULT CHARSET=utf8 union=("; StringBuffer sb = new StringBuffer(); sb.append(sql); for(int i =0;i<100 ;i++){ sb.append("userinfo_"+i).append(","); } sb.deleteCharAt(sb.length()-1).append(");"); try { java.sql.PreparedStatement pstmt = conn.prepareStatement(sb.toString()); pstmt.execute(); } catch (SQLException e) { e.printStackTrace(); } } private static void CreateTables(String tableName){ String sql = "CREATE TABLE `" + tableName + "` ("+ "`userId` bigint(15) NOT NULL auto_increment,"+ "`nickname` varchar(50) NOT NULL COMMENT '用户昵称',"+ "`qq` varchar(15) NOT NULL COMMENT 'QQ号码',"+ "`gender` tinyint(2) NOT NULL COMMENT '性别 1 :男 2:女',"+ "`astro` varchar(5) NOT NULL COMMENT '星座的编码',"+ "`address` varchar(50) NOT NULL COMMENT '地址',"+ " PRIMARY KEY (`userId`),"+ " KEY `i_nickname` (`nickname`),"+ " KEY `i_address` (`address`)"+ " ) ENGINE=MyISAM DEFAULT CHARSET=utf8;"; try { java.sql.PreparedStatement pstmt = conn.prepareStatement(sql); pstmt.execute(); } catch (SQLException e) { e.printStackTrace(); } } /** * * @param user * @param tableName * @return */ public static boolean InsertUserinfo(User user,String tableName) { boolean result = false; if (user == null || tableName==null) { return false; } try { String sql = "insert into " + tableName + "(nickname,qq,gender,astro,address) values(?,?,?,?,?,?,?)"; logger.info(sql); result = userDBEngine.executeUpdate(sql, new Object[] { user.getNickname(),user.getUin(), user.getGender(),user.getAstro(),user.getAddress() }) > 0 ? true : false; } catch (SQLException e) { e.printStackTrace(); } return result; } }
表建好后就是插入表了,这里根据每个对象的hash code 取模运算
User user = new User(nickname,uin,gender,astro,from); //按照 user对象的hashcode 进行模运算 0-99之间的规则来分表 String tableName = "userinfo_"; int code = user.hashCode()%100; tableName += code; InsertUserinfo(user, tableName);
这样就可以让每个表中的数据分布都比较均匀,而不会出现一个表的数据特别多,其他表的数据则特别少。
如果我们需要查询数据,可以直接通过总表查询
select * from userinfo limit 100;
相关推荐
本文提出的优化分区分表算法主要基于MySQL中的range分区和Merge存储引擎。通过合理的分区策略和高效的存储机制,该算法能够有效提升大规模数据查询的操作效率。 ##### 3.1 Range分区 Range分区是一种常见的分区...
MyBatis实现Mysql数据库分库分表操作和总结 MyBatis是一款流行的持久层框架,能够与Mysql数据库进行交互。在大规模的应用系统中,数据库的性能和可扩展性变得非常重要。为了解决这个问题,需要实现数据库的分库分表...
MySQL中的分表和分区是两种不同的数据库优化策略,它们旨在管理和优化大数据量的表,以提升查询性能和系统效率。 **分表**是指将一张大表拆分成多个小表,每个小表都拥有完整的表结构,包括.MYD数据文件、.MYI索引...
MySQL的分表和分区是数据库管理中两种常见的优化策略,旨在提高大数据量下的查询性能和系统稳定性。它们虽然在目的上有相似之处,但实现方式和效果存在显著差异。 1. **分表**:分表是将一张大表拆分成多个小表,每...
MySQL数据库在处理大数据量时,可能会遇到性能瓶颈,这时就需要采取一些优化策略,其中分表和分区是常见的解决方案。本文将详细介绍这两种技术及其在MySQL中的具体实现。 **垂直分表**是将一个宽表(包含大量列)...
MySQL中的分表和分区是两种不同的数据库优化策略,它们旨在管理和优化大数据量的表,以提升查询性能和系统效率。 **分表**是指将一张大表拆分成多个小表,每个小表都是独立完整的表,拥有自己的.MYD数据文件、.MYI...
MySQL 分区和分表技术总结 MySQL 分区和分表技术是数据库性能优化的重要手段,特别是在大型数据库系统中。以下是 MySQL 分区和分表技术的详细介绍: 什么是分表? 分表是将一个大表按照一定的规则分解成多张具有...
MySQL集群适合需要高可用性和扩展性的大型系统,预估分表适用于能预测数据分布的场景,而Merge存储引擎则是对已有大表的一种补救措施。在实际应用中,还需要结合数据库设计原则,如范式理论,以及适当的数据分区策略...
MySQL中的分表和分区是两种不同的数据库优化策略,它们都在一定程度上解决了大数据量下的查询效率问题,但原理和实现方式有所不同。 **一、分表** 分表,顾名思义,是将一张大表分解为多张小表,每个小表都是独立...
【MySQL分表、分库、分片和分区知识点详解】 在数据库系统中,随着数据量的不断增长,数据库性能可能会成为系统性能瓶颈。为了解决这个问题,我们可以采取一系列的数据库扩展技术,包括分表、分库、分片和分区。...
最后,为了方便查询所有分表中的数据,可以使用MySQL的`MERGE`存储引擎来实现一个逻辑上的“虚拟表”。通过创建一个`MERGE`表,将所有分表作为子表,这个`MERGE`表本身不存储任何数据,只是提供了统一的查询接口。...
12. **分区与分表**:理解MySQL的分区功能,以及垂直拆分和水平拆分的实现方法,以提升大数据量下的查询性能。 13. **云环境下的MySQL**:适应AWS RDS、Google Cloud SQL等云数据库服务,理解其特性和使用限制。 ...
- **Merge分表**:将数据分布在多个子表中,通过主表统一管理。 - **纵向分割**:根据字段的更新频率将其分布到不同的表中。 - **横向分割**:根据业务需求或数据特性(如按日期、用户ID等)将数据分到不同的表中...
2. 查询优化器:解析后的查询会被查询优化器处理,选择最佳的执行计划,如决定使用索引、选择合适的连接算法(Nested Loop Join, Merge Join, Hash Join)等。 3. 执行器:执行优化后的计划,与存储引擎交互,完成...
MySQL中的表类型主要有MyISAM、Heap、Merge、InnoDB和ISAM。MyISAM不支持事务,但支持表级锁定,适合读多写少的场景。InnoDB则支持事务处理,提供行级锁定和外键约束,适合需要事务安全的应用。两者在索引结构、存储...
此问题是DBProxy在多个分表merge结果的过程中未处理 NULL 值,导致结果集返回不对,而JDBC接口会认为此种情况下是未收到结果,会处于一直等待状态,触发超时 解决在分表情况下, IN 子句中分表列只支持 ...