`

mysql merge分表

阅读更多

 

 

三个分表:

 

CREATE TABLE `test_1` (

  id INT(11) NOT NULL DEFAULT '0',

  email varchar(50) NOT NULL ,

  PRIMARY KEY  (`id`)

) ENGINE=MyISAM DEFAULT CHARSET=UTF8;

 

 

CREATE TABLE `test_2` (

  id INT(11) NOT NULL DEFAULT '0',

  email varchar(50) NOT NULL ,

  PRIMARY KEY  (`id`)

) ENGINE=MyISAM DEFAULT CHARSET=UTF8; 

 

 

 

CREATE TABLE `test_3` (

  id INT(11) NOT NULL DEFAULT '0',

  email varchar(50) NOT NULL ,

  PRIMARY KEY  (`id`)

) ENGINE=MyISAM DEFAULT CHARSET=UTF8;

 

 

一个总表:

 

CREATE TABLE `test` (

  `id` INT(11) NOT NULL DEFAULT '0'

   email varchar(50) NOT NULL

  key `i_id` (`id`),

) ENGINE=MRG_MyISAM  UNION=(test_1,test_2,test_3)  DEFAULT CHARSET=UTF8;

 

 

在总表test上面select *的话,会取出三个分表中的数据。

 

 

在插入数据的时候根据对象的hash code 取模运算,如果余数为 3 那么就插入 test_3 这个表中。

 

一般总表不存数据 ,只是定义结构,为了防止别人插入数据 在建表语句后面添加

 

INSERT_METHOD=NO

 

 在java程序里面首先需要建立总表和分表,由于分了100个表,如果手动下sql,那会烦死人的,所以通过程序生成这些表

package com.chen.crawler.utils;


/**
 * 数据工具类
 * @author xxx
 *
 */
public class DbUtils {

	private static final  String USER_DB = "user";
	private static final DBEngine userDBEngine ;
	private static Connection conn = null;
	private static Logger logger =  Logger.getLogger(DbUtils.class.getName());
	
	static{
		userDBEngine = DBFactory.getDBEngine(USER_DB);
		try {
			conn = DBEngine.getConnection(USER_DB);
		} catch (SQLException e) {
			e.printStackTrace();
		}
		
		boolean tableExists = TableExists("userinfo_1");
		
		if(!tableExists){
			CreateMargeTable("userinfo");
			for(int i = 0 ; i < 100; i++){
				CreateTables("userinfo_"+i);
			}
		}
			
			
	}
	
	private DbUtils(){
		
	}
	
	private static boolean TableExists(String  tableName){
		
		String sql = "show tables like '"+tableName+"'";
		
		try {
			conn = DBEngine.getConnection(USER_DB);
			java.sql.PreparedStatement pstmt =  conn.prepareStatement(sql);
			ResultSet resultSet = pstmt.executeQuery();
			
			while (resultSet.next()) {
				tableName = resultSet.getString(1);
				if(tableName!=null && tableName.length()>1){
					return true;
				}else{
					return false;
				}
				
			}
			
		} catch (SQLException e) {
			e.printStackTrace();
			return false;
		}
		return false;
		
	}
	
       /**
       *建总表
       */
	private static void CreateMargeTable(String tableName){
		String sql = "CREATE TABLE `" + tableName + "` ("+
				"`userId` bigint(15) NOT NULL ,"+
				"`nickname` varchar(50) NOT NULL COMMENT '用户昵称',"+
				"`qq` varchar(15) NOT NULL COMMENT 'QQ号码',"+
				"`gender` tinyint(2) NOT NULL COMMENT '性别 1 :男 2:女',"
				"`astro` varchar(5) NOT NULL COMMENT '星座的编码',"+
				"`address` varchar(50) NOT NULL COMMENT '地址',"+
				" KEY  (`userId`),"+
				" KEY `i_nickname` (`nickname`),"+
				" KEY `i_address` (`address`)"+
				" ) ENGINE=MRG_MyISAM  INSERT_METHOD=NO DEFAULT CHARSET=utf8 union=(";
		StringBuffer sb = new StringBuffer();
		sb.append(sql);
		for(int i =0;i<100 ;i++){
			sb.append("userinfo_"+i).append(",");
		}
		sb.deleteCharAt(sb.length()-1).append(");");
			
			try {
				java.sql.PreparedStatement pstmt =  conn.prepareStatement(sb.toString());
				pstmt.execute();
				
				
			} catch (SQLException e) {
				e.printStackTrace();
			}
	}
	private static void CreateTables(String tableName){
		
		String sql = "CREATE TABLE `" + tableName + "` ("+
			"`userId` bigint(15) NOT NULL auto_increment,"+
			"`nickname` varchar(50) NOT NULL COMMENT '用户昵称',"+
			"`qq` varchar(15) NOT NULL COMMENT 'QQ号码',"+
			"`gender` tinyint(2) NOT NULL COMMENT '性别 1 :男 2:女',"+
			"`astro` varchar(5) NOT NULL COMMENT '星座的编码',"+
			"`address` varchar(50) NOT NULL COMMENT '地址',"+
			" PRIMARY KEY  (`userId`),"+
			" KEY `i_nickname` (`nickname`),"+
			" KEY `i_address` (`address`)"+
			" ) ENGINE=MyISAM DEFAULT CHARSET=utf8;";
		
		try {
			java.sql.PreparedStatement pstmt =  conn.prepareStatement(sql);
			pstmt.execute();
			
			
		} catch (SQLException e) {
			e.printStackTrace();
		}
	}
	/**
	 * 
	 * @param user
	 * @param tableName
	 * @return
	 */
	public  static boolean InsertUserinfo(User user,String tableName) {
		boolean result = false;

		if (user == null || tableName==null) {
			return false;
		}
		try {
			String sql = "insert into " + tableName + "(nickname,qq,gender,astro,address) values(?,?,?,?,?,?,?)";
			logger.info(sql);
			result = userDBEngine.executeUpdate(sql, new Object[] { 
					user.getNickname(),user.getUin(),
					user.getGender(),user.getAstro(),user.getAddress()
				 }) > 0 ? true : false;
		} catch (SQLException e) {
			e.printStackTrace();
		}
		return result;
	}
	
}

 

表建好后就是插入表了,这里根据每个对象的hash code 取模运算

 

User user = new User(nickname,uin,gender,astro,from);
//按照 user对象的hashcode 进行模运算 0-99之间的规则来分表
String tableName = "userinfo_";
int code = user.hashCode()%100;
tableName += code;
InsertUserinfo(user, tableName);

 

 这样就可以让每个表中的数据分布都比较均匀,而不会出现一个表的数据特别多,其他表的数据则特别少。

 

 

如果我们需要查询数据,可以直接通过总表查询

 

select * from userinfo limit 100;

 

 

 

 

 

分享到:
评论
2 楼 leichenlei 2015-12-31  
user.hashCode() 会出现负数,怎么处理?
1 楼 sharong 2013-07-16  
lz在谈到insert的时候,根据每个对象的hash code 取模运算。而实际应用中,更多的是根据uid的最后一位或者最后二位数字分为10个或者100个表。这个时候,insert数据需要根据uid的值来判断。如果是往userinfo表中insert,新生成一个auto_increment的uid,这时候该怎么操作?

相关推荐

    MySQL分区分表的设计及实现-收藏备用.pdf

    本文提出的优化分区分表算法主要基于MySQL中的range分区和Merge存储引擎。通过合理的分区策略和高效的存储机制,该算法能够有效提升大规模数据查询的操作效率。 ##### 3.1 Range分区 Range分区是一种常见的分区...

    MyBatis实现Mysql数据库分库分表操作和总结(推荐)

    MyBatis实现Mysql数据库分库分表操作和总结 MyBatis是一款流行的持久层框架,能够与Mysql数据库进行交互。在大规模的应用系统中,数据库的性能和可扩展性变得非常重要。为了解决这个问题,需要实现数据库的分库分表...

    mysql分表,分区的区别与联系借鉴.pdf

    MySQL中的分表和分区是两种不同的数据库优化策略,它们旨在管理和优化大数据量的表,以提升查询性能和系统效率。 **分表**是指将一张大表拆分成多个小表,每个小表都拥有完整的表结构,包括.MYD数据文件、.MYI索引...

    mysql分表,分区的区别与联系归类.pdf

    MySQL的分表和分区是数据库管理中两种常见的优化策略,旨在提高大数据量下的查询性能和系统稳定性。它们虽然在目的上有相似之处,但实现方式和效果存在显著差异。 1. **分表**:分表是将一张大表拆分成多个小表,每...

    MySQL分表和分区的具体实现方法

    MySQL数据库在处理大数据量时,可能会遇到性能瓶颈,这时就需要采取一些优化策略,其中分表和分区是常见的解决方案。本文将详细介绍这两种技术及其在MySQL中的具体实现。 **垂直分表**是将一个宽表(包含大量列)...

    mysql分表,分区的区别与联系[定义].pdf

    MySQL中的分表和分区是两种不同的数据库优化策略,它们旨在管理和优化大数据量的表,以提升查询性能和系统效率。 **分表**是指将一张大表拆分成多个小表,每个小表都是独立完整的表,拥有自己的.MYD数据文件、.MYI...

    MySQL分区和分表技术总结.docx

    MySQL 分区和分表技术总结 MySQL 分区和分表技术是数据库性能优化的重要手段,特别是在大型数据库系统中。以下是 MySQL 分区和分表技术的详细介绍: 什么是分表? 分表是将一个大表按照一定的规则分解成多张具有...

    mysql的3种分表方案

    MySQL集群适合需要高可用性和扩展性的大型系统,预估分表适用于能预测数据分布的场景,而Merge存储引擎则是对已有大表的一种补救措施。在实际应用中,还需要结合数据库设计原则,如范式理论,以及适当的数据分区策略...

    mysql分表和分区的区别浅析

    MySQL中的分表和分区是两种不同的数据库优化策略,它们都在一定程度上解决了大数据量下的查询效率问题,但原理和实现方式有所不同。 **一、分表** 分表,顾名思义,是将一张大表分解为多张小表,每个小表都是独立...

    MySql分表、分库、分片和分区知识点介绍

    【MySQL分表、分库、分片和分区知识点详解】 在数据库系统中,随着数据量的不断增长,数据库性能可能会成为系统性能瓶颈。为了解决这个问题,我们可以采取一系列的数据库扩展技术,包括分表、分库、分片和分区。...

    1亿条数据如何分表100张到Mysql数据库中(PHP)

    最后,为了方便查询所有分表中的数据,可以使用MySQL的`MERGE`存储引擎来实现一个逻辑上的“虚拟表”。通过创建一个`MERGE`表,将所有分表作为子表,这个`MERGE`表本身不存储任何数据,只是提供了统一的查询接口。...

    超经典MySQL DBA培训笔记

    12. **分区与分表**:理解MySQL的分区功能,以及垂直拆分和水平拆分的实现方法,以提升大数据量下的查询性能。 13. **云环境下的MySQL**:适应AWS RDS、Google Cloud SQL等云数据库服务,理解其特性和使用限制。 ...

    mysql性能优化综述

    - **Merge分表**:将数据分布在多个子表中,通过主表统一管理。 - **纵向分割**:根据字段的更新频率将其分布到不同的表中。 - **横向分割**:根据业务需求或数据特性(如按日期、用户ID等)将数据分到不同的表中...

    mysql源码

    2. 查询优化器:解析后的查询会被查询优化器处理,选择最佳的执行计划,如决定使用索引、选择合适的连接算法(Nested Loop Join, Merge Join, Hash Join)等。 3. 执行器:执行优化后的计划,与存储引擎交互,完成...

    MySQL管理基本操作

    - 实际应用中,当单表数据量超过 600 万条时,通常建议进行分表处理,以提高性能。 - 一般情况下,1000 万条记录大约占据 2-3GB 的存储空间。 #### 四、MySQL 启动与管理命令 - **启动 MySQL 服务**:`service ...

    在被甲骨文公司收购后,现在属于甲骨文公司(Oracle) 旗下产品 Oracle 大幅调涨MySQL商业版的售价,因此导致自由软

    MySQL中的表类型主要有MyISAM、Heap、Merge、InnoDB和ISAM。MyISAM不支持事务,但支持表级锁定,适合读多写少的场景。InnoDB则支持事务处理,提供行级锁定和外键约束,适合需要事务安全的应用。两者在索引结构、存储...

    基于MySQL的数据库中间件Meituan-DBProxy.zip

    此问题是DBProxy在多个分表merge结果的过程中未处理 NULL 值,导致结果集返回不对,而JDBC接口会认为此种情况下是未收到结果,会处于一直等待状态,触发超时 解决在分表情况下, IN 子句中分表列只支持 ...

Global site tag (gtag.js) - Google Analytics