`
kavy
  • 浏览: 891505 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

redis 3.0的集群部署

 
阅读更多

http://blog.csdn.net/myrainblues/article/details/25881535

 

转载请注明出处:http://hot66hot.iteye.com/admin/blogs/2050676

最近研究redis-cluster,正好搭建了一个环境,遇到了很多坑,系统的总结下,等到redis3 release出来后,换掉memCache 集群.

一:关于redis cluster

1:redis cluster的现状

reids-cluster计划在redis3.0中推出,可以看作者antirez的声明:http://antirez.com/news/49 (ps:跳票了好久,今年貌似加快速度了),目前的最新版本是redis3 beta2(2.9.51).

作者的目标:Redis Cluster will support up to ~1000 nodes. 赞...

目前redis支持的cluster特性(已亲测):

1):节点自动发现

2):slave->master 选举,集群容错

3):Hot resharding:在线分片

4):进群管理:cluster xxx

5):基于配置(nodes-port.conf)的集群管理

6):ASK 转向/MOVED 转向机制.

2:redis cluster 架构

1)redis-cluster架构图

 

架构细节:

(1)所有的redis节点彼此互联(PING-PONG机制),内部使用二进制协议优化传输速度和带宽.

(2)节点的fail是通过集群中超过半数的节点检测失效时才生效.

(3)客户端与redis节点直连,不需要中间proxy层.客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可

(4)redis-cluster把所有的物理节点映射到[0-16383]slot上,cluster 负责维护node<->slot<->value

2) redis-cluster选举:容错

 

(1)领着选举过程是集群中所有master参与,如果半数以上master节点与master节点通信超过(cluster-node-timeout),认为当前master节点挂掉.

(2):什么时候整个集群不可用(cluster_state:fail),当集群不可用时,所有对集群的操作做都不可用,收到((error) CLUSTERDOWN The cluster is down)错误

    a:如果集群任意master挂掉,且当前master没有slave.集群进入fail状态,也可以理解成进群的slot映射[0-16383]不完成时进入fail状态.

    b:如果进群超过半数以上master挂掉,无论是否有slave集群进入fail状态.

二:redis cluster的使用

1:安装redis cluster

1):安装redis-cluster依赖:redis-cluster的依赖库在使用时有兼容问题,在reshard时会遇到各种错误,请按指定版本安装.

(1)确保系统安装zlib,否则gem install会报(no such file to load -- zlib)

 

Java代码  收藏代码
  1. #download:zlib-1.2.6.tar  
  2. ./configure  
  3. make  
  4. make install  
  

 

 (1)安装ruby:version(1.9.2)

 

Java代码  收藏代码
  1. # ruby1.9.2   
  2. cd /path/ruby  
  3. ./configure -prefix=/usr/local/ruby  
  4. make  
  5. make install  
  6. sudo cp ruby /usr/local/bin  
 

(2)安装rubygem:version(1.8.16)

 

Java代码  收藏代码
  1. # rubygems-1.8.16.tgz  
  2. cd /path/gem  
  3. sudo ruby setup.rb  
  4. sudo cp bin/gem /usr/local/bin  
 

(3)安装gem-redis:version(3.0.0)

 

Java代码  收藏代码
  1. gem install redis --version 3.0.0  
  2. #由于源的原因,可能下载失败,就手动下载下来安装  
  3. #download地址:http://rubygems.org/gems/redis/versions/3.0.0  
  4. gem install -l /data/soft/redis-3.0.0.gem  
 

2)安装redis-cluster

 

Java代码  收藏代码
  1. cd /path/redis  
  2. make  
  3. sudo cp /opt/redis/src/redis-server /usr/local/bin  
  4. sudo cp /opt/redis/src/redis-cli /usr/local/bin  
  5. sudo cp /opt/redis/src/redis-trib.rb /usr/local/bin  

 

2:配置redis cluster

1)redis配置文件结构:


 使用包含(include)把通用配置和特殊配置分离,方便维护.

2)redis通用配置.

 

Java代码  收藏代码
  1. #GENERAL  
  2. daemonize no  
  3. tcp-backlog 511  
  4. timeout 0  
  5. tcp-keepalive 0  
  6. loglevel notice  
  7. databases 16  
  8. dir /opt/redis/data  
  9. slave-serve-stale-data yes  
  10. #slave只读  
  11. slave-read-only yes  
  12. #not use default  
  13. repl-disable-tcp-nodelay yes  
  14. slave-priority 100  
  15. #打开aof持久化  
  16. appendonly yes  
  17. #每秒一次aof写  
  18. appendfsync everysec  
  19. #关闭在aof rewrite的时候对新的写操作进行fsync  
  20. no-appendfsync-on-rewrite yes  
  21. auto-aof-rewrite-min-size 64mb  
  22. lua-time-limit 5000  
  23. #打开redis集群  
  24. cluster-enabled yes  
  25. #节点互连超时的阀值  
  26. cluster-node-timeout 15000  
  27. cluster-migration-barrier 1  
  28. slowlog-log-slower-than 10000  
  29. slowlog-max-len 128  
  30. notify-keyspace-events ""  
  31. hash-max-ziplist-entries 512  
  32. hash-max-ziplist-value 64  
  33. list-max-ziplist-entries 512  
  34. list-max-ziplist-value 64  
  35. set-max-intset-entries 512  
  36. zset-max-ziplist-entries 128  
  37. zset-max-ziplist-value 64  
  38. activerehashing yes  
  39. client-output-buffer-limit normal 0 0 0  
  40. client-output-buffer-limit slave 256mb 64mb 60  
  41. client-output-buffer-limit pubsub 32mb 8mb 60  
  42. hz 10  
  43. aof-rewrite-incremental-fsync yes  
 

3)redis特殊配置.

 

Java代码  收藏代码
  1. #包含通用配置  
  2. include /opt/redis/redis-common.conf  
  3. #监听tcp端口  
  4. port 6379  
  5. #最大可用内存  
  6. maxmemory 100m  
  7. #内存耗尽时采用的淘汰策略:  
  8. volatile-lru -> remove the key with an expire set using an LRU algorithm  
  9. # allkeys-lru -> remove any key accordingly to the LRU algorithm  
  10. volatile-random -> remove a random key with an expire set  
  11. # allkeys-random -> remove a random key, any key  
  12. volatile-ttl -> remove the key with the nearest expire time (minor TTL)  
  13. # noeviction -> don't expire at all, just return an error on write operations  
  14. maxmemory-policy allkeys-lru  
  15. #aof存储文件  
  16. appendfilename "appendonly-6379.aof"  
  17. #rdb文件,只用于动态添加slave过程  
  18. dbfilename dump-6379.rdb  
  19. #cluster配置文件(启动自动生成)  
  20. cluster-config-file nodes-6379.conf  
  21. #部署在同一机器的redis实例,把<span style="font-size: 1em; line-height: 1.5;">auto-aof-rewrite搓开,防止瞬间fork所有redis进程做rewrite,占用大量内存</span>  
  22. auto-aof-rewrite-percentage 80-100  
 

3:cluster 操作

cluster集群相关命令,更多redis相关命令见文档:http://redis.readthedocs.org/en/latest/

 

Java代码  收藏代码
  1. 集群  
  2. CLUSTER INFO 打印集群的信息  
  3. CLUSTER NODES 列出集群当前已知的所有节点(node),以及这些节点的相关信息。  
  4. 节点  
  5. CLUSTER MEET <ip> <port> 将 ip 和 port 所指定的节点添加到集群当中,让它成为集群的一份子。  
  6. CLUSTER FORGET <node_id> 从集群中移除 node_id 指定的节点。  
  7. CLUSTER REPLICATE <node_id> 将当前节点设置为 node_id 指定的节点的从节点。  
  8. CLUSTER SAVECONFIG 将节点的配置文件保存到硬盘里面。  
  9. 槽(slot)  
  10. CLUSTER ADDSLOTS <slot> [slot ...] 将一个或多个槽(slot)指派(assign)给当前节点。  
  11. CLUSTER DELSLOTS <slot> [slot ...] 移除一个或多个槽对当前节点的指派。  
  12. CLUSTER FLUSHSLOTS 移除指派给当前节点的所有槽,让当前节点变成一个没有指派任何槽的节点。  
  13. CLUSTER SETSLOT <slot> NODE <node_id> 将槽 slot 指派给 node_id 指定的节点,如果槽已经指派给另一个节点,那么先让另一个节点删除该槽>,然后再进行指派。  
  14. CLUSTER SETSLOT <slot> MIGRATING <node_id> 将本节点的槽 slot 迁移到 node_id 指定的节点中。  
  15. CLUSTER SETSLOT <slot> IMPORTING <node_id> 从 node_id 指定的节点中导入槽 slot 到本节点。  
  16. CLUSTER SETSLOT <slot> STABLE 取消对槽 slot 的导入(import)或者迁移(migrate)。  
  17. 键  
  18. CLUSTER KEYSLOT <key> 计算键 key 应该被放置在哪个槽上。  
  19. CLUSTER COUNTKEYSINSLOT <slot> 返回槽 slot 目前包含的键值对数量。  
  20. CLUSTER GETKEYSINSLOT <slot> <count> 返回 count 个 slot 槽中的键。  
 

4:redis cluster 运维操作

1)初始化并构建集群

(1)#启动集群相关节点(必须是空节点),指定配置文件和输出日志

 

Java代码  收藏代码
  1. redis-server /opt/redis/conf/redis-6380.conf > /opt/redis/logs/redis-6380.log 2>&1 &  
  2. redis-server /opt/redis/conf/redis-6381.conf > /opt/redis/logs/redis-6381.log 2>&1 &  
  3. redis-server /opt/redis/conf/redis-6382.conf > /opt/redis/logs/redis-6382.log 2>&1 &  
  4. redis-server /opt/redis/conf/redis-7380.conf > /opt/redis/logs/redis-7380.log 2>&1 &  
  5. redis-server /opt/redis/conf/redis-7381.conf > /opt/redis/logs/redis-7381.log 2>&1 &  
  6. redis-server /opt/redis/conf/redis-7382.conf > /opt/redis/logs/redis-7382.log 2>&1 &  

 

(2):使用自带的ruby工具(redis-trib.rb)构建集群

 

Java代码  收藏代码
  1. #redis-trib.rb的create子命令构建  
  2. #--replicas 则指定了为Redis Cluster中的每个Master节点配备几个Slave节点  
  3. #节点角色由顺序决定,先master之后是slave(为方便辨认,slave的端口比master大1000)  
  4. redis-trib.rb create --replicas 1 10.10.34.14:6380 10.10.34.14:6381 10.10.34.14:6382 10.10.34.14:7380 10.10.34.14:7381 10.10.34.14:7382  
 

(3):检查集群状态,

 

Java代码  收藏代码
  1. #redis-trib.rb的check子命令构建  
  2. #ip:port可以是集群的任意节点  
  3. redis-trib.rb check 1 10.10.34.14:6380  
 最后输出如下信息,没有任何警告或错误,表示集群启动成功并处于ok状态

 

Java代码  收藏代码
  1. [OK] All nodes agree about slots configuration.  
  2. >>> Check for open slots...  
  3. >>> Check slots coverage...  
  4. [OK] All 16384 slots covered.  

 

2):添加新master节点

(1)添加一个master节点:创建一个空节点(empty node),然后将某些slot移动到这个空节点上,这个过程目前需要人工干预

a):根据端口生成配置文件(ps:establish_config.sh是我自己写的输出配置脚本)

 

Java代码  收藏代码
  1. sh establish_config.sh 6386 > conf/redis-6386.conf  
 

b):启动节点

 

Java代码  收藏代码
  1. nohup redis-server /opt/redis/conf/redis-6386.conf > /opt/redis/logs/redis-6386.log 2>&1 &  

 

c):加入空节点到集群
add-node  将一个节点添加到集群里面, 第一个是新节点ip:port, 第二个是任意一个已存在节点ip:port

 

Java代码  收藏代码
  1. redis-trib.rb add-node 10.10.34.14:6386 10.10.34.14:6381  
 

node:新节点没有包含任何数据, 因为它没有包含任何slot。新加入的加点是一个主节点, 当集群需要将某个从节点升级为新的主节点时, 这个新节点不会被选中

d):为新节点分配slot

 

Java代码  收藏代码
  1. redis-trib.rb reshard 10.10.34.14:6386  
  2. #根据提示选择要迁移的slot数量(ps:这里选择500)  
  3. How many slots do you want to move (from 1 to 16384)? 500  
  4. #选择要接受这些slot的node-id  
  5. What is the receiving node ID? f51e26b5d5ff74f85341f06f28f125b7254e61bf  
  6. #选择slot来源:  
  7. #all表示从所有的master重新分配,  
  8. #或者数据要提取slot的master节点id,最后用done结束  
  9. Please enter all the source node IDs.  
  10.   Type 'all' to use all the nodes as source nodes for the hash slots.  
  11.   Type 'done' once you entered all the source nodes IDs.  
  12. Source node #1:all  
  13. #打印被移动的slot后,输入yes开始移动slot以及对应的数据.  
  14. #Do you want to proceed with the proposed reshard plan (yes/no)? yes  
  15. #结束  

3):添加新的slave节点

a):前三步操作同添加master一样

b)第四步:redis-cli连接上新节点shell,输入命令:cluster replicate 对应master的node-id

 

Java代码  收藏代码
  1. cluster replicate 2b9ebcbd627ff0fd7a7bbcc5332fb09e72788835  
 

note:在线添加slave 时,需要dump整个master进程,并传递到slave,再由 slave加载rdb文件到内存,rdb传输过程中Master可能无法提供服务,整个过程消耗大量io,小心操作.

例如本次添加slave操作产生的rdb文件

 

Java代码  收藏代码
  1. -rw-r--r-- 1 root root  34946 Apr 17 18:23 dump-6386.rdb  
  2. -rw-r--r-- 1 root root  34946 Apr 17 18:23 dump-7386.rdb  

 

4):在线reshard 数据:

对于负载/数据均匀的情况,可以在线reshard slot来解决,方法与添加新master的reshard一样,只是需要reshard的master节点是老节点.

5):删除一个slave节点

 

Java代码  收藏代码
  1. #redis-trib del-node ip:port '<node-id>'  
  2. redis-trib.rb del-node 10.10.34.14:7386 'c7ee2fca17cb79fe3c9822ced1d4f6c5e169e378'  
 6):删除一个master节点

 

a):删除master节点之前首先要使用reshard移除master的全部slot,然后再删除当前节点(目前只能把被删除

master的slot迁移到一个节点上)

 

Java代码  收藏代码
  1. #把10.10.34.14:6386当前master迁移到10.10.34.14:6380上  
  2. redis-trib.rb reshard 10.10.34.14:6380  
  3. #根据提示选择要迁移的slot数量(ps:这里选择500)  
  4. How many slots do you want to move (from 1 to 16384)? 500(被删除master的所有slot数量)  
  5. #选择要接受这些slot的node-id(10.10.34.14:6380)  
  6. What is the receiving node ID? c4a31c852f81686f6ed8bcd6d1b13accdc947fd2 (ps:10.10.34.14:6380的node-id)  
  7. Please enter all the source node IDs.  
  8.   Type 'all' to use all the nodes as source nodes for the hash slots.  
  9.   Type 'done' once you entered all the source nodes IDs.  
  10. Source node #1:f51e26b5d5ff74f85341f06f28f125b7254e61bf(被删除master的node-id)  
  11. Source node #2:done  
  12. #打印被移动的slot后,输入yes开始移动slot以及对应的数据.  
  13. #Do you want to proceed with the proposed reshard plan (yes/no)? yes  
 

b):删除空master节点

 

Java代码  收藏代码
  1. redis-trib.rb del-node 10.10.34.14:6386 'f51e26b5d5ff74f85341f06f28f125b7254e61bf'  
三:redis cluster 客户端(Jedis)

1:客户端基本操作使用

 

Java代码  收藏代码
  1. <span style="color: #333333; font-family: Arial, sans-serif;"><span style="color: #333333; font-family: Arial, sans-serif;"private static BinaryJedisCluster jc;  
  2.   static {  
  3.        //只给集群里一个实例就可以  
  4.         Set<HostAndPort> jedisClusterNodes = new HashSet<HostAndPort>();  
  5.         jedisClusterNodes.add(new HostAndPort("10.10.34.14"6380));  
  6.         jedisClusterNodes.add(new HostAndPort("10.10.34.14"6381));  
  7.         jedisClusterNodes.add(new HostAndPort("10.10.34.14"6382));  
  8.         jedisClusterNodes.add(new HostAndPort("10.10.34.14"6383));  
  9.         jedisClusterNodes.add(new HostAndPort("10.10.34.14"6384));  
  10.         jedisClusterNodes.add(new HostAndPort("10.10.34.14"7380));  
  11.         jedisClusterNodes.add(new HostAndPort("10.10.34.14"7381));  
  12.         jedisClusterNodes.add(new HostAndPort("10.10.34.14"7382));  
  13.         jedisClusterNodes.add(new HostAndPort("10.10.34.14"7383));  
  14.         jedisClusterNodes.add(new HostAndPort("10.10.34.14"7384));  
  15.         jc = new BinaryJedisCluster(jedisClusterNodes);  
  16.     }  
  17. @Test  
  18.     public void testBenchRedisSet() throws Exception {  
  19.         final Stopwatch stopwatch = new Stopwatch();  
  20.         List list = buildBlogVideos();  
  21.         for (int i = 0; i < 1000; i++) {  
  22.             String key = "key:" + i;  
  23.             stopwatch.start();  
  24.             byte[] bytes1 = protostuffSerializer.serialize(list);  
  25.             jc.setex(key, 60 * 60, bytes1);  
  26.             stopwatch.stop();  
  27.         }  
  28.         System.out.println("time=" + stopwatch.toString());  
  29.     }</span></span>  

2:jedis客户端的坑.

1)cluster环境下redis的slave不接受任何读写操作,

2)client端不支持keys批量操作,不支持select dbNum操作,只有一个db:select 0

3)JedisCluster 的info()等单机函数无法调用,返回(No way to dispatch this command to Redis Cluster)错误,.

4)JedisCluster 没有针对byte[]的API,需要自己扩展(附件是我加的基于byte[]的BinaryJedisCluster  api)

 

参考文档:

http://redis.io/topics/cluster-spec

http://redis.io/topics/cluster-tutorial

分享到:
评论

相关推荐

    redis3.0-集群部署文档

    ### Redis 3.0 集群部署详细指南 #### 一、概述 Redis 3.0 是一个重要的里程碑版本,因为它引入了官方支持的集群功能。通过集群部署,可以实现数据分片、高可用性以及横向扩展能力,极大地提高了Redis在生产环境中...

    redis 3.0 集群指南

    ### Redis 3.0 集群指南 ...综上所述,Redis 3.0 的集群部署不仅涉及安装配置、主从复制等基础概念,还涵盖了更为高级的故障转移机制——哨兵。通过合理规划和配置,可以有效提升 Redis 集群的可用性和性能。

    redis3.0-集群部署文档.pdf

    从给定的文件信息中,我们可以提取出关于Redis3.0集群部署的关键知识点。文档中主要介绍了如何在CentOS 6.5系统环境下进行Redis集群的部署和配置。以下是具体的知识点: 1. Redis集群部署的基本需求: - 集群要...

    Redis3.0集群代理系统源码

    Redis3.0集群代理系统, 并发接收客户端请求,计算Key的哈希槽值,转发到对应的缓存服务器,并将缓存服务器的返回值回传给客户端, 这样客户端只要访问集群代理系统,实现一次性定位访问,效率与单台缓存服务器...

    redis3.0集群安装

    本章节主要介绍如何搭建一个基本的Redis 3.0集群环境,包括必要的软件安装以及集群的配置过程。 ##### 2.1 环境要求 - **操作系统**:Linux(推荐CentOS 7+) - **硬件资源**:至少三台物理或虚拟服务器 - **网络...

    Windows下Redis3.0 编译过后的exe

    在Windows环境下编译Redis3.0,可以让你在本地系统上测试和开发基于Redis的应用,尤其是利用其新特性——Cluster。 **Redis3.0的新特性:** 1. **Cluster支持**:Redis 3.0引入了Cluster功能,这是一个分布式解决...

    Redis3.0 集群安装过程

    Redis 3.0 集群的安装过程是构建高可用性和可扩展性的NoSQL数据库系统的关键步骤。在这个过程中,我们需要关注多个知识点,包括Redis的下载与编译、配置文件的修改、实例部署、Ruby环境的安装以及集群的启动与测试。...

    Redis-x64-3.0.504.zip

    这个压缩包包含了 Redis 3.0.504 版本的安装文件和辅助脚本,方便用户快速部署和管理 Redis 服务。 1. **Redis 简介**: Redis 是一种开源、基于内存、支持网络、可持久化的键值对存储数据库。它支持多种数据结构...

    redis-3.0.503_x64.rar|redis-3.0.503_x64.rar

    Redis,全称Remote Dictionary Server,是一款高性能的键值对存储系统,它以纯内存操作著称,能够提供极快的数据读写...通过下载并解压提供的"redis-3.0.503_x64"文件,用户可以快速体验和部署这一高效的数据存储系统。

    适用于 Redis 3.0 的快速轻量级 Redis 集群代理.zip

    乌鸦Corvus 是适用于 redis 3.0 的快速、轻量级 redis 集群代理,已启用集群模式。为什么大多数 redis 客户端实现不支持 redis 集群。我们有很多服务依赖于 redis,这些服务是用 Python、Java、Go、Nodejs 等编写的...

    redis3.0.501

    标题中的"redis3.0.501"指的是Redis的特定版本,这个版本是针对Windows操作系统优化的。在Windows环境下,Redis的安装和使用有时会与Linux等其他系统有所不同,但同样提供了高效的服务。 描述中提到的是"windows版...

    带有详细注释的 Redis 3.0 代码.zip

    Redis 是一个高性能的键值数据库,它以键值对的形式存储数据,并且支持多种数据结构,如字符串、哈希、列表、...同时,通过阅读相关文档,用户可以更好地部署、管理和维护 Redis 集群,提升应用程序的可靠性和效率。

    redis3.0.502-win-x64和x84

    Redis 3.0版本也支持简单的集群功能,但若需更高级的集群特性,可能需要升级到更高版本。 8. **安全**:虽然Redis默认不开启密码认证,但可以通过配置`requirepass`来设置密码,增强安全性。同时,需要注意防火墙...

    Redis Cluster集群部署搭建详解附件

    以上是关于Redis Cluster集群部署的详细步骤和知识点,通过学习和实践,您可以掌握如何搭建和管理自己的Redis分布式环境。请确保在实际环境中根据具体需求调整配置,并做好数据备份,以防万一。

    Redis 64位 3.0.501

    总的来说,“Redis 64位 3.0.501”提供了一个强大且高效的键值存储解决方案,适合在64位环境下运行,并且具备了集群扩展、高速读写、数据持久化等核心功能。无论是开发人员还是运维人员,都需要熟悉这些知识点,以便...

    Redis-x64-3.0.503.rar

    Redis 是一个开源的、基于键值对的数据存储系统,它被广泛用于缓存、数据库以及消息中间件等场景。此压缩包 "Redis-x64-3.0.503.rar" 提供的是适用于 Windows ...对于生产环境,还要考虑安全性、监控和集群部署等因素。

    redis -3.0.501 -windows x64

    虽然Redis 3.0.501不支持官方的集群模式,但可以通过社区开发的工具如Twemproxy或Redis Sentinel实现分布式部署。在更高版本的Redis中,原生集群功能已经加入,能提供更强大的扩展性和高可用性。 通过了解并熟练...

Global site tag (gtag.js) - Google Analytics