普通的hash算法有个很大的问题:当hash的"模数"发生变化时,整个hash数据结构就需要重新hash,重新hash之后的数据分布一定会和hash之前的不同;在很多场景下,"模数"的变化时必然的,但是这种"数据分布"的巨大变化却会带来一些麻烦.所以,就有了"一致性hash",当然学术界对"一致性hash"的阐述,还远远不止这些.
在编程应用方面,最直观的例子就是"分布式缓存",一个cache集群中,有N台物理server,为了提升单台server的支撑能力,可能会考虑将数据通过hash的方式相对均匀的分布在每个server上.
判定方式: location = hashcode(key) % N;事实上,由于需要,N可能会被增加或者削减,不管程序上是否能够妥善的支持N的变更,单从"数据迁移"的面积而言,也是非常大的.
一致性Hash很巧妙的简化了这个问题,同时再使用"虚拟节点"的方式来细分数据的分布.
F1
图示中表名,有2个物理server节点,每个物理server节点有多个Snode虚拟节点,server1和server2的虚拟节点互相"穿插"且依次排列,每个snode都有一个code,它表示接受数据的hashcode起始值(或终止值),比如上述图示中第一个snode.code为500,即当一个数据的hashcode值在[0,500]时则会被存储在它上.
引入虚拟节点之后,事情就会好很多;假如KEY1分布在Snode3上,snode3事实为物理server1,当server1故障后,snode2也将被移除,那么KEY1将会被分布在"临近的"虚拟节点上--snode2(或者snode4,由实现而定);无论是存取,下一次对KEY1的操作将会有snode2(或snode4)来服务.
1) 一个物理server在逻辑上分成N个虚拟节点(本例中为256个)
2) 多个物理server的虚拟节点需要散列分布,即互相"穿插".
3) 所有的虚拟节点,在逻辑上形成一个链表
4) 每个虚拟节点,负责一定区间的hashcode值.
import java.net.InetSocketAddress; import java.net.Socket; import java.net.SocketAddress; import java.nio.charset.Charset; import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; import java.util.Map; import java.util.NavigableMap; import java.util.TreeMap; public class ServersPool { private static final int VIRTUAL_NODES_NUMBER = 256;//物理节点对应的虚拟节点的个数 private static final String TAG = ".-vtag-."; private NavigableMap<Long, SNode> innerPool = new TreeMap<Long, SNode>(); private Hashing hashing = new Hashing(); /** * 新增物理server地址 * @param address * @param weight * 权重,权重越高,其虚拟节点的个数越高,事实上没命中的概率越高 * @throws Exception */ public synchronized void addServer(String address,int weight) throws Exception { SNode prev = null; SNode header = null; String[] tmp = address.split(":"); InnerServer server = new InnerServer(tmp[0], Integer.parseInt(tmp[1])); server.init(); //将一个address下的所有虚拟节点SNode形成链表,可以在removeServer,以及 //特殊场景下使用 int max = 1; if(weight > 0){ max = VIRTUAL_NODES_NUMBER * weight; } for (int i = 0; i < max; i++) { long code = hashing.hash(address + TAG + i); SNode current = new SNode(server, code); if (header == null) { header = current; } current.setPrev(prev); innerPool.put(code, current); prev = current; } } /** * 删除物理server地址,伴随着虚拟节点的删除 * @param address */ public synchronized void removeServer(String address) { long code = hashing.hash(address + TAG + (VIRTUAL_NODES_NUMBER - 1)); SNode current = innerPool.get(code); if(current == null){ return; } if(!current.getAddress().equalsIgnoreCase(address)){ return; } current.getServer().close();; while (current != null) { current = innerPool.remove(current.getCode()).getPrev(); } } /** * 根据指定的key,获取此key应该命中的物理server信息 * @param key * @return */ public InnerServer getServer(String key) { long code = hashing.hash(key); SNode snode = innerPool.lowerEntry(code).getValue(); if (snode == null) { snode = innerPool.firstEntry().getValue(); } return snode.getServer(); } /** * 虚拟节点描述 */ class SNode { Long code; InnerServer server; SNode prev; SNode(InnerServer server, Long code) { this.server = server; this.code = code; } SNode getPrev() { return prev; } void setPrev(SNode prev) { this.prev = prev; } Long getCode() { return this.code; } InnerServer getServer() { return server; } String getAddress(){ return server.ip + ":" + server.port; } } /** * hashcode生成 */ class Hashing { //少量优化性能 private ThreadLocal<MessageDigest> md5Holder = new ThreadLocal<MessageDigest>(); private Charset DEFAULT_CHARSET = Charset.forName("utf-8"); public long hash(String key) { return hash(key.getBytes(DEFAULT_CHARSET)); } public long hash(byte[] key) { try { if (md5Holder.get() == null) { md5Holder.set(MessageDigest.getInstance("MD5")); } } catch (NoSuchAlgorithmException e) { throw new IllegalStateException("no md5 algorythm found"); } MessageDigest md5 = md5Holder.get(); md5.reset(); md5.update(key); byte[] bKey = md5.digest(); long res = ((long) (bKey[3] & 0xFF) << 24) | ((long) (bKey[2] & 0xFF) << 16) | ((long) (bKey[1] & 0xFF) << 8) | (long) (bKey[0] & 0xFF); return res; } } /** * 与物理server的TCP链接,用于实际的IO操作 */ class InnerServer { String ip; int port; Socket socket; InnerServer(String ip, int port) { this.ip = ip; this.port = port; } synchronized void init() throws Exception { SocketAddress socketAddress = new InetSocketAddress(ip, port); socket = new Socket(); socket.connect(socketAddress, 30000); } public boolean write(byte[] sources) { //TODO return true; } public byte[] read() { //TODO return new byte[]{}; } public void close(){ if(socket == null || socket.isClosed()){ return; } try{ socket.close(); } catch (Exception e){ // } } } }
相关推荐
一致性哈希算法是一种分布式哈希(Distributed Hash Table, DHT)技术,旨在解决在分布式环境中数据分布不均匀的问题。Ketama算法是基于一致性哈希的一种优化实现,由Last.fm公司的Simon Willison提出,其目标是在...
一致性hash应用于负载均衡算法,本实现由C++语言开发。 一致性hash算法提出了在动态变化的Cache环境中,判定哈希算法好坏的四个定义: 1、平衡性(Balance)2、单调性(Monotonicity) 3、分散性(Spread)4、负载(Load)
### 一致性Hash算法的原理及实现 #### 一、引言 一致性Hash算法是一种用于解决分布式环境下数据存储和检索问题的重要技术。它最初由David Karger等人在1997年的论文《Consistent Hashing and Random Trees: ...
一致性哈希算法是一种分布式哈希(Distributed Hash Table, DHT)技术,它在处理大量数据分布到多个节点上时,能保持较好的均衡性和可扩展性。在C/C++编程中,一致性哈希通常用于构建分布式系统,如负载均衡、缓存...
一致性哈希算法(Consistent Hashing)是一种在分布式系统中平衡数据分布的策略,尤其适用于缓存服务如Memcached或Redis。它的核心思想是通过哈希函数将对象映射到一个固定大小的环形空间中,然后将服务器也映射到这个...
一致性hash算法简介
一致性hash算法简介加C++实现
为了解决这个问题,可以采用跳数法(Jump Consistent Hash)或者更高级的一致性哈希变体,如Ketama或libketama。哈希冲突则可以通过开放寻址、链地址法等方法来解决。 此外,一致性哈希算法在分布式缓存如Memcached...
一致性哈希(Consistent Hashing)是一种分布式哈希表(DHT)的算法,它主要应用于分布式缓存、负载均衡等场景,旨在解决在动态扩展或收缩系统规模时,尽量减少数据迁移的问题。在这个简单的实现中,我们将探讨如何...
一致性哈希算法(Consistent Hashing)是一种特殊的哈希算法,设计目的是为了在分布式缓存系统中解决节点动态增减时导致的数据分布不均问题。该算法最早在1997年的论文《Consistent Hashing and Random Trees》中被...
一致性哈希算法(Consistent Hashing)是一种特殊的哈希算法,设计目的是为了在分布式缓存系统中解决节点动态增减时导致的键值映射大量变更的问题。它最早在1997年的论文《Consistent hashing and random trees》中被...
【一致性Hash算法】是一种分布式系统中用于负载均衡的哈希算法。它的主要目的是解决当服务节点增加或减少时,能够尽量少地改变已有的请求分配,以保持系统的稳定性。在传统的哈希算法中,增加或删除一个服务器可能...
一致性哈希算法是一种分布式哈希技术,用于解决在分布式缓存、负载均衡系统等场景下节点动态增减时,数据分布的稳定性和效率问题。它最初由麻省理工学院在1997年提出,目的是解决分布式缓存系统中如何均匀分配数据的...
一致性哈希算法是一种在分布式系统中解决数据分片和负载均衡问题的算法,它主要解决了在动态添加或移除节点时,尽可能少地改变已经存在的数据分布。在云计算和大数据处理领域,一致性哈希被广泛应用,例如在分布式...
一致性哈希(Consistent Hashing)是一种分布式哈希算法,主要应用于分布式缓存、负载均衡等领域,以解决在分布式环境中动态添加或删除节点时,尽可能少地改变已有的哈希映射关系。在这个Java实现中,我们看到的是...
主要介绍了PHP实现的一致性Hash算法,结合实例形式详细分析了php一致性Hash算法的概念、原理及相关实现与使用技巧,需要的朋友可以参考下