`
cenwenchu
  • 浏览: 166209 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Memcache Hash算法值得探索的内容

阅读更多
 

       集团内部很多团队都使用Memcache来提高应用性能,最近的一次工作汇报中提及了MemcacheHash算法需要研究来满足一些需求,同时提高Memcache的利用效率。讨论了一下最后自己总结了这么几点是对Hash算法需要着重考虑的。

问题:

1.       存储数据如何均匀分散。如何把数据尽可能的散开存储,这样对于Memcache的可扩展性才会有充分利用,试想如果算法每次都会把数据定向到某几台机器,那么就会导致集群机器之间利用率的不均衡,无法发挥出集群效应。

2.       增减机器减小对原有数据存取的影响。由于业务量的增长势必需要对后端的服务器有所扩容,但是增加或者减少机器如何尽可能小的影响已有的缓存数据,这点直接影响业务处理以及应用的效率。

3.       提高Memcache效率。Memcache在压力测试下也会暴露出对于网络资源的消耗问题,毕竟也是网络间的Socket数据交互。

解决的一些思路和方法:

1.       Consistent Hashing是一种比较好的解决思路。可以参看一下:http://tech.idv2.com/2008/07/24/memcached-004/ 其中主要两个亮点就是稀释节点以及环状分区段管理。稀释节点就是将原来的节点再复制几十倍,使得离散度更高,数据更加分散。环状分区段管理,就能够将数据分区管理,在加入和减少节点时对数据产生影响最低,最好的类比就是解放前的地下工作者单线联系,如果被捕不会涉及到所有的地下党同志。

2.       集群的机器使用Memcache最好结合本地Cache,这里我们自己写了一个本地的类似于Memcache有超时时间Cache,两者结合一起使用缓存信息,在压力测试下提高了20%左右的性能。这里和我们的系统也有关系,我们对于Memcache有比较大的依赖,虽然已经对于每一个请求处理都防止重复获取信息,将必要信息放在线程上下文中,但是在运行期间还是会有不少的请求。

存储到Memcache中的数据类型:

1. 一次写入多次读,很少更新。这种数据系统启动以后构建,在非命中情况下不采用从后备数据源中获取数据来填充Memcache。(也是提高效率,同时防止一些攻击性的请求)

2. 多次写入多次读取。这类数据往往是在运行期被构建,非命中下会从后备数据源中获取,或者是某一种计算结果的缓存。

对于第一类数据来说,增加机器需要重新构建,如果采用分区分段,那么只需要构建某一部分的数据,或者是移动数据。对于第二类数据,增加机器如果采用简单的Hash算法也问题不大,最多存储多份,命中率降低,但是如果采用分区,也可以降低命中率下降的情况。

       这里只是抛出问题,后续如何解决请各位看官各抒己见了。当然这里自己也会考虑这方面的实现和设计。
分享到:
评论

相关推荐

    Memcache Hash算法值得探索的内容.txt

    Memcache Hash算法值得探索的内容.txt

    memcache分布式一致性hash

    分布式一致性哈希是一种解决在分布式缓存系统中如何高效、稳定地分配数据的算法,尤其在Memcache等缓存服务中广泛应用。它旨在确保当缓存集群中的节点增减时,对现有数据的映射影响最小,从而降低数据迁移和系统压力...

    memcache_php使用测试

    - **memcache.hash_strategy** 和 **memcache.hash_function**: 控制key到服务器的映射策略及哈希函数,通过设置不同的策略和函数,可以优化数据分布和负载均衡,比如标准哈希策略和CRC32算法通常用于提高一致性。...

    MemCache详细解读1

    为了解决这个问题,一致性Hash算法被引入。一致性Hash可以更好地处理服务器数量变化时的数据迁移,确保在添加或删除服务器时,只有一小部分数据需要重新分配,从而降低对缓存命中率的影响。 总的来说,MemCache是...

    PHP中使用memcache存储session的三种配置方法

    1、直接修改php.ini配置文件 复制代码 代码如下: session.save_handler = memcache //设置session的储存方式为memcache memcache.hash_strategy = “consistent”//设置memcache的hash算法 session.save_path = ...

    Java开发中的Memcache原理及实现

    - 分布式存储:Memcached采用分散式哈希(Distributed Hash Table,DHT)策略,将数据根据键(key)均匀地分布到各个服务器节点上,从而实现数据的分布式存储。 - 内存存储:所有数据都存储在内存中,提供高速访问...

    memcache架构图

    每个节点根据预设的算法(如一致性哈希)负责一部分键值对的存储,当新的节点加入或节点下线时,数据分布能够相对平滑地调整,避免大规模的数据迁移。 2. **内存存储** 由于数据存储在内存中,Memcached具有极快的...

    memcache一致性hash的php实现方法

    一致性哈希(Consistent Hashing)是一种分布式存储系统中用于负载均衡和缓存分配的算法。它的主要目标是在节点加入或离开系统时,尽可能减少数据重新分布的影响。在传统的哈希算法中,当新增或移除一个服务器时,...

    php模块memcache和memcached区别分析

    - 对于memcache,可以在php.ini配置文件中设置`Memcache.hash_strategy`为`consistent`,以及`memcache.hash_function`为`crc32`,来启用一致性哈希。 - 对于memcached,可以通过`setOption()`方法设置`Memcached:...

    PHP数据库操作二:memcache用法分析

    3. 配置PHP:在php.ini中设置session.save_handler为memcache,可以将session数据存储在Memcache中,以及设置hash策略和session.save_path等。 四、Memcache的常用命令: Memcache的客户端命令行工具或使用telnet...

    Flexihash(java版)

    Flexihash简化版,hash算法(java版),一致性hash的使用在PHP中有三种选择分别是原生的memcache扩展,memcached扩展,还有一个是网上比较流行的flexihash类。前两者都适用于memcache但不适合Redis

    神级memcached源代码分析文档_1.4.0代码分析

    - hash.h\hash.c:实现server端的哈希算法。 - assoc.h\assoc.c:管理server端的哈希表。 - items.h\items.c:管理server端的对象。 - slabs.h\slabs.c:负责内存管理。 - memcached.h\memcached.c:主要逻辑及main...

    mcache:一个高性能本地内存缓存,带有各种内存淘汰算法

    因缓存的使用相关需求,牺牲一部分服务器内存,因减少了网络数据交互,直接使用本机内存,可换取比redis,memcache等更快的缓存速度, 可做为更高一层的缓存需要 what? 用mcache能做什么? 可作为超高频率数据使用的缓存...

    ist的matlab代码-hash_ring:在Python中实现一致的哈希(使用md5作为哈希函数)

    哈希环是使用与libketama相同的算法构建的。 一致性哈希是一种以提供或删除一个插槽不会显着改变键到插槽的映射的方式提供哈希表功能的方案。 可以在博客文章中阅读有关hash_ring的更多信息(该文章更详细地解释了该...

    【白雪红叶】JAVA学习技术栈梳理思维导图.xmind

    memcache eacache Tair 消息队列 jms Queue Topic kafka 持久 复制 Stream Partition rocketMQ RabbitMQ ActiveMQ 常用开源框架 Spring Spring MVC Spring WebFlow spring tx aop ioc Struts...

    百度最新面经-Java 工程师

    * 缓存数据库 Memcache 的集群模式和一致性 Hash * Redis 的基本数据类型 网络模块 * 一个 URL 请求的过程 * HTTP 状态码的意义(502、406、302) * 三次握手和四次挥手 * Vi 编辑器的两种模式和跳转到最后一行 * ...

Global site tag (gtag.js) - Google Analytics