转载请注明出处哈:http://carlosfu.iteye.com/blog/2269678
一、引出热点key问题
我们通常使用 缓存 + 过期时间的策略来帮助我们加速接口的访问速度,减少了后端负载,同时保证功能的更新,一般情况下这种模式已经基本满足要求了。
但是有两个问题如果同时出现,可能就会对系统造成致命的危害:
(1) 这个key是一个热点key(例如一个重要的新闻,一个热门的八卦新闻等等),所以这种key访问量可能非常大。
(2) 缓存的构建是需要一定时间的。(可能是一个复杂计算,例如复杂的sql、多次IO、多个依赖(各种接口)等等)
于是就会出现一个致命问题:在缓存失效的瞬间,有大量线程来构建缓存(见下图),造成后端负载加大,甚至可能会让系统崩溃 。
二、四种解决方案(注释:第1,2种方法来自Tim Yang博客)
我们的目标是:尽量少的线程构建缓存(甚至是一个) + 数据一致性 + 较少的潜在危险,下面会介绍四种方法来解决这个问题:
1. 使用互斥锁(mutex key): 这种解决方案思路比较简单,就是只让一个线程构建缓存,其他线程等待构建缓存的线程执行完,重新从缓存获取数据就可以了(如下图)
如果是单机,可以用synchronized或者lock来处理,如果是分布式环境可以用分布式锁就可以了(分布式锁,可以用memcache的add, redis的setnx, zookeeper的添加节点操作)。
下面是Tim yang博客的代码,是memcache的伪代码实现
if (memcache.get(key) == null) { // 3 min timeout to avoid mutex holder crash if (memcache.add(key_mutex, 3 * 60 * 1000) == true) { value = db.get(key); memcache.set(key, value); memcache.delete(key_mutex); } else { sleep(50); retry(); } }
如果换成redis,就是:
String get(String key) { String value = redis.get(key); if (value == null) { if (redis.setnx(key_mutex, "1")) { // 3 min timeout to avoid mutex holder crash redis.expire(key_mutex, 3 * 60) value = db.get(key); redis.set(key, value); redis.delete(key_mutex); } else { //其他线程休息50毫秒后重试 Thread.sleep(50); get(key); } } }
2. "提前"使用互斥锁(mutex key):
在value内部设置1个超时值(timeout1), timeout1比实际的memcache timeout(timeout2)小。当从cache读取到timeout1发现它已经过期时候,马上延长timeout1并重新设置到cache。然后再从数据库加载数据并设置到cache中。伪代码如下:
v = memcache.get(key); if (v == null) { if (memcache.add(key_mutex, 3 * 60 * 1000) == true) { value = db.get(key); memcache.set(key, value); memcache.delete(key_mutex); } else { sleep(50); retry(); } } else { if (v.timeout <= now()) { if (memcache.add(key_mutex, 3 * 60 * 1000) == true) { // extend the timeout for other threads v.timeout += 3 * 60 * 1000; memcache.set(key, v, KEY_TIMEOUT * 2); // load the latest value from db v = db.get(key); v.timeout = KEY_TIMEOUT; memcache.set(key, value, KEY_TIMEOUT * 2); memcache.delete(key_mutex); } else { sleep(50); retry(); } } }
3. "永远不过期":
这里的“永远不过期”包含两层意思:
(1) 从redis上看,确实没有设置过期时间,这就保证了,不会出现热点key过期问题,也就是“物理”不过期。
(2) 从功能上看,如果不过期,那不就成静态的了吗?所以我们把过期时间存在key对应的value里,如果发现要过期了,通过一个后台的异步线程进行缓存的构建,也就是“逻辑”过期
从实战看,这种方法对于性能非常友好,唯一不足的就是构建缓存时候,其余线程(非构建缓存的线程)可能访问的是老数据,但是对于一般的互联网功能来说这个还是可以忍受。
String get(final String key) { V v = redis.get(key); String value = v.getValue(); long timeout = v.getTimeout(); if (v.timeout <= System.currentTimeMillis()) { // 异步更新后台异常执行 threadPool.execute(new Runnable() { public void run() { String keyMutex = "mutex:" + key; if (redis.setnx(keyMutex, "1")) { // 3 min timeout to avoid mutex holder crash redis.expire(keyMutex, 3 * 60); String dbValue = db.get(key); redis.set(key, dbValue); redis.delete(keyMutex); } } }); } return value; }
4. 资源保护:
之前在缓存雪崩那篇文章提到了netflix的hystrix,可以做资源的隔离保护主线程池,如果把这个应用到缓存的构建也未尝不可。
三、四种方案对比:
作为一个并发量较大的互联网应用,我们的目标有3个:
1. 加快用户访问速度,提高用户体验。
2. 降低后端负载,保证系统平稳。
3. 保证数据“尽可能”及时更新(要不要完全一致,取决于业务,而不是技术。)
所以第二节中提到的四种方法,可以做如下比较,还是那就话:没有最好,只有最合适。
解决方案 | 优点 | 缺点 |
简单分布式锁(Tim yang) |
1. 思路简单 2. 保证一致性 |
1. 代码复杂度增大 2. 存在死锁的风险 3. 存在线程池阻塞的风险 |
加另外一个过期时间(Tim yang) | 1. 保证一致性 | 同上 |
不过期(本文) |
1. 异步构建缓存,不会阻塞线程池 |
1. 不保证一致性。 2. 代码复杂度增大(每个value都要维护一个timekey)。 3. 占用一定的内存空间(每个value都要维护一个timekey)。 |
资源隔离组件hystrix(本文) |
1. hystrix技术成熟,有效保证后端。 2. hystrix监控强大。
|
1. 部分访问存在降级策略。 |
四、总结
1. 热点key + 过期时间 + 复杂的构建缓存过程 => mutex key问题
2. 构建缓存一个线程做就可以了。
3. 四种解决方案:没有最佳只有最合适。
五、参考文献:(本文部分代码和图来自如下两篇博客)
相关推荐
在IT行业中,互斥锁(Mutex)是一种常见的同步机制,用于在多线程或分布式系统中确保对共享资源的独占访问。在这个场景中,我们关注的是如何在PHP的Amp框架下利用Redis来实现互斥锁。Amp是一个非阻塞的并发框架,它...
Redis缓存及热点key问题解决方案 Redis缓存是一种高效的缓存解决方案,用于加速应用程序的访问速度和降低数据库的负载。但是,Redis缓存也存在一些问题,例如热点key的问题。如果不妥善处理,可能会导致系统崩溃。...
1. **互斥锁(mutex key)**:在获取缓存时,先尝试获取该key的锁,只有获得锁的线程才能去数据库加载数据并设置缓存,其他线程则等待锁释放后重新尝试。在分布式环境中,可以使用分布式锁来实现。 2. **提前使用互斥...
缓存击穿对于一些设置了过期时间的 key,如果这些 key 可能会在某些时间点被超高并发地访问,是一种非常“热点”的数据。这个时候,需要考虑一个问题:缓存被“击穿”的问题,这个和缓存雪崩的区别在于这里针对某一 ...
2. 使用缓存双层机制,使用两层缓存,第一层缓存用于存储热点数据,第二层缓存用于存储非热点数据,减少缓存击穿的可能性。 3. 使用缓存预加载机制,在系统启动时预加载缓存,减少缓存击穿的可能性。 三、缓存雪崩 ...
1. **使用互斥锁 (Mutex Key)**: 在缓存失效时,不是直接从后端数据库加载数据,而是首先使用缓存工具中的某些带有成功操作返回值的操作(例如Redis的`SETNX`或Memcache的`ADD`)设置一个互斥锁。如果操作返回成功,...
- **定义**: Redis是一种开源的、基于内存的日志型Key-Value数据库。它使用ANSI C编写,支持网络连接,提供丰富的API接口供多种编程语言调用。 - **特点**: - **丰富的数据类型**: 支持字符串(Strings)、哈希...
1. 使用互斥锁(mutex key),在缓存失效的时候(判断拿出来的值为空),不是立即去 load db,而是先使用缓存工具的某些带成功操作返回值的操作(比如 Redis 的 SETNX 或者 Memcache 的 ADD)去 set 一个 mutex key...
缓存击穿是指一个 Key 非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个 Key 在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个完好无损的桶上凿开了一个洞。 解决方案我们的...
### Redis缓存的三大问题及其解决方案 #### 一、缓存穿透 缓存穿透是指查询一个既不在缓存也不在数据库中存在的数据时发生的场景。这种现象通常发生在恶意用户或黑客试图利用应用程序的漏洞来发送大量不存在的数据...
缓存击穿是指针对某个热点key,其过期时恰好有大量并发请求到来,这些请求可能直接穿透缓存,导致数据库受到巨大压力。处理方式如下: - **使用互斥锁(mutex key)**:在缓存失效时,尝试获取锁,成功后再加载...
7. **API设计**:myCache提供了存取数据的接口,例如`set($key, $value)`用于设置缓存,`get($key)`用于获取缓存,`delete($key)`用于删除缓存,`exists($key)`检查键是否存在等。 通过研究myCache的源码,开发者...
- 缓存击穿:单个热点key过期时,大量请求会直接打到数据库。使用mutex互斥锁或其他方法控制对数据库的访问。 - 缓存雪崩:多个key在某个时间点同时过期,导致数据库承受巨大压力。可以通过分散缓存失效时间或采用...
在这个场景中,我们主要讨论了两个核心知识点:1) 使用Postman进行API测试时遇到的问题和解决方法,以及2) Redis缓存的管理和测试。 首先,Postman是一个强大的API测试工具,用于模拟HTTP请求,检查服务器响应。当...
在PHP开发中,使用缓存系统如Memcache可以显著提高应用程序的性能,但有时需要解决特定问题,例如模拟命名空间和处理缓存失效。本文将深入探讨如何在PHP中使用Memcache来模拟命名空间以及应对缓存失效问题。 首先,...
本篇文章将基于给定的“timyang新浪微博设计”文件内容,对微博的技术架构特别是缓存设计进行深入探讨。 #### 二、微博技术核心 微博技术的核心在于如何高效地进行数据的分发、聚合及展现。在微博系统中,每条微博...
虽然描述中提到答案可能存在问题,但我们可以从这些题目中提炼出一系列重要的.NET知识点。 1. **基础概念** - .NET Framework是什么?它包含哪些主要组成部分? - CLR(Common Language Runtime)的作用是什么?...
在处理网络请求和JSON解码时,一定要捕获并处理可能出现的错误,如网络问题、无效响应等。 7. **缓存策略** 由于API每天更新一次汇率,因此在每次调用`UpdateRates`时,可以考虑添加缓存机制。例如,可以将获取的...