`
carlosfu
  • 浏览: 582319 次
  • 性别: Icon_minigender_1
  • 来自: 北京
博客专栏
Ba8b5055-9c58-3ab0-8a1c-e710f0495d2c
BigMemory实战与理...
浏览量:31217
53b2087e-c637-34d2-b61d-257846f73ade
RedisCluster开...
浏览量:151029
C9f66038-7478-3388-8086-d20c1f535495
缓存的使用与设计
浏览量:125220
社区版块
存档分类
最新评论

缓存系列文章--5.缓存穿透问题

阅读更多

转载请注明出处哈:http://carlosfu.iteye.com/blog/2269678


 

  一. 缓存穿透 (请求数据缓存大量不命中):
    缓存穿透是指查询一个一定不存在的数据,由于缓存不命中,并且出于容错考虑, 如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。
    例如:下图是一个比较典型的cache-storage架构,cache(例如memcache, redis等等) + storage(例如mysql, hbase等等)架构,查一个压根就不存在的值, 如果不做兼容,永远会查询storage。
二. 危害:
     对底层数据源(mysql, hbase, http接口, rpc调用等等)压力过大,有些底层数据源不具备高并发性。
     例如mysql一般来说单台能够扛1000-QPS就已经很不错了(别说你的查询都是select * from table where id=xx 以及你的机器多么牛逼,那就有点矫情了)
     例如他人提供的一个抗压性很差的http接口,可能穿透会击溃他的服务。
     
三. 如何发现:
   我们可以分别记录cache命中数, storage命中数,以及总调用量,如果发现空命中(cache,storage都没有命中)较多,可能就会在缓存穿透问题。
   注意:缓存本身的命中率(例如redis中的info提供了类似数字,只代表缓存本身)不代表storage和业务的命中率。
   
四. 产生原因以及业务是否允许?
    产生原因有很多:可能是代码本身或者数据存在的问题造成的,也很有可能是一些恶意攻击、爬虫等等(因为http读接口都是开放的)
    业务是否允许:这个要看做的项目或者业务是否允许这种情况发生,比如做一些非实时的推荐系统,假如新用户来了,确实没有他的推荐数据(推荐数据通常是根据历史行为算出),这种业务是会发生穿透现象的,至于业务允不允许要具体问题具体分析了。
 
五. 解决方法:
解决思路大致有两个,如下表。下面将分别说明
解决缓存穿透 适用场景 维护成本
缓存空对象

1. 数据命中不高

2. 数据频繁变化实时性高

1.代码维护简单

2.需要过多的缓存空间

3. 数据不一致

bloomfilter或者压缩filter提前拦截

1. 数据命中不高

2. 数据相对固定实时性低

1.代码维护复杂

2.缓存空间占用少

       1. 缓存空对象
         
        (1). 定义:如上图所示,当第②步MISS后,仍然将空对象保留到Cache中(可能是保留几分钟或者一段时间,具体问题具体分析),下次新的Request(同一个key)将会从Cache中获取到数据,保护了后端的Storage。
        (2) 适用场景:数据命中不高,数据频繁变化实时性高(一些乱转业务)
        (3) 维护成本:代码比较简单,但是有两个问题:
             第一是空值做了缓存,意味着缓存系统中存了更多的key-value,也就是需要更多空间(有人说空值没多少,但是架不住多啊),解决方法是我们可以设置一个较短的过期时间。
             第二是数据会有一段时间窗口的不一致,假如,Cache设置了5分钟过期,此时Storage确实有了这个数据的值,那此段时间就会出现数据不一致,解决方法是我们可以利用消息或者其他方式,清除掉Cache中的数据。
        (4) 伪代码:
package com.carlosfu.service;

import org.apache.commons.lang.StringUtils;

import com.carlosfu.cache.Cache;
import com.carlosfu.storage.Storage;

/**
 * 某服务
 * 
 * @author carlosfu
 * @Date 2015-10-11
 * @Time 下午6:28:46
 */
public class XXXService {

    /**
     * 缓存
     */
    private Cache cache = new Cache();

    /**
     * 存储
     */
    private Storage storage = new Storage();

    /**
     * 模拟正常模式
     * @param key
     * @return
     */
    public String getNormal(String key) {
        // 从缓存中获取数据
        String cacheValue = cache.get(key);
        // 缓存为空
        if (StringUtils.isBlank(cacheValue)) {
            // 从存储中获取
            String storageValue = storage.get(key);
            // 如果存储数据不为空,将存储的值设置到缓存
            if (StringUtils.isNotBlank(storageValue)) {
                cache.set(key, storageValue);
            }
            return storageValue;
        } else {
            // 缓存非空
            return cacheValue;
        }
    }


    /**
     * 模拟防穿透模式
     * @param key
     * @return
     */
    public String getPassThrough(String key) {
        // 从缓存中获取数据
        String cacheValue = cache.get(key);
        // 缓存为空
        if (StringUtils.isBlank(cacheValue)) {
            // 从存储中获取
            String storageValue = storage.get(key);
            cache.set(key, storageValue);
            // 如果存储数据为空,需要设置一个过期时间(300秒)
            if (StringUtils.isBlank(storageValue)) {
                cache.expire(key, 60 * 5);
            }
            return storageValue;
        } else {
            // 缓存非空
            return cacheValue;
        }
    }

}
 
2. bloomfilter或者压缩filter(bitmap等等)提前拦截
        (1). 定义:如上图所示,在访问所有资源(cache, storage)之前,将存在的key用布隆过滤器提前保存起来,做第一层拦截, 例如: 我们的推荐服务有4亿个用户uid, 我们会根据用户的历史行为进行推荐(非实时),所有的用户推荐数据放到hbase中,但是每天有许多新用户来到网站,这些用户在当天的访问就会穿透到hbase。为此我们每天4点对所有uid做一份布隆过滤器。如果布隆过滤器认为uid不存在,那么就不会访问hbase,在一定程度保护了hbase(减少30%左右)。
              注:有关布隆过滤器的相关知识,请自行查阅,有关guava中如何使用布隆过滤器,之后会系列文章给大家介绍。
        (2) 适用场景:数据命中不高,数据相对固定实时性低(通常是数据集较大)
        (3) 维护成本:代码维护复杂, 缓存空间占用少
              第一是空值做了缓存,意味着缓存系统中存了更多的key-value,也就是需要更多空间(有人说空值没多少,但是架不住多啊),解决方法是我们可以设置一个较短的过期时间。
              第二是数据会有一段时间窗口的不一致,假如,Cache设置了5分钟过期,此时Storage确实有了这个数据的值,那此段时间就会出现数据不一致,解决方法是我们可以利用消息或者其他方式,清除掉Cache中的数据。
六、参考资料:
附图一张,单机负载,哈哈:
  
 
 
  • 大小: 71.5 KB
  • 大小: 61 KB
  • 大小: 46.4 KB
  • 大小: 26.1 KB
  • 大小: 55 KB
  • 大小: 24.2 KB
  • 大小: 41 KB
  • 大小: 405 KB
  • 大小: 168.9 KB
分享到:
评论
2 楼 wgd12389 2016-07-18  
1 楼 yanan0628 2015-10-12  

相关推荐

    基于java的开发源码-Java缓存工具 SimpleCache.zip

    基于java的开发源码-Java缓存工具 SimpleCache.zip 基于java的开发源码-Java缓存工具 SimpleCache.zip 基于java的开发源码-Java缓存工具 SimpleCache.zip 基于java的开发源码-Java缓存工具 SimpleCache.zip 基于java...

    基于java的开发源码-Ehcache Java 缓存框架.zip

    基于java的开发源码-Ehcache Java 缓存框架.zip 基于java的开发源码-Ehcache Java 缓存框架.zip 基于java的开发源码-Ehcache Java 缓存框架.zip 基于java的开发源码-Ehcache Java 缓存框架.zip 基于java的开发源码-...

    Redis-x64-3.0.501 msi/zip

    Redis,全称Remote Dictionary Server,是一款高性能的键值存储系统,由Salvatore Sanfilippo创建,最初是为了解决Memcached在某些特定场景下的性能问题。它支持数据持久化,提供丰富的数据结构如字符串、哈希表、...

    redis-缓存-穿透-击穿-雪崩.png

    redis-缓存-穿透-击穿-雪崩

    缓存、缓存算法和缓存框架简介 - 文章 - 伯乐在线.pdf

    文章中提及的面试者programmerone对缓存的理解非常浅显,仅限于知道使用hashtable实现简单的缓存机制,而没有深入了解缓存的工作原理、缓存算法的选择标准和缓存框架的使用。面试官提出的问题主要集中在缓存的基本...

    Redis-x64-3.0.504(msi+zip).zip

    REmote DIctionary Server(Redis) 是一个由Salvatore Sanfilippo写的key-value存储系统。这是一个开源(BSD许可)的,内存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。

    ehcache-2.8.0-distribution.tar.gz

    3. **缓存穿透与缓存雪崩**:防止无效查询导致的缓存穿透和大量缓存同时过期造成的缓存雪崩,可通过布隆过滤器、设置合理的过期时间等手段解决。 五、Ehcache与其他技术的集成 1. **Spring框架**:Ehcache与Spring...

    Python库 | oslo.cache-1.37.0-py2.py3-none-any.whl

    - **分层缓存**:支持不同层次的缓存,如本地内存缓存和分布式缓存,提高缓存效率。 - **键空间管理**:提供键空间前缀,方便管理和清理缓存。 - **高级功能**:如缓存分组、缓存锁、事件监听器等,增强了缓存操作的...

    手动架设DNS缓存服务-AcrylicDNSProxy[整理].pdf

    手动架设DNS缓存服务-AcrylicDNSProxy[整理].pdf

    cache-api-1.0.0.jar

    “cache-api-1.0.0.jar”作为实现JSR107规范的库,提供了对缓存操作的一系列接口和类。这些接口和类允许开发者方便地在应用中集成缓存功能,如存储和检索数据、设置过期策略、处理并发访问等。通过使用这个API,...

    ehcache-2.7.3-distribution.tar.gz

    - **缓存机制**:EHCache采用内存和磁盘缓存相结合的方式,内存缓存速度快但容量有限,磁盘缓存则提供更大的存储空间但访问速度相对较慢。缓存中的数据通过键值对的形式存储。 - **缓存策略**:LRU和LFU是两种常用...

    hibernate-ehcache-4.1.0.Final.jar

    hibernate-ehcache-4.1.0.Final.jar 是hibernate4.1使用缓存的jar包

    ibatis缓存介绍 - 勇泽 - 博客园.mht

    ibatis缓存介绍 - 勇泽 - 博客园ibatis缓存介绍 - 勇泽 - 博客园ibatis缓存介绍 - 勇泽 - 博客园ibatis缓存介绍 - 勇泽 - 博客园

    Linux运维-6.集群-集群视频-5、Squid缓存、代理服务-18、Squid简介.mp4

    Linux运维-6.集群-集群视频-5、Squid缓存、代理服务-18、Squid简介.mp4

    计算机前端-实战.aravel框架4-02.缓存操作.wmv

    计算机前端-实战.aravel框架4-02.缓存操作.wmv

    下载 gradle-4.0-milestone-1-all.zip 官方绿色版

    - 提高了构建速度,通过更优化的依赖解析和缓存机制减少了构建时间。 - 引入了对Kotlin DSL的支持,允许开发者使用Kotlin编写构建脚本,提高了脚本的可读性和可维护性。 - 对Android插件的改进,比如更好的资源处理...

    JFinal 项目所需的所有实用jar包

    ehcache-core-2.5.2.jar(缓存处理) javax.servlet.jsp.jstl-1.2.0.v201105211821.jar(JSTL标签库) JFinal-bin-with-src-1.5.jar(JFinal 核心包) log4j-1.2.16.jar(日志记录) mysql-connector-java-5.1.20-...

    Python库 | weaklru-0.1.1-py2.py3-none-any.whl

    `weaklru`库则采用弱引用,允许缓存中的对象在不再被其他地方引用时自动删除,避免了内存泄漏的问题。 `weaklru`库的核心功能包括: 1. **弱引用**:使用弱引用存储缓存中的对象,当对象只被缓存引用时,垃圾回收...

Global site tag (gtag.js) - Google Analytics