`
frank1998819
  • 浏览: 758384 次
  • 性别: Icon_minigender_1
  • 来自: 南京
文章分类
社区版块
存档分类

八分钟了解缓存的常见问题?(转)

 
阅读更多
一、缓存一致性问题
当数据时效性要求很高时,需要保证缓存中的数据与数据库中的保持一致,而且需要保证缓存节点和副本中的数据也保持一致,不能出现差异现象。这就比较依赖缓存的过期和更新策略。一般会在数据发生更改的时,主动更新缓存中的数据或者移除对应的缓存。



二、缓存并发问题
缓存过期后将尝试从后端数据库获取数据,这是一个看似合理的流程。但是,在高并发场景下,有可能多个请求并发的去从数据库获取数据,对后端数据库造成极大的冲击,甚至导致 “雪崩”现象。此外,当某个缓存key在被更新时,同时也可能被大量请求在获取,这也会导致一致性的问题。那如何避免类似问题呢?我们会想到类似“锁”的机制,在缓存更新或者过期的情况下,先尝试获取到锁,当更新或者从数据库获取完成后再释放锁,其他的请求只需要牺牲一定的等待时间,即可直接从缓存中继续获取数据。



三、缓存穿透问题
缓存穿透在有些地方也称为“击穿”。很多朋友对缓存穿透的理解是:由于缓存故障或者缓存过期导致大量请求穿透到后端数据库服务器,从而对数据库造成巨大冲击。

这其实是一种误解。真正的缓存穿透应该是这样的:

在高并发场景下,如果某一个key被高并发访问,没有被命中,出于对容错性考虑,会尝试去从后端数据库中获取,从而导致了大量请求达到数据库,而当该key对应的数据本身就是空的情况下,这就导致数据库中并发的去执行了很多不必要的查询操作,从而导致巨大冲击和压力。

可以通过下面的几种常用方式来避免缓存传统问题:

缓存空对象
对查询结果为空的对象也进行缓存,如果是集合,可以缓存一个空的集合(非null),如果是缓存单个对象,可以通过字段标识来区分。这样避免请求穿透到后端数据库。同时,也需要保证缓存数据的时效性。这种方式实现起来成本较低,比较适合命中不高,但可能被频繁更新的数据。

单独过滤处理
对所有可能对应数据为空的key进行统一的存放,并在请求前做拦截,这样避免请求穿透到后端数据库。这种方式实现起来相对复杂,比较适合命中不高,但是更新不频繁的数据。

四、缓存颠簸问题
缓存的颠簸问题,有些地方可能被成为“缓存抖动”,可以看做是一种比“雪崩”更轻微的故障,但是也会在一段时间内对系统造成冲击和性能影响。一般是由于缓存节点故障导致。业内推荐的做法是通过一致性Hash算法来解决。

五、缓存的雪崩现象
缓存雪崩就是指由于缓存的原因,导致大量请求到达后端数据库,从而导致数据库崩溃,整个系统崩溃,发生灾难。导致这种现象的原因有很多种,上面提到的“缓存并发”,“缓存穿透”,“缓存颠簸”等问题,其实都可能会导致缓存雪崩现象发生。这些问题也可能会被恶意攻击者所利用。还有一种情况,例如某个时间点内,系统预加载的缓存周期性集中失效了,也可能会导致雪崩。为了避免这种周期性失效,可以通过设置不同的过期时间,来错开缓存过期,从而避免缓存集中失效。

从应用架构角度,我们可以通过限流、降级、熔断等手段来降低影响,也可以通过多级缓存来避免这种灾难。

此外,从整个研发体系流程的角度,应该加强压力测试,尽量模拟真实场景,尽早的暴露问题从而防范。

六、热点Key
缓存中的某些Key(可能对应用与某个促销商品)对应的value存储在集群中一台机器,使得所有流量涌向同一机器,成为系统的瓶颈,该问题的挑战在于它无法通过增加机器容量来解决。

解决方案

客户端热点key缓存:将热点key对应value并缓存在客户端本地,并且设置一个失效时间。对于每次读请求,将首先检查key是否存在于本地缓存中,如果存在则直接返回,如果不存在再去访问分布式缓存的机器。
服务端负载均衡:将热点key复制多个副本,然后存储到缓存集群的不同机器上。当通过热点key去查询数据时,通过某种hash算法随机选择一个副本机器访问缓存,将热点分散到了不同机器上。
七、缓存无底洞现象
该问题由 facebook 的工作人员提出的, facebook 在 2010 年左右,memcached 节点就已经达3000 个,缓存数千 G 内容。他们发现了一个问题—memcached 连接频率,效率下降了,于是加 memcached 节点,

添加了后,发现因为连接频率导致的问题,仍然存在,并没有好转,称之为”无底洞现象”。

目前主流的数据库、缓存、Nosql、搜索中间件等技术栈中,都支持“分片”技术,来满足“高性能、高并发、高可用、可扩展”等要求。有些是在client端通过Hash取模(或一致性Hash)将值映射到不同的实例上,有些是在client端通过范围取值的方式映射的。当然,也有些是在服务端进行的。但是,每一次操作都可能需要和不同节点进行网络通信来完成,实例节点越多,则开销会越大,对性能影响就越大。

主要可以从如下几个方面避免和优化:

数据分布方式
有些业务数据可能适合Hash分布,而有些业务适合采用范围分布,这样能够从一定程度避免网络IO的开销。

IO优化
可以充分利用连接池,NIO等技术来尽可能降低连接开销,增强并发连接能力。

数据访问方式
一次性获取大的数据集,会比分多次去获取小数据集的网络IO开销更小。

当然,缓存无底洞现象并不常见。在绝大多数的公司里可能根本不会遇到。
分享到:
评论

相关推荐

    面试中缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级怎么解答?.docx

    在面试中,对于缓存相关的知识点,面试官可能会考察你对缓存雪崩、缓存穿透、缓存预热、缓存更新以及缓存降级的理解和处理策略。以下是这些概念的详细解释: 1. **缓存雪崩** 缓存雪崩是指大量缓存在同一时刻过期...

    网易云音乐 uc缓存转mp3

    【标题】:“网易云音乐 uc缓存转mp3”指的是将使用UC浏览器浏览网易云音乐时产生的缓存文件转换为MP3格式的过程。这个过程涉及到网络音频的缓存机制、数据解析以及音频文件的编码与解码技术。 【描述】:“源码用...

    酷狗缓存转MP3工具

    《酷狗缓存转MP3工具》是一款专为音乐爱好者设计的应用程序,它能够帮助用户将从酷狗音乐平台下载的缓存文件转换为普遍通用的MP3格式。这款工具的出现,解决了用户因版权问题无法直接下载某些歌曲,但又想在离线状态...

    酷狗缓存管理转换提取工具

    然而,许多用户可能并未充分利用其内置的缓存功能,或者不知道如何将缓存的音乐文件转换为常见的音频格式,如MP3。本文将深入解析“酷狗缓存管理转换提取工具”,帮助用户了解如何高效地管理和利用酷狗音乐的缓存...

    asp.net缓存 缓存

    了解了缓存的基本概念和应用场景后,我们可以通过.NET提供的API来实现缓存操作。例如,`HttpRuntime.Cache` 对象提供了内存缓存的功能,而`OutputCache` 特性则用于配置输出缓存。在代码中,我们可以使用`Cache....

    300分钟吃透分布式缓存pdf和markdown

    通过这300分钟的学习,你将全面掌握分布式缓存的基础知识,了解如何在实际项目中选择合适的缓存方案,以及如何优化和管理缓存,提升系统性能。无论是PDF还是Markdown文档,都将为你提供详尽的理论解释和实践指导。

    SuperMap iObjects .NET 7C地图原始缓存转紧凑缓存

    地图缓存是GIS系统中常见的一种技术,它预先计算并存储地图的特定视图,以便用户快速访问,而无需每次请求时都进行实时渲染。这极大地提升了用户体验,尤其是在网络带宽有限或地图数据量庞大的情况下。 原始缓存...

    Java缓存技术深入了解

    **Java缓存技术深入了解** Java缓存技术是提高应用程序性能的关键技术之一,它通过存储经常访问的数据,减少了对数据库或其他慢速数据源的依赖,从而加快了数据的获取速度。本篇文章将深入探讨Java中的缓存实现,...

    JAVA缓存技术深入了解

    此外,我们还需要考虑缓存的并发控制,如`ReadWriteLock`、`StampedLock`等,以及缓存穿透、缓存雪崩和缓存击穿等问题,这些问题在设计缓存时都需要进行预防和处理。 最后,对于大型系统,监控和度量缓存性能也至关...

    缓存、缓存算法和缓存框架简介 - 文章 - 伯乐在线.pdf

    文章中提及的面试者programmerone对缓存的理解非常浅显,仅限于知道使用hashtable实现简单的缓存机制,而没有深入了解缓存的工作原理、缓存算法的选择标准和缓存框架的使用。面试官提出的问题主要集中在缓存的基本...

    每个程序员都应该了解的_CPU_高速缓存

    虽然高速缓存提高了性能,但也存在一些问题,如缓存污染(不常用的数据占据了缓存空间)、缓存抖动(数据频繁在缓存和主内存之间移动)等。因此,理解和利用好高速缓存是优化程序性能的关键。 总结来说,理解CPU...

    分布式缓存.docx

    首先,我们了解为什么需要使用缓存。缓存的主要目的是减少对服务器的直接访问,尤其是在处理大量高并发读取操作时,缓存可以极大地提高系统性能。比如,Session管理就是一个典型的例子。传统的Session保存在服务器端...

    android的缓存-饼图

    通过分析饼图,我们可以了解缓存的分布情况,找出可能的问题,从而采取有效的优化措施,提高应用的性能和用户体验。对于Android开发者来说,掌握如何解读和利用缓存饼图是提升专业技能的关键步骤。

    Android文件缓存与内存缓存

    首先,我们来了解什么是双缓存策略。双缓存是指同时使用内存缓存和文件缓存,以达到快速访问数据的目的。内存缓存具有高速读写的优势,但存储空间有限;而文件缓存虽然访问速度相对较慢,但可以存储大量数据。当用户...

    android缓存技术之文件缓存

    文件缓存是一种常见的本地缓存策略,它通过将数据持久化到设备的文件系统中,实现数据的快速访问。 首先,我们需要了解Android的存储结构。Android系统提供了多种存储方式,包括内部存储、外部存储、SQLite数据库和...

    JAVA缓存技术_深入了解.ppt

    **JAVA缓存技术详解** Java缓存技术是提高应用程序性能的关键技术之一,它通过存储频繁访问的数据,减少了对慢速资源(如磁盘或远程服务)的依赖,从而提升了系统的响应速度。本篇将深入探讨Java缓存技术的原理、...

    Introduction of ARM cache_ARM缓存技术简介

    #### 一、为什么了解缓存(cache)和写缓冲(write buffer)很重要? 在现代计算机体系结构中,缓存和写缓冲扮演着至关重要的角色,特别是对于高性能计算设备而言,如ARM处理器。理解这些概念可以帮助程序员更好地优化...

    .ent 缓存问题解决

    以下将详细介绍缓存的工作原理、常见问题以及解决方案。 1. **缓存的工作原理**: - 缓存遵循“最近最常使用”(LRU, Least Recently Used)或“先进先出”(FIFO, First In First Out)等替换策略。当缓存空间满...

    IE缓存提取工具

    - 网页开发:开发者可以查看缓存文件来了解网页的加载情况,优化性能。 - 教育研究:学生或教师可能需要保存在线课程的媒体资源,提取缓存能避免反复下载。 5. **操作步骤** - 启动IE缓存提取工具。 - 扫描和...

    分布式缓存与JavaEE

    常见的分布式缓存解决方案有Memcached、Redis、Hazelcast和Infinispan等。 **JavaEE中的缓存集成** 在JavaEE应用中,可以使用JCache(JSR 107)标准来集成缓存服务。JCache提供了一套API,允许开发者在不依赖具体...

Global site tag (gtag.js) - Google Analytics