`
yysct2005
  • 浏览: 91274 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

Memcached深入理解 – memcached究竟是如何运作的

 
阅读更多

网上其实有很多文章说明了memcached是如何运作的,特别是底层的内存分配是如何运作的。我参考过很多资料,比较有启发意义的有几个:

  • 首先是官方的英文资料,虽然文章太多、很难看懂,我个人觉得说得也不是太清晰,不够直观(附上官方wiki地址 )。还有git上memcached原作者的protocol.txt 也值得一读,有时间的话,我会翻译一下。
  • 其次是mixi网站的核心技术人员写的5篇全面剖析,这5篇文章写得很实用,从各方面彻底解剖了memcached,可惜的是这一系列文章对于核心的内存分配逻辑描述还不够详细(个人觉得),而且很多监控方面的guide都是基于mixi站点已经有的一套框架,对于从头开发的人来说只能是用来指明方向的,实际指导意义不大(附上我转载的帖子入口 )。
  • 此外还有Mike Perham的一篇博客 ,写得不错,很详细地举例说明了memcached内部的内存分配逻辑,以及内存浪费现象。
  • 还有梁子的一篇博客 ,也是一篇很好的博客,从他的角度非常详细地描述了memcached内部的内存分配逻辑。我个人觉得他的文章解释的是最清楚的,虽然在文笔和错别字上实在是。。。。

1. 几个关键概念

Page为内存分配的单位
Memcached的内存分配以page为单位,默认情况下一个page是1M,可以通过-I参数修改,最小1K,最大128M。如果需要申请内存时,memcached会划分出一个新的page并分配给需要的slab区域。page一旦被分配在memcached重启前不会被回收或者重新分配(page ressign已经从1.2.8版移除了)。

Slabs划分数据空间
Memcached并不是将所有大小的数据都放在一起的,而是预先将数据空间划分为一系列大小的slabs,每个slab只负责一定大小范围内的数据存储。每个slab只存储大于其上一个slab的size并小于或者等于自己最大size的数据。例如:slab 3只存储大小介于137 到 224 bytes的数据。如果一个数据大小为230byte的数据进行存储,它将被分配到slab 4中。每个slab负责的空间其实是不等的,memcached默认情况下下一个slab的最大值为前一个的1.25倍,这个可以通过修改-f参数来修改增长比例。

Chunk才是存放缓存数据的单位
Chunk是一系列固定的内存空间,这个大小就是管理它的slab的最大存放大小。例如:slab 1的所有chunk都是104byte,而slab 4的所有chunk都是280byte。chunk是memcached实际存放缓存数据的地方,因为chunk的大小固定为slab能够存放的最大值,所以所有分配给当前slab的数据都可以被chunk存下。如果实际的数据大小小于chunk的大小,空余的空间将会被闲置,这个是为了防止内存碎片而设计的。举例来说,如果chunk size是224byte,而存储的数据只有200byte,剩下的24byte将被闲置。此外,memcached允许配置的最小的chunk空间为48个字节(key+value+flags),通过-n参数可以调节这个数值。

2. 理解这三者之间的关系

要理解memcached是如何分配内存的就要从理解上述三个东西之间的关系开始。
page 是memcached在收到内存不够的请求,并进行内存分配的单位。举例来说,slab2的所有空间都用完了,又有大小适合slab2的数据过来了,那么slab2就会向memcached请求新的内存空间,memcached就会划分一个page大小的内存量到slab2。page的默认大小是1M,这个数值可以通过参数-I来修改。
slab 是memcached用来划定存储空间的大小概念,每当memcached启动的时候,它会按照-n参数配置的值(如果有的话,否则为默认值)来决定第一个slab的大小,然后根据-f参数的值来决定后续slab大小的增长速率,一个一个地决定后续的slab的大小,直到slab的大小达到设定的page大小(一般是1M)。
chunk 是实际用来存储数据的内存空间,它的大小和包含它的slab的大小是一致的。当page大小的内存分配到slab的时候,slab会根据自身的大小将page大小的内存分割成 page / slabsize 个chunk。

memcached启动时候,slab创建以及chunk分配的细节可以参照下面的数据(使用-vv命令查看的详细内存分配过程)。

Source code      
/
usr/
bin/
memcached -
u nobody -
m 64
 -
p 11211
 -
l 127.0.0.1 -
vv
slab class   1
:
 chunk size        96
 perslab   10922

slab class   2
:
 chunk size       120
 perslab    8738

slab class   3
:
 chunk size       152
 perslab    6898

slab class   4
:
 chunk size       192
 perslab    5461

slab class   5
:
 chunk size       240
 perslab    4369

slab class   6
:
 chunk size       304
 perslab    3449

slab class   7
:
 chunk size       384
 perslab    2730

slab class   8
:
 chunk size       480
 perslab    2184

slab class   9
:
 chunk size       600
 perslab    1747

slab class  10
:
 chunk size       752
 perslab    1394

slab class  11
:
 chunk size       944
 perslab    1110

slab class  12
:
 chunk size      1184
 perslab     885

slab class  13
:
 chunk size      1480
 perslab     708

slab class  14
:
 chunk size      1856
 perslab     564

slab class  15
:
 chunk size      2320
 perslab     451

slab class  16
:
 chunk size      2904
 perslab     361

slab class  17
:
 chunk size      3632
 perslab     288

slab class  18
:
 chunk size      4544
 perslab     230

slab class  19
:
 chunk size      5680
 perslab     184

slab class  20
:
 chunk size      7104
 perslab     147

slab class  21
:
 chunk size      8880
 perslab     118

slab class  22
:
 chunk size     11104
 perslab      94

slab class  23
:
 chunk size     13880
 perslab      75

slab class  24
:
 chunk size     17352
 perslab      60

slab class  25
:
 chunk size     21696
 perslab      48

slab class  26
:
 chunk size     27120
 perslab      38

slab class  27
:
 chunk size     33904
 perslab      30

slab class  28
:
 chunk size     42384
 perslab      24

slab class  29
:
 chunk size     52984
 perslab      19

slab class  30
:
 chunk size     66232
 perslab      15

slab class  31
:
 chunk size     82792
 perslab      12

slab class  32
:
 chunk size    103496
 perslab      10

slab class  33
:
 chunk size    129376
 perslab       8

slab class  34
:
 chunk size    161720
 perslab       6

slab class  35
:
 chunk size    202152
 perslab       5

slab class  36
:
 chunk size    252696
 perslab       4

slab class  37
:
 chunk size    315872
 perslab       3

slab class  38
:
 chunk size    394840
 perslab       2

slab class  39
:
 chunk size    493552
 perslab       2

slab class  40
:
 chunk size    616944
 perslab       1

slab class  41
:
 chunk size    771184
 perslab       1

slab class  42
:
 chunk size   1048576
 perslab       1

 

3. 举个例子来分析

首先,是memcached启动时候的情况:
商人A很有钱,他有100个大小一摸一样的仓库(100M的memcached服务器,每个page大小1M,就是一个仓库)。商人A根据自己的商品尺寸,将自己的仓库分成了42种(42个slab),定义为最小一种的仓库是专门用来存放尺寸为96的货物的(slab1大小为96个字节),然后每种仓库存放的货物大小都是之前一种的1.25倍(增长因子-f为1.25)。商人预先将42个仓库按照预定义的42种货物大小整理、装修了下(memcached启动时候的42个slab预分配、chunk分割)。1号仓库(slab1)中有10922个(1M * 1024 * 1024 / 96)货物存储空间(chunk),后续的仓库类型的装修、空间分配都以此类推。

其次,来看下slab满了的时候的情况:
商人A进了一批尺寸是150的货物,共6899个。货物按大小分配,进入3号仓库( slab3)。因为3号仓库是仓库类型3,其大小只有6898个位置(6898个chunk),6898个货物被安置到仓库类型3(slab3)的3号仓库里去。然后还多出来一个货物没地方放,商人就安排了一个新的仓库装修成仓库类型3(1M的空间分配给slab3,大小为152个字节,含6898个chunk),然后将多余的一个货物放入到新的仓库里。

这个例子看过以后,相信大家都已经很明白前述的三个概念之间的关系以及memcached是如何分配内存空间的了。

4. memcached里的内存浪费

读过上文之后大家应该很明白memcached的内存分配方式了。memcached这样分配内存的好处是不会存在内存碎片,但是坏处也很明显,就是内存的浪费。就拿前面的商人例子来说,如果遇到一种极端的情况,所有的货物进来的都是121个字节的大小,那么按逻辑他们都会被分到slab3里面去,也就是分到大小是152的slab里,也就是说每塞进一个对象,就会有31个字节的内存空间被浪费掉了。

5. memcached的数据回收机制

memcached内部不会监视记录是否过期,而是在get时查看记录的时间戳,检查记录是否过期。 这种技术被称为lazy(惰性)expiration。因此,memcached不会在过期监视上耗费CPU时间。如果某一个item在memcached里过期了,这个东西并不会被删除,而是客户端无法再看见该记录(invisible,透明), 其存储空间即可重复使用。一般情况下memcached会优先使用已超时的记录的空间,但即使如此,也会发生追加新记录时空间不足的情况, 此时就要使用名为 Least Recently Used(LRU)机制来分配空间。 顾名思义,这是删除“最近最少使用”的记录的机制。 因此,当memcached的内存空间不足时(无法从slab class 获取到新的空间时),就从最近未被使用的记录中搜索,并将其空间分配给新的记录。

以上,主要是memcached的内存分配利用的一些经验。当然,memcached的配置、调优、监控在这篇文章里是没有涉及的,以后有机会的话会补上。

分享到:
评论

相关推荐

    memcached全面剖析–4. memcached的分布式算法.txt

    memcached全面剖析–4. memcached的分布式算法.txt

    memcached 64位 window

    标题"memcached 64位 window"指的是在Windows操作系统上运行的64位版本的Memcached缓存系统。Memcached是一种分布式内存对象缓存系统,广泛用于减轻数据库负载,提高Web应用的性能。由于是64位版本,这意味着它可以...

    memcached安装软件 libevent magent memcached

    Memcached是一款高性能、分布式内存对象缓存系统,广泛应用于Web应用中,用于减轻数据库的负载。它通过在内存中存储数据来提供快速的数据访问,从而提高应用的性能。本篇文章将详细讲解如何安装和配置memcached,...

    memcached windows稳定版

    在终端(也即cmd命令界面)下输入 ‘c:\memcached\memcached.exe -d install’ 安装 3. 再输入: ‘c:\memcached\memcached.exe -d start’ 启动。NOTE: 以后memcached将作为windows的一个服务每次开机时自动启动...

    memcached安装包以及MemCachedClient

    **Memcached 安装与使用详解** Memcached 是一款高性能的分布式内存缓存系统,用于在Web应用中减轻数据库负载。它将数据存储在内存中,以键值对的形式提供快速访问,尤其适用于高并发场景。Memcached 使用简单,可...

    memcached服务器端memcached.exe 下载

    标题“memcached服务器端memcached.exe 下载”指的是获取memcached服务端的可执行文件,`memcached.exe`是Windows环境下运行memcached服务的程序。这个绿色版的memcached意味着它无需安装,下载解压后即可直接运行,...

    Memcached 1.2.1.0 For Windows

    1、安装:memcached.exe –d install 2、启动:memcached.exe -d start 此时memcached已经注册为开机启动服务完成安装。 使用参数: -p 监听的端口 -l 连接的IP地址, 默认是本机 -d start 启动memcached服务 -d ...

    windows下memcached+memcached.dll 5.3.8

    标题中的“Windows下memcached+memcached.dll 5.3.8”指的是在Windows操作系统上安装和使用Memcached服务的场景,其中`memcached.dll 5.3.8`是Memcached服务器的一个特定版本的动态链接库文件。Memcached是一款高...

    memcached-1.5.11.tar.gz

    《深入理解Memcached:基于1.5.11版本的剖析》 Memcached,一个高性能、分布式的内存对象缓存系统,广泛应用于Web应用中,用于减轻数据库的负载,提高数据访问速度。本文将深入探讨Memcached的1.5.11版本,解析其...

    深入理解redis_memcached失效原理(小结)

    本文主要讨论了这两种技术的缓存失效原理,特别是针对 Redis 的失效机制进行了深入解析。 首先,我们要明白如何触发 key 的失效。Redis 中,除了使用 `PERSIST` 命令撤销 key 的失效时间之外,以下几种情况也会导致...

    Memcached实例与文档

    建议仔细阅读和实践,以便深入理解和掌握Memcached。 总之,Memcached作为一款强大的缓存系统,对于优化数据库性能、提升Web应用响应速度具有显著作用。通过深入学习提供的实例和文档,无论是Java开发者还是其他...

    Memcached完全剖析(转)

    **Memcached 完全剖析** Memcached 是一个高性能、分布式内存对象缓存系统,它用于在Web应用中加速动态数据的访问。...通过深入了解其工作原理和实践技巧,我们可以更好地利用 Memcached 来优化我们的应用程序。

    memcached-1.5.4

    总结,`memcached-1.5.4`是实现高效缓存的关键组件,其源码的阅读与编译有助于深入理解内存缓存的工作原理,优化Web应用性能。通过熟悉`memcached`的配置、运行以及与其他技术的集成,开发者可以更好地利用此工具来...

    安装Memcached及Memcached配置

    Memcached 是一个高性能的分布式内存对象缓存系统,常用于减轻数据库负载,提高Web应用的响应速度。在本文中,我们将详细介绍如何安装和配置...了解并掌握上述知识,将有助于你在实际项目中有效地利用Memcached。

    memcached-笔记资料

    【标题】"memcached-笔记资料"涉及到的核心知识点是分布式内存缓存系统——Memcached,它是一个高性能、轻量级的缓存...学习者可以通过这些材料深入理解Memcached的工作机制,提升在实际项目中运用分布式缓存的能力。

    memcached开发完整demo

    **memcached 开发完整demo详解** `memcached` 是一个高性能、分布式的内存对象缓存系统,用于在动态系统中减少数据库负载,提升...通过深入理解和掌握`memcached` API,你能够构建出更高效、更可靠的分布式缓存系统。

    python-memcached python-memcached

    Python-memcached是Python语言的一个库,用于与Memcached缓存系统进行交互。Memcached是一种高性能、分布式内存对象缓存系统,广泛应用于Web应用中,用于减轻数据库的负载,提高数据访问速度。Python-memcached库则...

    memcached.exe及memcached.dll

    **Memcached:高性能分布式内存缓存系统** Memcached是一款开源、高性能、分布式内存对象缓存系统,用于在动态系统中减少数据库负载,提升应用程序性能。它通过存储数据和对象到内存中,使得频繁访问的数据可以更快...

    hibernate-memcached包

    **hibernate-memcached包** 是一个专为Hibernate框架设计的扩展,目的是将流行的分布式内存缓存系统Memcached整合到Hibernate中,作为其二级缓存解决方案。在大型分布式应用中,缓存技术是提高性能的关键,特别是...

Global site tag (gtag.js) - Google Analytics