淘宝在Memcached使用记录

san_yun

浏览: 2669596 次
来自: 杭州

最近访客更多访客>>

空城旧梦why

sd3870181

alexqdjay

hanmiao

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

memcached

原文：http://blog.csdn.net/cenwenchu79/article/details/2512669

我对于Memcached的接触，还是在去年看了CSDN的一系列国外大型网站架构设计而开始的。最初的时候只是简单的封装了Memcached Java版的客户端，主要是对于配置的简化以及Memcached多点备份作了一些工作，然后就作为ASF的组件一部分提供给其他Team使用。其实看过 Memcached Java客户端代码的人就会了解其实客户端的事情很简单，就是要有一套高性能的Socket通信框架以及对Memcached的私有协议实现的接口，自己去做这些事情也是很简单的，不过既然有可以满足自己需求的开源部分，那么就去实现自己需要的但没有实现的。这里我用的是Whalin的客户端版本，这里为什么还要提出来讲这个，后面会提到。

在对Java客户端作了简单封装和扩展以后，由于其他Team使用的没有什么特殊需求，也就没有再去做太多的修改，直到最近自己的服务集成平台需要做服务访问控制，才重新丰富了Cache组件，也就是这个过程中对于Memcached的一些特性和小的细节有了一些新的认识。

作为服务集成平台需要对服务有所监控，包括访问频率控制以及访问次数控制。频率控制其实很类似于硬件方面的频率控制，例如硬件可以对IP的高频率访问视为攻击，列入黑名单。而作为服务的访问，对于服务访问者的控制其实涉及到了业务参数，那么硬件就不是很适合去做这方面的控制，为此我也考虑了很久，最开始打算在Apache上做一个模块控制，但是最后觉得还是放在后面的业务框架上做这件事情。当然后面我说说的方案可能并不好，但是也算是一种想法。要把频繁的访问数据记录下来同时分析，那么数据库肯定是不行的，最简单的方式就是采用Cache，又因为是集群范围内的控制，那么集中式Cache就非Memcached莫数了（分布式的Cache传播本身损耗太大，集中式Cache本来的最大缺点就是单点，但作简单的备份操作就可以基本解决此类问题）。

作为解决这个问题的方法来说只需要实现两部分工作：访问计数器，定时任务。定时任务在我做日志分析框架的时候都是采用了Jdk5的Concurrent包里面的ScheduledExecutorService，这个作简单的循环任务足够用了，同时也是有很好的多线程异步支持，复杂一点么用Quartz。计数器就要靠Memcached来实现了，本来一般的Cache最大的问题就是高并发下的事务保证，如果采用Get+Set来完成计数的话，那么高并发下计数器就会出现读写不一致性的问题，幸好Memcached提供了计数累加功能，让这种累加动作能够在服务端一次做好，服务端控制并发写入，保证数据的一致性。

下面就看看以下几个方法：

boolean storeCounter(String key, long count)：存储key的计数器，值为count。

long getCounter(String key)：获取key的计数器，如果不存在返回-1。

long addOrDecr(String key, long decr)：计数器值减去decr，如果计数器不存在，保存decr作为计数器值

long addOrIncr(String key, long inc)：计数器值增加inc，如果计数器不存在，保存inc作为计数器值

long decr(String key, long decr)：与addOrDecr不同的是在计数器不存在的时候不保存任何值，返回-1

long incr(String key, long inc) ：与addOrIncr不同的是在计数器不存在的时候不保存任何值，返回-1

这里需要说明几点：

storeCounter和普通的set方法不同，如果通过set方式置入key:value的话，getCounter等其他四个方法都认为技术器不存在。所以Counter的存储方式是和普通内容存储不同的。

在不同的场景要慎用addOrXXXX和XXXX的方法，两者还是有比较大的区别的。

计数器没有提供移除特殊方法，使用delete方法可以移除计数器，但是频繁的 delete和addOrXXXX有时候会出现一些奇怪的问题（例如同名的计数器就没有办法再次被创建，不过这个还需要进一步的去研究一下看看）。一般情况下如果计数器的key不是很多，同时也会被复用，那么可以通过置为0或者减去已经分析过的数量来复位。

有上面的一套计数器机制就可以很方便的实现Memcached的计数功能，但是又一个问题出现了，如何让定时任务去遍历计数器，分析计数器是否到了阀值，触发创建黑名单记录的工作。早先我同事希望我能够提供封装好的keySet接口，但是我自己觉得其实作为Cache来说简单就是最重要的，Cache不需要去遍历。首先使用Cache的角色就应该知道Key，然后去Cache里面找，找不到就去后台例如 DB里面去搜索，然后将搜索的结果在考虑更新到Cache里面，这样才是最高效并且最可靠的，Cache靠不住阿，随时都可能会丢失或者崩溃，因此作为类似于一级缓存或者这类数据完整性要求不高，性能要求很高的场景使用最合适。当时就没有提供这样的接口，直到今天自己需要了，才考虑如何去做这件事情。

开始考虑是否能够将key都记录在另外的Cache中或者是Memcached中，首先在高并发下更新操作就是一大问题，再者Memcached的内存分配回收机制以及Value的大小限制都不能满足这样的需求，如果使用数据库，那么频繁更新操作势必不可行，采用异步缓存刷新又有一个时间间隔期，同时更新也不是很方便。最后考虑如果能够让Memcached实现Keyset那么就是最好的解决方案，网上搜索了一下，找到一种策略，然后自己优化了一下，优化后的代码如下：

@SuppressWarnings ( "unchecked" )

public Set keySet( int limit, boolean fast)

{

Set<String> keys = new HashSet<String>();

Map<String,Integer> dumps = new HashMap<String,Integer>();

Map slabs = getCacheClient().statsItems();

if (slabs != null && slabs.keySet() != null )

{

Iterator itemsItr = slabs.keySet().iterator();

while (itemsItr.hasNext())

{

String server = itemsItr.next().toString();

Map itemNames = (Map) slabs.get(server);

Iterator itemNameItr = itemNames.keySet().iterator();

while (itemNameItr.hasNext())

{

String itemName = itemNameItr.next().toString();

// itemAtt[0] = itemname

// itemAtt[1] = number

// itemAtt[2] = field

String[] itemAtt = itemName.split( ":" );

if (itemAtt[2].startsWith( "number" ))

dumps.put(itemAtt[1], Integer.parseInt(itemAtt[1]));

}

if (!dumps.values().isEmpty())

{

Iterator<Integer> dumpIter = dumps.values().iterator();

while (dumpIter.hasNext())

{

int dump = dumpIter.next();

Map cacheDump = statsCacheDump(dump,limit);

Iterator entryIter = cacheDump.values().iterator();

while (entryIter.hasNext())

{

Map items = (Map)entryIter.next();

Iterator ks = items.keySet().iterator();

while (ks.hasNext())

{

String k = (String)ks.next();

try

{

k = URLDecoder.decode(k, "UTF-8" );

}

catch (Exception ex)

{

Logger .error(ex);

}

if (k != null && !k.trim().equals( "" ))

{

if (fast)

keys.add(k);

else

if (containsKey(k))

keys.add(k);

}

return keys;

}

对于上面代码的了解需要从 Memcached 内存分配和回收机制开始，以前接触 Memcached 的时候只是了解，这部分代码写了以后就有些知道怎么回事了。 Memcached 为了提高内存的分配和回收效率，采用了 slab 和 dump 分区的概念。 Memcached 一大优势就是能够充分利用 Memory 资源，将同机器或者不同机器的 Memcached 服务端组合成为对客户端看似统一的存储空间， Memcached 可以在一台机器上开多个端口作为服务端多个实例，也可以在多台机器上开多个服务实例，而 slab 就是 Memcached 的服务端。下面是我封装后的 Cache 配置：

<?xml version="1.0" encoding="UTF-8"?>

</client>

</client>

</client>

<socketpool name = "pool0" failover = "true" initConn = "10" minConn = "5" maxConn = "250" maintSleep = "0"

nagle = "false" socketTO = "3000" aliveCheck = "true" >

</socketpool>

<socketpool name = "pool1" failover = "true" initConn = "10" minConn = "5" maxConn = "250" maintSleep = "0"

nagle = "false" socketTO = "3000" aliveCheck = "true" >

</socketpool>

<socketpool name = "pool11" failover = "true" initConn = "10" minConn = "5" maxConn = "250" maintSleep = "0"

nagle = "false" socketTO = "3000" aliveCheck = "true" >

</socketpool>

<memCachedClients> mclient1,mclient11 </memCachedClients>

</cluster>

</memcached>

可以看到其实 pool 才是最终连接服务端的配置，看看 pool0 ，它会连接 10.2.225.210:13000,10.2.225.210:13001,10.2.225.210:13002 这些机器和他们的端口，但是对于使用 pool0 的 mclient0 来说它仅仅只是知道有一个叫做 mclient0 的 cache 可以保存数据。此时 slab 就有三个： 10.2.225.210:13000 和 10.2.225.210:13001 和 10.2.225.210:13002 。

当一个 key:value 要被放入到 Memcached 中，首先 Memcached 会根据 key 的 hash 算法获取到 hash 值来选择被分配的 slab ，然后根据 value 选择适合的 dump 区。所谓 dump 区其实就是根据 value 的大小来将内存按照存储单元内容大小分页。这个是可以配置 Memcached 的，例如 Memcached 将 slab 中的内存划分成 4 个 dump ，第一 dump 区存储 0-50k 大小的数据，第二 dump 区存储 50-100k 的数据，第三 dump 区存储 100-500k 的数据 , 第四 dump 区存储 500-1000K 的数据。那么当 key:value 需要被写入的时候，很容易定位到 value 所处的 dump ，分配内存给 value 。这种分 dump 模式简化内存管理，加速了内存回收和分配。但是这里需要注意的几点就是，首先当你的应用场景中保存的数据大小离散度很高，那么就不是很适合 Memcached 的这种分配模式，容易造成浪费，例如第一 dump 区已经满了，第二第三 dump 区都还是只有一个数据，那么第二第三 dump 区不会被回收，第二第三 dump 区的空间就浪费了。同时 Memcached 对于 value 的大小支持到 1M, 大于 1M 的内容不适合 Memcached 存储。其实在 Cache 的设计中这样的情况发生本来就证明设计有问题， Cache 只是加速，一般保存都是较小的 id 或者小对象，用来验证以及为数据定位作精准细化，而大数据量的内容还是在数据库等存储中。

知道了基本的分配机制以后再回过头来看看代码：

Map slabs = getCacheClient().statsItems();// 获取所有的 slab

// 用来收集所有 slab 的 dump 号

while (itemsItr.hasNext())

{

String server = itemsItr.next().toString();

Map itemNames = (Map) slabs.get(server);

Iterator itemNameItr = itemNames.keySet().iterator();

while (itemNameItr.hasNext())

{

String itemName = itemNameItr.next().toString();

// itemAtt[0] = itemname

// itemAtt[1] = number

// itemAtt[2] = field

String[] itemAtt = itemName.split( ":" );

// 如果是 itemName 中是 :number 来表示，那么证明是一个存储数据的 dump ，还有一些是 age 的部分

if (itemAtt[2].startsWith( "number" ))

dumps .put(itemAtt[1], Integer.parseInt(itemAtt[1]));

}

// 根据收集到的 dump 来获取 keys

if (!dumps.values().isEmpty())

{

Iterator<Integer> dumpIter = dumps.values().iterator();

while (dumpIter.hasNext())

{

int dump = dumpIter.next();

// statsCacheDump 支持三个参数 String[],int,int ，第一个参数可以省略，默认填入 null ，表示从那些 slab 中获取 dump 号为第二个参数的 keys ，如果是 null 就从当前所有的 slab 中获取。第二个参数表示 dump 号，第三个参数表示返回最多多少个结果。

Map cacheDump = statsCacheDump(dump,limit);

Iterator entryIter = cacheDump.values().iterator();

while (entryIter.hasNext())

{

Map items = (Map)entryIter.next();

Iterator ks = items.keySet().iterator();

while (ks.hasNext())

{

String k = (String)ks.next();

try

{

// 这里为什么要作 decode ，因为其实在我使用的这个 java 客户端存储的时候，默认会把 key 都作 encoding 一次，所以必须要做，不然会出现问题。

k = URLDecoder.decode(k, "UTF-8" );

}

catch (Exception ex)

{

Logger .error(ex);

}

if (k != null && !k.trim().equals( "" ))

{

// 这里的 fast 参数是在方法参数中传入，作用是什么，其实采用这种搜索 slab 以及 dump 的方式获取 keys 会发现返回的可能还有一些已经移除的内容的 keys ，如果觉得需要准确的 keys ，就在做一次 contains 的检查，不过速度就会有一定的影响。

if (fast)

keys.add(k);

else

if (containsKey(k))

keys.add(k);

}

至此，整个 keySet 的问题解决了，对于即时监控也基本都作好了，这里需要把过程中的两件小事情说一下。

1. statsCacheDump 始终不能用。

刚开始的时候 statsCacheDump 方法始终报错说连接超时，跟踪到了 java 客户端代码中发现并不是什么连接超时，只是服务端返回了错误信息，而客户端认为还没有结束一直等待，导致超时。我就顺手给 java 客户端的开发人员 mail 了信息求助（代码里面有 email ）。再仔细看了看出错信息，返回的是不认识该指令的错误，因此就去解压 memcached 的服务端，看了看它的协议说明，这个 Stat 方法还是有的，很奇怪，没有办法了，虽然自己对于 c 不是很懂，但起码大致看懂逻辑还是不难，下载了 Memcached 的源码一看，发现居然对于 StatsCacheDump 这个方法调用必须还有一个参数 limit ，在我手头的客户端代码里面就没有这个参数，所以错误了，本来想扩展一下那个方法，但是那个方法中实现的不是很好，都是 private 的不容易扩展，这时候居然收到其中一个客户端开发者的回复邮件，说我手头的代码太老了，同时不建议去实现 keyset ，认为这样比较低效。我去下载了一个新版本，看了看源码果然已经修复了，我就回了邮件表示感谢，同时也和他说明了这么做的原因。因此大家如果要和我一样写上面的代码，就需要它 2.0.1 的那个版本。这里对那些国外的开源工作者表示敬佩，对于开发者是很负责任的。

2 ．关于 fast 那个选项

这个是我加上去的，做了一下测试，例如我先执行如下代码：

Cache.set(“key1”,”value1”);

Cache.set(“key2”,”value2”);

Cache.flushAll(null);

Cache.set(“key3”,”value3”);

Cache.set(“key4”,”value4”);

Boolean fast = true;

Set keys = Cache.keySet(fast);

System.out.println(keys);

Fast = false;

keys = Cache.keySet(fast);

System.out.println(keys);

得到的结果为：

Key1,key2,key3,key4

Key3,key4

可以看到其实如果通过 StatsCacheDump 来获取得到的 keys 会参杂一些已经失效的 keys, 只是没有回收，本来尝试获取时间戳来做判断，不过还不如使用 containsKey 来的有效。

同时这里采用 containsKey 而不是用 get ，就是因为 counter 是不能用 get 获得的，即使 counter 存在。

这些就是今天在使用 Memcached 所收获的，分享一下，如果有一些理解上的偏差也希望能够被指出。

分享到：

使用memcache实现高并发计数器 | memcache的API

2012-07-21 14:04
浏览 5458
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论