原文地址:http://www.cnblogs.com/mecity/archive/2011/06/13/Memcached.html
关于Memcached的博文太多了,以下是个人学习的收集整理。
本节讨论问题:
简单介绍与应用
下载安装注意事项
简单测试
Memcached分布式原理
一、介绍与应用
在常规的WEB开发下,基本都会利用到缓存用以降低对数据库的压力,提高访问速度。有时候缓存的数据多了,并且其它站点也想获取这些缓存数据时就出现在了问题。通常IIS站点都是以应用程序池划分管理,同一个池下又可划分多个应用程序域,不管是不同的应用程序域或是不同应用程序池,其之间的缓存都是无法相互访问的。因此很多站点就会重复建立相同的缓存,以便访问。但是,一旦一个站点的缓存被更新了,又如何通知其它站点更新呢。我记得Discuz.net中做法,是通过监控配置文件的修改来实现的,其原理就是一个站点缓存更新了,就去修改对应的配置文件中的项。其它站点监控到配置文件被修改,就去检查哪一项目被改了,然后重新加载缓存。是不是不太灵活?如果缓存的数据要分布到其它服务器上,以降低对同一台服务器的压力,如何实现呢?缓存服务器又如何实现扩展呢?这便是我们这篇Memcached引入的原因。有做即时通讯,游戏大厅的还可以采用一下shuttler.net。
关于Memcached以下为摘自博文http://www.cnblogs.com/zjneter/archive/2007/07/19/822780.html
Memcached是什么?
Memcached是由Danga Interactive开发的,高性能的,分布式的内存对象缓存系统,用于在动态应用中减少数据库负载,提升访问速度。
Memcached能缓存什么?
通过在内存里维护一个统一的巨大的hash表,Memcached能够用来存储各种格式的数据,包括图像、视频、文件以及数据库检索的结果等。
Memcached快么?
非常快。Memcached使用了libevent(如果可以的话,在linux下使用epoll)来均衡任何数量的打开链接,使用非阻塞的网络I/O,对内部对象实现引用计数(因此,针对多样的客户端,对象可以处在多样的状态), 使用自己的页块分配器和哈希表, 因此虚拟内存不会产生碎片并且虚拟内存分配的时间复杂度可以保证为O(1).。
Memcached的特点?
Memcached的缓存是一种分布式的,可以让不同主机上的多个用户同时访问, 因此解决了共享内存只能单机应用的局限,更不会出现使用数据库做类似事情的时候,磁盘开销和阻塞的发生。
二、下载与安装
服务端与For .net开发下载 可以参照这篇博文http://blog.csdn.net/cnkiminzhuhu/archive/2009/10/28/4739859.aspx
客户端的版本比较多,并且不能互用,因为采用了压缩机制,日志等功能,所以在选择客户端时要注意这些。
服务端源码 下载
a.windows下 直接使用memcached.exe 程序就可以了,也可以将此程序安装为windows服务。安装为windows服务后要通过telnet命令来操作服务端
命令行输入 'c:\memcached\memcached.exe -d install'
命令行输入 'c:\memcached\memcached.exe -d start' ,该命令启动 Memcached ,默认监听端口为 11211
b.安装为单一服务不方便管理,这里有借助于memcacheddotnet_clientlib开发的一款服务端管理工具
服务端管理工具 下载 解压安装后工具里的memcached.exe比较老,可直接用最新的替换掉
我们来看一下服务端工具安装后文件结构
运行服务端管理工具,创建memcached服务端,以下为演示步骤
1 服务端配置
2 添加Memcached服务
3 状态观察
4.查看Generate配置信息,提供给客户端配置文件使用.
借助服务端管理工具可以方便的观察,或者你也可以采用telnet方式访问查看了。这样服务端工作就进行了完了,接下来就是要选择一款合的客户端开发了
Windows / .NET
a. .Net memcached client 1.1.5版本测试一下。
https://sourceforge.net/projects/memcacheddotnet
b. .Net 2.0 memcached client 这款应用比较广泛,不过好长时间没有更新了,最后一次更新是在2009.10 (网上其它链接提供的下载版本太老了)
http://www.codeplex.com/EnyimMemcached
Client developed in .NET 2.0 keeping performance and extensibility in mind. (Supports consistent hashing.)
http://www.codeplex.com/memcachedproviders (PDF 文档)
Current Release Memcached Providers 1.2(最后一版正式版)(1.2以后到1.4.4 for win32 应该都不是正式版了)
- Walkthoughs on how to setup and use Memcached Cache Provider and Session State Provider is added to the Memcached Providers 1.2
按照上面的意思Session State Provider is added 会话状态保存的功能已经有了? 经过下载解压后确认是有了这个功能,从1.2版本以后增加了SQL 脚本,即将Session保存到数据库中了-_-|||。很多人担心的Session问题终于有着落了。
c. BeIT Memcached Client (optimized C# 2.0) 这款最后一次更新时间是2010.8.4
http://code.google.com/p/beitmemcached
d. jehiah
http://jehiah.cz/projects/memcached-win32
经过一番比较,我还是比较看中a,b,c三款,分别下载下来测试一下吧。(鉴于服务端管理工具匹配还是推荐enyim比较好)
三、简单测试
1.memcacheddonet client测试 1.1.5版本 源码有SRC包
View Code
分别设置了3台,4台,5台服务器测试了3次,测试结果如下:
100条数据都确实存上去成功了,但是取数据命中率会随着服务器增多急剧下降!才几台测试服务器,结果就如此差!问题出在哪里了呢? 服务器的memcached.exe太老了? 还是看一下memcached的实现原理了
这里有我之前下载的一版memcached的原理介绍 下载
里面提到查找服务器端数据的算法 是求余算法 ,而这中算法的命中率很差,并且随便服务器节点的变动(增加或删除节点)命中率急剧下降。
难道是这个原因? 了解到memcached的客户端算法已经修改为Consistent Hashing算法,难道是我下载的客户端版本确实很老了? 顺便说一下这个Consistent Hashing算法是将服务器按环形分布在一个圆上,按我个人理解,服务器数量越多,环形分布越相对稳定,这个时候增删服务器对定位的影响都比较小。在之后两个客户端的版本再测试一次看看结果,这节就到这里吧。附一张用MemcacheD Manager监控图
Memcached分布式原理
由于测试读取数据的命中率太差,去查阅了一下Memcached的分布式原理。
先看一下应用场景
第一次访问先从数据库中得到数据并保存到缓存中,第二次再读数据就从缓存中获取,这是正常情情,当第二次没有命中数据?这个时候你是否回数据库中读取数据呢?读取数据后,你是否还要保存到缓存中呢,但这个数据缓存中又是存在的,如何处理呢? 这就是Memcached客户端没有命中数据导致的后果。
我们来看一下Memcached的原理:
memcached虽然称为“分布式”缓存服务器,但服务器端并没有“分布式”功能,而是完全由客户端程序库实现的。服务端之间没有任何联系,数据存取都是通过客户端的算法实现的。客户端初始化的获取所有服务器的哈希列表,当需要存取数据就会检索这个哈希列表查找到对应的服务器。看下图
当客户端要存取数据时,首先会通过算法查找自己维护到的服务器哈希列表,找到对应的服务器后,再将数据存往指定服务器。这里关键点是使用了什么算法!
这个问题也不追查,接着往下看,我来再去取原先这个数据
查找数据的原理和存取的原理是一样,首先通过算法在维护的哈希列表查到对应服务器,然后再去指定服务器读取数据。那问题来了,他是如何准确的找到这台服务器的呢?算法,算法就是他的原因,只要你在存和取的时候使用的算法是一样的,那算法计算的结果也是一致的,所以就可以正确的找到服务器了。
那为什么我们在第三节的测试中,命中率会如此之差呢?
我们使用的Memcachedonet client 老版本使用的是求余算法,我们来看看这个求余算法的定义--“根据服务器台数的余数进行分散”。即求得键的整
数哈希值,再除以服务器台数,根据其余数来选择服务器。我们在存数据的时候,计算出这个数据键的CRC值,用这个值除以服务器台数求得余数来存往指定的服务器。那反过来取数据依然是这个算法,那结果肯定是一致的。问题是,为什么不同台数的服务器测试中,命中率会变化这么大呢。余数计算的方法简单,数据的分散性也相当优秀,但也有其缺点。那就是当添加或移除服务器时,缓存重组的代价相当巨大。添加服务器后,余数就会产生巨变,这样就无法获取与保存时相同的服
务器,从而影响缓存的命中率。因为增删服务器后,数据键的CRC值是不变的,但是服务器的台数变了,导致求余的结果也发生变化了,从而影响了命中率。
我们再来看一下改进的Consistent Hashing算法,可以确定是的,Memcachedonet的版本是没有采用这个算法。
Consistent Hashing如下所示:首先求出memcached服务器(节点)的哈希值,并将其配置到0~2的32次方的圆(continuum)上。然后用同样的方法求出存储数据的键的哈希值,并映射到圆上。然后从数据映射到的位置开始顺时针查找,将数据保存到找到的第一个服务器上。如果超过2的32次方仍然找不到服务器,就会保存到第一台memcached服务器上。
当从上图的状态中添加一台memcached服务器。余数分布式算法由于保存键的服务器会发生巨大变化而影响缓存的命中率,但Consistent Hashing中,只有在continuum上增加服务器的地点逆时针方向的第一台服务器上的键会受到影响。如下图
从上图可以看到,添加新的节点5时并不会重新分布所有节点,而是在之前的基础上某个位置插入新的节点,这样保证了整体的分布没有发生太大变化,并且顺时针方向的没有影响,逆时针方向的从第一台就开始有影响了。因此,Consistent Hashing最大限度地抑制了键的重新分布。但是这样的误差还是有的,因为根据服务器的哈希值来分布本身就是不均匀的。后面有提到改进的Consistent Hashing算法,即在圆环上预先分布为每台服务器分布一定数量的虚定拟节点,相当于我们均匀分布了圆环上的节点,当有节点增加或删除时都是在指定的位置上进行的就抑制了分布不均匀,最大限度地减小服务器增减时的缓存重新分。使用Consistent Hashing算法的memcached客户端函数库进行测试的结果是,由服务器台数(n)和增加的服务器台数(m)计算增加服务器后的命中率计算公式如下:(1 n/(n+m)) * 100
(参考之前提供下载的PDF原理一文)
memcachedonet 使用的是余数算法,可能是导致误差的原因。在下一节中,我们来学习一下enyim.client(memcachedproviders),并进行相关测试。
分类: Memcached
标签: memcache, memcached, cache, enyim
分享到:
相关推荐
总之,`.NET分布式缓存Memcached从入门到实战源码下载`这个资源提供了一个全面的学习平台,涵盖了Memcached的使用、集成、测试等方面,帮助开发者深入理解如何在.NET环境中高效地利用分布式缓存提升应用性能。...
`memcached` 是一个高性能、分布式的内存对象缓存系统,它广泛应用于Web应用中,用于减轻数据库的负载,通过将数据存储在内存中来提高数据访问速度。这个`memcached for win32` 包是专为在32位Windows操作系统上运行...
Memcached是一个高效、轻量级的分布式内存对象缓存系统,特别适用于动态Web应用,用于减少对数据库的访问频率,从而提升网站性能。它的核心功能是存储键值对,将数据临时存储在内存中,以快速响应来自应用程序的请求...
│ 第108节:聚合框架第一部分.avi │ 第109节:聚合框架第二部分.avi │ 第110节:聚合框架第三部分.avi │ 第111节:理解文档存储机制.avi │ 第112节:MongoDB的索引一.avi │ 第113节:MongoDB的索引二.avi │ ...
Memcached是一种高性能的分布式内存对象缓存系统,用于减轻数据库负载,加速动态Web应用,提高网站访问速度。其通过缓存数据库查询结果减少数据库访问次数,通过缓存动态页面和整个网页大幅度降低构建动态网页所需的...
在第67讲“分析如何使用Memcached开发”中,讲师详细介绍了Memcached这种分布式内存对象缓存系统。讲解了Memcached的工作原理、安装配置以及在Java项目中的应用,帮助学员理解如何使用Memcached来提高应用程序的数据...
MemCached是指使用MemCached来实现分布式缓存。 特点是指使用MemCached的特点和优势。 内存分配是指使用MemCached来分配内存。 缓存策略是指使用MemCached的缓存策略。 缓存数据库查询是指使用MemCached来查询...
**Memcached** 是另一个常见的分布式内存对象缓存系统,用于减轻数据库负载。与Redis不同,Memcached只支持简单的键值对存储,不支持复杂的数据结构。其优势在于轻量级、快速和易于部署,适合短期存储不需持久化的...
云数据库Memcache版快速入门主要介绍了阿里云提供的基于Memcached协议的分布式内存缓存服务,旨在提升应用程序的数据访问速度和性能。以下是对该服务关键知识点的详细说明: 1. **协议支持**: - **Memcached ...
Memcached是一种分布式内存缓存系统,常用于减轻数据库压力。本讲将教授如何安装、配置和使用Memcached,以及如何设计合理的缓存策略,以提高应用程序的响应速度和并发处理能力。 第54讲关注的是性能调优和配置使用...
阿里云的云数据库Memcache版是一款基于分布式内存计算技术的高性能缓存服务,它提供了对Memcached协议的全面支持,让任何兼容Memcached协议的客户端都能无缝接入。该服务旨在提高应用程序的性能,减少对数据库的压力...
在第一章"Redis 快速入门"中,作者介绍了Key-Value存储系统的背景,这是Redis的基础。Key-Value存储系统是一种简单高效的数据存储模型,其中每个键都有一个对应的值,这种模型特别适合大规模数据的快速读写操作。 ...
二级缓存可选,可以使用第三方缓存如Ehcache或分布式缓存如Memcached,以支持多服务器共享。 4. **数据服务层**: - 数据库通常位于三层架构的数据服务层,Oracle是一个常用的关系型数据库管理系统,提供高效稳定...
1. 入门:从官方文档开始,了解 Spring Boot 的基本概念和特点,学习如何创建第一个“Hello, World!”应用。 2. 自动配置:深入理解自动配置机制,了解 @EnableAutoConfiguration 注解是如何工作的,以及如何自定义...
- **lpop**/**rpop**:移除列表的第一个/最后一个元素。 - **rpoplpush**:移除列表的最后一个元素并将其添加到另一个列表的开头。 - **lindex**:获取列表中指定位置的元素。 - **llen**:获取列表的长度。 ##### ...
- **LPOP**: 移除并返回列表的第一个元素。 - **RPOP**: 移除并返回列表的最后一个元素。 ##### 2.5 Sets类型及操作 - **SADD**: 向集合添加一个或多个成员。 - **SMEMBERS**: 返回集合中的所有成员。 - **SCARD**:...
memcached是一种基于内存的分布式缓存系统,主要用于加速动态Web应用程序的速度。通过缓存数据库查询结果、页面和其他任何可以缓存的东西,memcached减轻了数据库的负载并提高了网站的响应速度。 ##### 1.1.6 ...