本文主要参考了charlee翻译的《Memcached全面剖析》
1. Memcached是什么?
许多Web应用都将数据保存到RDBMS中,应用程序从中读取数据并在浏览器中显示。但随着数据量的增大和访问的集中,就会出现(问题出现:)RDBMS的负载加重、数据库响应恶化、网站显示延迟等重大影响。
What is Memcached?
Free & open source, high-performance, distributed memory object caching system, generic in nature, but intended for use in speeding up dynamic web applications by alleviating database load.
Memcached is an in-memory key-value store for small chunks of arbitrary data (strings, objects) from results of database calls, API calls, or page rendering.
Memcached是一个高性能的分布式内存对象缓存系统。目标是,通过缓存数据库查询、API调用或网页渲染结果,减少数据库(select)访问次数,以加速动态Web应用的响应速度,提高可扩展性。(通过减轻数据库负载来使动态Web应用提速)
这时就该Memcached大显身手了。
图1.1 一般情况下Memcached的用途
适用场景
Memcached适用于多查询(get)少更新的场景。对于更新数据操作,数据每次还是会落地到DB;而对于查询操作,若缓存命中则直接返回,无需再请求DB。
2. 特征
Key-Value
Simple Protocol
- set/cas/get/gets
- incr/decr
- stats
Lazy Expiration
LRU
Access
- telnet host port
- printf 'stats\r\n' | nc host port
简单协议
目前,Memcached使用简单的基于文本行的协议,还支持二进制协议。
常用操作命令
保存数据
set:store this data(无论存不存在键相同的数据,都保存)
cas (check and set):store this data but only if no one else has updated since I last fetched it(仅当从我上次取来之后没有人更新它时,才保存)
优势:防止高并发下的数据不一致问题。
如果操作失败,可以增加重试机制(2次get-cas)。
获取数据
get
gets:需要一次取得多条数据时使用(批量操作)。它可以非同步地同时取得多个键值,(优势:)其速度要比循环调用get快数十倍。
增一和减一操作
可以将Memcached上特定的键值作为计数器使用。但在实际项目中很少使用这个特性,因为它没落地数据,一旦服务器崩溃就全完了。对于单个维度的计数,可以使用redis的INCR和DECR命令或MySQL的handlersocket;对于用户的多维度计数,可以使用redis的hashes数据结构。
incr
decr
增一和减一是原子操作。但未设置初始值时,不会自动赋成0。因此,应当进行错误检查,必要时加入初始化操作。而且,服务器端也不会对超过232时的行为进行检查。
统计监控
stats:用于查询服务器维护的统计信息和其它内部数据
3. 内存存储
Slab Allocator机制:整理内存以便重复使用
目前,Memcached默认情况下使用Slab Allocator机制来分配、管理内存。在该机制出现以前,内存的分配是通过对所有记录简单地进行malloc和free来进行的。但是,(缺点:)这种方式会导致内存碎片,加重操作系统内存管理器的负担,在最坏的情况下,会导致操作系统比Memcached进程本身还慢。Slab Allocator就是为了解决该问题而诞生的。
Slab源于Jeff Bonwick为SunOS操作系统首次引入的一种内存处理机制。Slab的设计理念是基于对象缓冲的,基本想法是避免重复大量的初始化和清理操作。(用途:)Slab主要用于频繁分配释放的内存对象。如果是采用系统自带的malloc/free的话,反复地操作会造成大量内存碎片,操作系统将会花费大量的时间去查找连续的内存块来满足malloc的请求。——摘自《Memcached源码剖析笔记》
下面来看看Slab Allocator的原理。下面是Memcached文档中的Slab Allocator的目标:
the primary goal of the slabs subsystem in memcached was to eliminate memory fragmentation issues totally by using fixed-size memory chunks coming from a few predetermined size classes.
也就是说,Slab Allocator的基本原理是按照预先规定的大小,将分配的内存分割成特定长度的块,以完全解决内存碎片问题。
Slab Allocator的原理相当简单。将分配的内存分割成各种尺寸的块(chunk),并把尺寸相同的块分成组(chunk的集合,Slab Class)(图2.1)。
图2.1 Slab Allocator的构造图
而且,Slab Allocator还有重复使用已分配的内存的目的。也就是说,分配到的内存不会释放,而是重复利用。
Slab Allocator的主要术语
Page
分配给Slab的内存空间,默认是1MB。分配给Slab之后,根据Slab的大小切分成Chunk。
Chunk
用于缓存记录的内存空间
Slab Class
特定大小的Chunk组
在Slab中缓存记录的原理
下面说明Memcached是如何针对客户端发送的数据来选择Slab并缓存到Chunk中。
(第1步)Memcached根据收到的数据的大小,选择最适合该数据大小的Slab(图2.2)。(第2步)Memcached中保存着Slab内空闲Chunk的列表,根据该列表选择Chunk,然后将数据缓存于其中。
图2.2 选择存储记录的Chunk组的方法
Slab Allocator的缺点
Slab Allocator解决了当初的内存碎片问题,但新的机制也给Memcached带来了新的问题。
这个问题就是,由于分配的是特定长度的内存,因此无法有效利用分配的内存。例如,将100字节的数据缓存到128字节的Chunk中,剩余的28字节就浪费了(图2.3)。
图2.3 Chunk空间的使用
对于该问题,目前还没有完美的解决方案。但在文档中记载了比较有效的解决方案:
The most efficient way to reduce the waste is to use a list of size classes that closely matches (if that's at all possible) common sizes of objects that the clients of this particular installation of memcached are likely to store.
就是说,如果预先知道客户端发送的数据的常用大小,或者仅缓存大小相同的数据的情况下,只要使用适合数据大小的Chunk组的列表,就可以减少浪费。
使用Growth Factor进行调优
Memcached在启动时,指定Growth Factor因子(-f选项),就可以在某种程度上控制Slab之间的差异。默认值为1.25。
在直接使用Memcached默认值进行部署之前,最好是重新计算一下数据的预期平均长度,调整Growth Factor,以获得最恰当的设置。(内存是珍贵的资源,浪费就太可惜了。)
接下来介绍一下,如何使用Memcached的stats命令来查看slabs的利用率等各种各样的信息。
stats:查看memcached的内部状态
Memcached有个名为stats的命令,使用它可以获得各种各样的信息。
查看slabs的使用状况
使用Memcached的创造者Brad写的名为memcached-tool的Perl脚本,可以方便地获得slab的使用情况(它将返回值整理成容易阅读的格式)。
从这个脚本获得的信息对于调优非常方便,强烈推荐使用!
总结
本章简单说明了Memcached的缓存机制和调优方法。希望读者能够理解Memcached的内存管理原理及其优缺点。
4. 删除机制和发展方向
Memcached是缓存,所以数据不会永久保存在服务器上,这是向系统中引入Memcached的前提。本章介绍Memcached的数据删除机制,以及Memcached的最新发展方向——二进制协议和外部引擎支持。
Memcached在数据删除方面有效利用资源
懒惰删除机制:数据不会真正从Memcached中消失
Memcached不会释放已分配的内存。记录超时后,客户端就无法再看见该记录(invisible),其存储空间即可重复使用。
(源码剖析)在Memcached中删除一个item对象的时候,并不是从内存中释放,而是简单的进行标记处理,再将其指针放入slot回收插槽,下次分配的时候直接使用。
Lazy Expiration:懒惰检测机制
Memcached内部不会监视记录是否过期,而是在get时查看记录的时间戳,检查记录是否过期。这种技术被称为Lazy Expiration。因此,Memcached不会在过期监视上耗费CPU时间。
(源码剖析)Memcached不花过多的时间检测各个item对象是否过期,当get获取数据时,才检查item对象是否应该删除。你不访问,我就不处理。
LRU:从缓存中有效删除数据的原理
Memcached会优先使用已过期的记录的空间。但即使如此,也会发生追加新纪录时空间不足的情况,此时就要使用名为Least Recently Used(LRU)机制来分配空间。顾名思义,这是删除“最近最少使用”的记录的机制。因此,(实现:)当Memcached的内存空间不足时(无法从Slab Class获取到新的空间时),就从最近未被使用的记录中搜索,并将其空间分配给新的记录。
从缓存的实用角度来看,该模型十分理想。
不过,有些情况下LRU机制反倒会造成麻烦。话说回来,Memcached毕竟不是存储器,而是缓存,所以推荐使用LRU。
Memcached的最新发展方向
Memcached的roadmap上有两个大的目标。一个是二进制协议的策划和实现,另一个是外部引擎的加载功能。
关于二进制协议
使用二进制协议的理由是它不需要文本协议的解析处理,使得原本高速的Memcached的性能更上一层楼,还能减少文本协议的漏洞。
外部引擎支持
外部引擎支持的必要性
世界上有许多Memcached的派生系统,其理由是希望永久保存数据、实现数据冗余等,即使牺牲一些性能也在所不惜。
总结
本章介绍了Memcached的超时原理、内部如何删除数据等,在此之上又介绍了二进制协议和外部引起支持等Memcached的最新发展方向。这些功能要到1.3版才会支持,尽请期待!
5. 分布式算法
Memcached的分布式
Memcached虽然成为“分布式”缓存系统,但服务器端并没有“分布式”功能,各个Memcached不会相互通信以共享信息。服务器端仅包括前面介绍的内存存储功能,其实现非常简单。至于Memcached的分布式,则是完全由客户端程序库实现。这种分布式是Memcached的最大特点。(Memcached不互相通信的分布式)
Memcached的分布式是什么意思?
这里多次使用了“分布式”这个词,但并未做详细解释。现在开始简单地介绍一下其原理,各个客户端的实现基本相同。
图4.1 分布式简介:准备
保存数据
首先,向memcached中添加“tokyo”。(第1步)将“tokyo”传给客户端程序库后,客户端实现的算法就会根据“键”来决定保存数据的Memcached服务器。(第2步)服务器选定后,即(set/cas)命令它保存“tokyo”及其值。图4.2 分布式简介:添加时
获取数据
接下来,获取保存的数据。获取时,也要将要获取的键“tokyo”传递给函数库。(第1步)函数库通过与数据保存时相同的算法,根据“键”选择服务器。使用的算法相同,就能选中与保存时相同的服务器,(第2步)然后发送获取命令(get/gets)。只要数据没有因为某些原因被删除,就能获得保存的值。
相关推荐
rxtxParallel.dll rxtxSerial.dll 32位
华捷艾米摄像头开发SDK-V1.8.8
【毕业设计】基于Python的Django-html深度学习的web端多格式纠错系统源码(完整前后端+mysql+说明文档+LW+PPT).zip
基于OpenGL和Qt的跨平台3D地形显示Demo软件源代码展示,支持RTK-GPS数据插值与纹理添加功能,OpenGL与Qt联手打造的3D地形显示Demo软件源代码,跨平台支持Ubuntu与Windows,精准插值RTK-GPS地形数据,可视化色彩高度与纹理调整,基于OpenGL和Qt的3D地形显示demo软件源代码,2019年编写的,当时可分别在ubuntu和Windows系统下编译成功,两个平台下的版本头文件和工程文件略有不一样,均可提供源代码,详见图片。 软件对安装RTK-GPS的往复直线作业的拖拉机采集的地形数据进行插值后构建3D地形,具有颜色区分高度,插值和添加纹理等功能。 地形可用鼠标拖动,旋转和缩放。 ,OpenGL; Qt; 3D地形显示; 源代码; 跨平台编译; 安装RTK-GPS拖拉机数据; 插值构建3D地形; 颜色区分高度; 鼠标交互操作,**基于OpenGL与Qt的跨平台3D地形显示Demo源代码**
基于MATLAB的综合能源系统优化调度:结合需求响应与碳交易机制研究,综合能源系统优化调度:Matlab程序制定与碳交易机制下的综合需求响应应用,matlab程序制定,综合能源系统优化调度,综合需求响应的应用,碳交易机制。 ,matlab程序制定; 综合能源系统优化调度; 综合需求响应应用; 碳交易机制,Matlab程序助力综合能源系统优化调度:需求响应与碳交易机制应用
个人经导师指导并认可通过的设计项目,评审分98分,项目中的源码都是经过本地编译过可运行的,都经过严格调试,确保可以运行!提供完整的部署教程和设计文档,方便使用。主要针对计算机相关专业的正在做毕业设计大作业的学生和需要项目实战练习的学习者,资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、使用需求,如果有需要的话可以放心下载使用。 主要用到的技术: java:强制使用面向对象编程(OOP),支持封装、继承、多态和抽象。 Servlet:运行在服务端的Java程序,通过实现javax.servlet.Servlet接口处理HTTP请求和响应,作为JavaWeb的核心控制器,负责动态资源生成和请求逻辑调度 jsp:基于HTML的动态网页技术,允许嵌入Java代码片段(如<% %>),用于简化视图层开发,本质是编译为Servlet的服务器端模板 Mysql:开源关系型数据库管理系统,支持ACID事务和SQL标准,通过JDBC与Java程序连接,适用于Web应用的高并发数据存储与查询
【毕业设计】Python的Django-html知识图谱的百科知识问答平台源码(完整前后端+mysql+说明文档+LW+PPT).zip
扑克牌识别数据集,可识别A-K所有的牌字母 1850张原始图,正确识别率可达98.7%,yolo v8格式标注
双碳目标下综合能源系统低碳运行优化调度实践——涵盖光伏风电、热电联产等能源设备,借助Matlab与Yalmip求解器的联合应用,实现低成本运行与碳交易策略。,双碳目标下综合能源系统低碳运行优化调度研究:光伏风电融合、热电联产与碳捕集设备的协同优化利用Matlab程序,双碳目标下综合能源系统低碳运行优化调度Matlab程序 包含光伏、风电、热电联产、燃气锅炉、电锅炉、电储能、碳捕集设备,考虑碳交易 以系统运行成本最小为目标进行调度 没有具体参考文献,这个只是一个授之以渔的程序,方便入手 采用Yalmip+Cplex求解(需安装求解器) 注释详实,条理清晰,适合初学者学习。 ,双碳目标; 低碳运行优化调度; 能源系统; Matlab程序; 光伏; 风电; 热电联产; 燃气锅炉; 电锅炉; 电储能; 碳捕集; 碳交易; 系统运行成本; Yalmip; Cplex求解; 注释详实; 初学者学习。,基于双碳目标的综合能源系统低碳调度优化Matlab程序:光伏、风电等多源协同与碳交易策略
虚拟电厂基本概念及关键技术问题思辨
内容概要:文章详述了基于Python实现的双向长短期记忆神经网络(BiLSTM)时间序列预测项目。从项目背景介绍了为何BiLSTM比传统模型更适合复杂的非线性时间序列预测,并列出项目的各个部分包括数据预处理、特征工程、BiLSTM模型构建(输入层、BiLSTM层、全连接层和输出层)、训练和评估等。项目还包括了一个精美的GUI界面设计使模型更容易使用,以及防止过拟合的方法如正则化、早停技术和超参数调节来优化模型性能。通过案例展示了完整的代码整合封装流程,提供了可视化的预测结果与评估指标如MSE和MAE,并涉及部署与生产环境的实际运用。 适合人群:有一定深度学习、时间序列预测基础知识的研发人员,特别是那些希望了解BiLSTM及其应用场景的开发者和技术爱好者。 使用场景及目标:①适用于处理复杂非线性的、存在长时间依赖关系的时间序列数据,比如金融市场预测、气象预报、电力需求预测等领域;②目标是提高模型预测精度、有效处理长时依赖数据,为各类需要时间序列预测的行业如交通、能源等行业提供更可靠的支持;③项目成果不仅可以直接应用到具体场景,也为学术研究贡献新的见解和技术支持。 阅读建议:鉴于该项目涵盖多个层面的内容,从环境搭建到最后的GUI设计,读者应该分阶段阅读,重点关注自己感兴趣或是专业相关联的部分。比如对于初学者而言,可以从简单的数据导入导出和基本概念学起;而对于进阶者来说,可以直接跳转到模型优化章节深入探讨。整个过程中,最好边看边动手实践,并利用提供的可视化工具检验自己的理解和修改的效果。
安卓模拟器开发资源包下载10
西门子S7-200 Smart PLC与东元Teco N310变频器通讯实战指南:以太网控制+昆仑通态触摸屏实现设定频率、启停与数据传输,西门子S7-200 Smart PLC与东元Teco N310变频器通讯实战指南:以太网控制+485口连接程序详解,西门子200smart与东元Teco N310变频器通讯实战程序 器件:西门子s7 200 smart PLC,东元Teco N310变频器,昆仑通态触摸屏(带以太网),中途可以加路由器 控制方式:触摸屏与plc以太网通讯,PLC与变频器通讯485口相连 功能:触摸屏控制变频器设定频率,启停,读取输出频率,电压 说明:是程序,非硬件。 程序有注释,变频器设置,接线都有,一应俱全 ,西门子200smart PLC; 变频器通讯; 触摸屏控制; 设定频率; 启停控制; 读取输出; 程序注释; 接线说明,西门子S7 200 Smart与东元Teco N310变频器通讯控制程序实战指南
内容概要:本文详尽介绍了 Java 中继承与多态两大面向对象编程的核心概念,包括具体的实现方式、相关关键字的使用(extends、override、super、final、abstract)及其背后的逻辑。重点解释了类层次结构建立的方式和方法覆盖的实现,并讨论了抽象类和接口的作用。文章展示了继承与多态在提高代码重用性和扩展性方面的重要贡献,同时也提及了它们带来的潜在风险与挑战。通过两个实际应用案例(图形绘制系统、游戏角色系统),阐述了这两个概念在一个完整的软件项目中的运用。 适用人群:对面向对象编程有所了解但仍希望深入了解其实现机制和优化技巧的程序员或者软件工程师。 使用场景及目标:适用于想要掌握如何更好地利用 OOP 思想设计高效可靠的 Java 应用系统的个人。学习者将理解如何有效地组织代码、最大化组件复用率,并确保系统的灵活性与可维护性。 其他说明:尽管继承和多态为 Java 提供了许多好处,但也存在一些不足之处,如可能导致复杂的继承树,增加理解成本;或是因为在运行时才绑定方法而引入额外开销。因此,在实践中应当审慎选择适当的解决方案。 此外,文中还包括关于向上转型、向下转型
C#多线程工控源码替代PLC触摸屏:多级页签通信,自由设定串口以太网通信,触摸键盘模拟输入等强大功能,附赠所有控件,C#多线程工控源码替代PLC触摸屏:强大功能,自由通信,触摸键盘模拟输入,含所有控件,西门子PLC集成,C#多线程工业源码,可技术咨询 0, 纯源代码。 1, 替代传统plc搭载的触摸屏。 2, 工控屏幕一体机直接和plc通信。 3, 功能强大,多级页签。 4, 可以自由设定串口或以太网通信。 5, 主页。 6, 报警页。 7,触摸键盘模拟输入。 8, 系统设定页。 9, 历史查询页。 10,标定设定页。 11, 赠送所有控件。 12,使用的西门子Plc。 ,C#多线程; 工业源码; 纯源代码; 替代传统plc触摸屏; 通信; 功强大; 多级页签; 自由设定通信方式; 主页; 报警页; 触摸键盘模拟输入; 系统设定页; 历史查询页; 标定设定页; 赠送控件; 西门子Plc。,C#多线程工业源码:PLC通信与触摸屏一体解决方案
拼鱼鱼CMS,一款垂钓行业的平台系统源码
内容概要:本文深入探讨了硬件开发的全过程,涵盖了硬件开发所需的软硬件条件、关键技术细节以及常见流程。首先介绍必要的硬件工具,如示波器、万用表、信号发生器等,然后列举常用的原型开发板和测试设备。接着讨论了多种软件条件,涉及电路设计、仿真和嵌入式开发工具。技术细节部分讲解了电路设计中的原理图设计、PCB布局和元件选择等方面的内容,并简述了PCB制造和嵌入式软件开发的基本概念。最后介绍了常见的开发流程、测试与调试环节,并提出了若干重要的开发注意事项。硬件开发是一项涉及电子电路设计、PCB制造、嵌入式编程等多方面的综合性工程任务,合理的工具选取与流程控制对项目的成功至关重要。 适合人群:从事电子产品设计、电路设计、嵌入式系统开发的研究人员、工程师或有志于进入这一领域的高校学生。 使用场景及目标:可用于了解完整的硬件开发流程,作为教材辅助教学或者企业内部培训资料。帮助使用者掌握从需求定义到最终产品的整个链条上的知识点和技术技能。 其他说明:文中还强调了硬件开发过程中的一些最佳实践和建议,比如如何确保良好的信号完整性,合理规划电源管理系统以及有效管理和降低生产成本等问题。同时提到,对于复杂程度较高
R语言比较型图标-词云图数据集
内容概要:本文档介绍了一个基于KNN(K-Nearest Neighbors)的时间序列递归预测项目,通过详细的案例解析展示了如何将KNN算法与递归预测相结合,应用于多步时间序列预测。项目重点解决了KNN在时间序列数据中顺序性弱的问题,通过优化KNN模型及其与递归预测的协同来提升预测精度。文档提供了从理论到代码实现,再到模型评估、误差修正,以及精美GUI设计等多个方面的详尽步骤和具体实施方案,包括滑动窗口特征构造、模型参数调优、实时预测部署、用户界面展示等功能。 文档首先阐述了背景和目的,明确了该项目旨在提高KNN对时序数据的适应性,并结合递归预测方法改善预测效果。接着介绍了在实现过程中面临的挑战,例如KNN算法本身的计算成本、误差累加风险,以及如何平衡模型复杂度和实时性。之后深入探讨了该项目的独特性和创新点,包括对自适应KNN模型、递归预测中误差传播控制的具体实现方法,以及模型在不同领域(金融市场、天气预报、能耗预测等)的成功应用案例。 项目流程涵盖了数据预处理、模型构建、评估和优化等多个关键环节,并给出了Python环境搭建所需的完整代码段和支持工具,确保项目从头到尾具备较高的可操作性。最后还讨论了未来的潜在发展方向和技术改进方向,如引入更复杂的神经网络模型、实现多变量预测、强化模型解释力等。 适合人群:具备一定编程技能,熟悉Python编程语言及基本统计学概念的研究人员和技术爱好者,特别适合从事数据分析和预测建模工作的专业人士。 使用场景及目标:本项目适用于任何希望通过时间序列数据进行趋势分析和短期/中期预测的企业和个人,具体应用场景包括但不限于股市行情预测、商品需求规划、电力消耗估计等领域。项目的总体目标是在充分尊重时间序列特性的基础上,利用简单的KNN模型和灵活的递归预测方法,为用户提供一个既容易上手又足够强大的预测平台。 阅读建议:由于本项目涵盖了大量技术细节,因此强烈推荐读者先掌握KNN的基本原理和常用的时间序列分析技巧后再开始深入了解。建议边读边练习,通过动手尝试每一个步骤,尤其是涉及到的实际编码部分,来加深理解和记忆。此外,对于希望将其应用于特定行业的用户而言,还应注意根据自身情况进行适当调整,以便获得更好的性能表现。
电弧熔池耦合的Comsol模型研究与应用,COMSOL电弧熔池的深度耦合分析,comsol电弧熔池耦合 ,核心关键词:comsol;电弧;熔池;耦合;多物理场模拟。,COMSOL电弧与熔池的耦合技术