CDN 在静态资源的加速场景中是将静态资源缓存在距离客户端较近的CDN 节点上,然后客户端访问该资源即可通过较短的链路直接从缓存中获取资源,而避免再通过较长的链路回源获取静态资源。因此 CDN的缓存命中率的高低直接影响客户体验,而保证较高的命中率也成为了站长的核心命题。在本文中我们就一起探讨 CDN 缓存命中率的概念、影响因素以及优化策略。
1、缓存命中率的概念
CDN 的缓存命中率包括两种:字节缓存命中率和请求缓存命中率。其中字节缓存命中率是指 CDN 缓存命中 Response 的字节数除以 CDN所有请求 Response 的字节数。而请求缓存命中率是指 CDN 缓存命中的请求的个数除以 CDN 所有的请求数。
从上面的描述中可以查看到字节缓存命中率可以表征回源流量的大小,回源流量越高那么源站的流出流量也就越大,这样对于源站的带宽资源以及其他的负载都会越大,因此回源流量代表了源站服务器接收到的负载压力。而我们在业务使用中也主要关心字节缓存命中率。
查看缓存命中率主要包括控制台、 CDN 日志和 API/SDK 查看两种方式。现在 CDN 控制台上提供的命中率监控均是字节缓存命中率,如图1 中所示即是控制台监控信息中命中率的详情。
图 1. 控制台命中率监控示意图
在CDN的请求日志中,CDN记录了所有的CDN请求的缓存命中状态,详细的日志格式请参考CDN日志格式,其中“cache命中状态”字段为HIT即表示命中,而MISS即表示未命中的状态。这里特别需要注意的一点是这里的命中状态仅表征CDN的L1节点的命中状态,当CDN的L1节点未命中缓存但是L2节点命中缓存的情况下这里仍然会显示MISS。
而API/SDK的方式CDN分别提供了DescribeDomainHitRateData和DescribeDomainReqHitRateData两个接口分别查询的CDN的字节缓存命中率和请求缓存命中率。该接口是可以查看到历史90天内的所有的数据。
2、影响因素及优化建议
CDN的缓存规则同时按照CDN上的缓存规则、源站配置的Cache-Control等response头、文件类型等综合考虑,具体的缓存规则解读建议查阅【 CDN 最佳实践】CDN 缓存策略解读和配置策略。那么按照上述的缓存规则会影响命中率的因素主要有以下:
1. 文件类型是否适合于在CDN上缓存。
CDN在业务架构中负责加速静态资源,因此如果动态资源也经过CDN的话是会导致CDN的命中率下降的。CDN判断动态文件和静态文件的标准是该文件的response头中是否带有Etag头和Last-modified头。这两个头在HTTP协议中分别通过文件内容和文件最后修改时间表征文件的修改情况。
因此建议用户使用过程中优化点:
网站架构是否适合于动静分离。动静分离是常见的网站优化的策略,主要是通过将静态资源和动态资源分离成两个站点提供服务。静态资源由于长时间不会发生变化,因此可以使用CDN加速;而动态资源因为需要实时获取源站的资源并且可能源站加载需要一段时间(CDN回源获取数据有严格的的回源超时时间,动态文件响应较慢可能导致CDN回源直接抛出504错误)而直接解析到源站服务器拉取资源。
静态文件文件是否在response头中返回Etag头和Last-modified头。在CDN上没有配置缓存规则的情况下,静态文件没有返回Etag头和Last-modified头也同样会导致该静态资源不在CDN节点上缓存。如图2中所示,x-swift-cachetime头即表示该文件在CDN上的缓存时间(单位是秒)。该文件其实为静态文件,但是由于response头中没有Etag和Last-modified导致CDN并不会该文件进行缓存。
图 2. CDN 缓存时间示意图
配置合理的源站缓存规则。源站服务器可以针对于资源配置其缓存规则。当源站配置了以下response头时CDN将不会对该文件进行缓存:
1)有s-maxage=0,no-cache,no-store,private其中一种
2)如果没有s-maxage或者s-maxage=0,并且有max-age=0.
3)带Pragma: no-cache
而且上述的response头在CDN缓存规则中将有最高优先级(即使CDN上配置了缓存规则也不缓存),因此上述的这些response头并不适合于配置于源站的静态资源的。另外当CDN上没有配置缓存规则时,资源的缓存规则将按照源站的Cache-Control或者Expires头进行缓存(Cache-Control优先级比Expires高),因此建议用户设置合理的Cache-Control或者Expires头。
配置缓存规则。上面所指的没有包括Etag和Last-modified头而导致CDN缓存时间为0的场景是CDN控制台上没有配置缓存配置时会出现这种情况,因此如果用户的静态资源确实无法配置上述两个response头的话是可以考虑针对该文件配置缓存规则,这样该文件即可在CDN上按照缓存规则进行缓存。
2. CDN的刷新和预热功能
CDN提供了刷新缓存和预热缓存两个操作。两个操作都会对缓存命中率有影响,但是两个操作的影响是完全相反的。因此用户是需要了解两个操作的概念以及使用场景。
刷新功能是指将特定URL或者目录下的所有历史缓存的内容清除掉,该操作常用于源站进行同名更新后导致CDN缓存内容已为历史脏数据,刷新后将使URL下次访问时直接回源。因此会导致命中率下降。
预热功能是将URL提前上传到CDN的L2节点上,这样下次访问的时候就不需要从源站再拉取资源了,因此预热是没有直接导致L1的命中率升高,但提升了CDN的真实命中率。
因此建议用户使用过程中优化点:
慎重使用刷新功能。刷新功能肯定是会导致命中率出现下降的,特别是对于加速域名根目录的刷新任务会导致加速域名下的所有缓存均无效,势必会导致后续出现大量回源请求导致源站服务器负载升高。因此请用户在实际线上环境特别是高峰期进行刷新操作。另外建议客户尽量避免执行静态资源同名更新,可以尝试通过添加queryString的方式进行版本更替(例如url中带有?version=1.1等方式)。
业务高峰前预热热门资源。预热可以提前将资源预热到CDN的L2节点,避免业务高峰对于源站产生压力,也同时保证了CDN的真实命中率。但是预热的请求次数每天客户均是有条数限制的,因此建议客户可以根据历史的热门资源统计得要待预热的资源URL进行操作。
3. CDN缓存规则是否合理
CDN上是可以针对于目录或者后缀名设置缓存配置的。而在CDN和源站同时配置缓存规则时是会以CDN上的缓存规则优先的(除非源站设置了不允许缓存的规则),因此建议用户在CDN控制台中设置合理的缓存规则,避免走默认的缓存规则导致频繁回源(默认缓存经常缓存3600秒过期)。另外特别注意CDN控制台上配置的缓存时间为0秒时该资源并不是客户端直接请求到源站的,而是客户端请求仍然会先到CDN节点,然后由CDN节点触发回源请求到源站获取资源,并且流出流量仍然会计算CDN的流出流量。
4. 可变参数导致命中率下降
客户请求的URL中常带有queryString,例如上面所说的请求URL中为了区分版本带上?version=1.1等参数或者CDN回源到私有读写类型的bucket时会带上OSS私有访问需要的OSSAccessKeyId、Expires和Signature参数。在CDN处理的过程中默认的处理逻辑是对于同样的URL而带有不同queryString的请求会认为完全不同的请求,因此缓存也对应的是不同份,这就会导致如果queryString参数发生变化时会导致重新回源,因此命中率会出现下降的情况。
因此建议用户使用过程中优化点:
业务系统允许的情况下使用“过滤参数”功能。开启过滤参数功能后,CDN接收到queryString的URL替换成没有带参数的URL。例如请求URL为http://www.aliyun.com/1.jpg?version=1,开启过滤参数后将替换URL为http://www.aliyun.com/1.jpg,这样讲查看是否存在有http://www.aliyun.com/1.jpg的缓存,如果有的话将直接返回客户端;如果没有缓存的话就会按照http://www.aliyun.com/1.jpg请求回源站。因此业务系统允许queryString不敏感的情况下可以开启该功能。但是对于一些系统需要queryString进行传参或者设置跳转逻辑的话就不能开启该功能。
对于CDN加速OSS的场景建议使用“私有bucket回源”功能。当OSS设置为私有时不可以开启过滤参数并且当签名querystring发生变化时还会影响CDN缓存命中率。而“私有bucket回源”功能将使CDN的请求回源OSS的时候自动带上签名querystring参数,而不需要客户自己在请求CDN的时候设置。这样即实现了OSS本身资源的安全防护而又不影响CDN的缓存命中率。
5. CDN加速域名流量较低
CDN节点作为所有使用CDN的用户公用的节点资源,因此CDN配置的缓存规则表示了该资源在CDN上的缓存最长时间,如果用户在CDN上的缓存资源的热度较低的话是有可能被提前踢出CDN节点的缓存的。因此可以理解为缓存按照热度属性采取末尾淘汰制,所谓热度就是该文件在该节点上被访问的频率,文件热度不够即被提前剔除。
因此建议用户使用过程中优化点:
对于流量较低的域名可以提前定期将热度资源预热到CDN节点上,避免影响业务使用。
建议用户考虑对于流量较低的域名可以不使用CDN加速,这样的域名的加速效果并不明显。
原文地址:https://yq.aliyun.com/articles/288084?spm=a2c41.11181499.0.0
相关推荐
监控功能允许用户实时查看域名CDN的运行状况,如命中率、回源数和变化趋势。 容量查询工具对于SVN或FTP托管源尤为重要,它使用appid作为唯一标识,帮助管理员查询资源使用情况,以便在收到扩容需求时做出准确判断。...
- **评价指标**:如响应时间、吞吐率、命中率、内容新鲜度等。 #### 四、CDN体系结构及组成要素 ##### 4.1 CDN的组成要素 - **内容服务引擎**:负责内容的存储与分发。 - **本地负载均衡**:确保内容能够均匀分配...
通过该软件,我们可以研究各种CDN策略对性能的影响,比如不同缓存策略如何影响命中率,或者动态调整策略如何改善响应时间。此外,也可以评估新的CDN技术或改进,比如利用机器学习预测用户需求,或优化边缘计算来处理...
- 缓存策略:合理的缓存策略能减少回源压力,提高命中率,从而减少延迟和带宽消耗。 - 节点部署:在用户密集地区部署更多节点,以减少访问距离和时间。 - DNS调度:智能的DNS调度能够将用户指向最近的边缘节点,提高...
CDN还通过智能路由技术选择最佳路径,优化数据传输。 2. CDN快速入门: 入门CDN首先需要了解如何配置CDN服务,包括注册阿里云账号、创建CDN实例、添加域名、配置源站和回源策略。此外,还需要学会监控CDN性能指标...
- **智能缓存**:根据用户行为、地理位置等因素智能调整缓存策略,提高缓存命中率。 #### 四、总结 CDN技术作为现代互联网基础设施的重要组成部分,在提高用户体验、减轻源服务器压力等方面发挥着不可替代的作用。...
1. **前端缓存优化**:提高缓存命中率,使用哈希算法分组服务器,减少服务器负载,利用OneConnect技术优化图片等请求。 2. **前端Web优化**:提供压缩内容,使用HTTP压缩,根据业务分组服务器,通过URL切换进行智能...
* 高效的性能指标:95%+ 命中率,ms 级响应时间。 * 完善的监控体系&服务体系:7x24 小时全网监控,基于服务质量智能调度节约成本。 * 资源弹性扩展:根据网站突发流量,无需用户干预;自动作出响应和调整;QoS 按...
4. 性能优化:如何调整Squid的配置以提高性能,比如缓存分区、缓存命中率提升、并发连接数控制等。 5. 安全与过滤:Squid提供了一些安全特性,如访问控制列表(ACL)、URL过滤、IP黑名单等,用于防止恶意访问和保护...
3. 优化Web服务架构,增强边缘节点的命中率,减少回源带宽的消耗,降低访问延迟。 土豆网的做法有其优势,比如就近访问可以提高用户体验,动态同步可以优化存储空间的使用。但同时,土豆网的CDN策略也存在缺点,...
- 同样在2015年12月29日的更新中,增加了16个资源监控接口,用于获取网络流量、带宽、回源流量、带宽、字节命中率、访问QPS和HTTP状态码等统计信息。 5. **直播业务操作接口**: - 同一时期,还提供了8个直播业务...
Tengine则是基于Nginx开发的一款高性能HTTP服务器,不仅支持一致性哈希算法来提高命中率和降低抖动,而且还支持主动健康检查、SPDYv3以及SO_REUSEPORT等功能。 **Swift**作为阿里CDN的HTTP缓存服务器,支持HTTP/1.1...
4. **CDN SDK开发包(2015-07-13)**:此版本引入了内容刷新预热功能,新增了PushObjectCache接口,允许将源站内容主动预热到L2 Cache节点,提高首次访问的命中率。同时,内容刷新类接口的操作数量上限也得到了提升...
**边缘节点**则部署于用户接入层,拥有一定容量的缓存空间,根据中心节点指令动态调整存储内容,以提高本地用户的点播命中率。 #### 三、CDN在VOD和OTT系统中的应用 **VOD(Video On Demand,视频点播)**和**OTT...
CDN 是构建在现有网络基础之上的智能虚拟网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。...
4. **缓存更新**:CDN节点会根据预设的缓存策略(如TTL时间、命中率等)来决定何时更新缓存中的内容,确保用户始终能获取到最新的资源。 5. **负载均衡**:CDN系统通过智能调度算法,平衡各个节点的负载,避免某个...
在互联网的环境下,网络是平台和用户联系的桥梁。但由于移动网络的复杂,桥梁有时候堵了,...在保障CDN的成功率的前提下,尽可能的提命中率,实现静态资源快速、稳定的访问,最终达到使用稳定、通道安全、接入高效。