再谈KeepAlive

san_yun

浏览: 2693805 次
来自: 杭州

最近访客更多访客>>

空城旧梦why

sd3870181

alexqdjay

hanmiao

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

为什么要有KeepAlive？

在谈KeepAlive之前，我们先来了解下简单TCP知识(知识很简单，高手直接忽略)。首先要明确的是在TCP层是没有“请求”一说的，经常听到在TCP层发送一个请求，这种说法是错误的。TCP是一种通信的方式，“请求”一词是事务上的概念，HTTP协议是一种事务协议，如果说发送一个HTTP请求，这种说法就没有问题。也经常听到面试官反馈有些面试运维的同学，基本的TCP三次握手的概念不清楚，面试官问TCP是如何建立链接，面试者上来就说，假如我是客户端我发送一个请求给服务端，服务端发送一个请求给我。。。这种一听就知道对TCP基本概念不清楚。下面是我通过wireshark抓取的一个TCP建立握手的过程。（命令行基本上用TCPdump,后面我们还会用这张图说明问题）:

现在我看只要看前3行，这就是TCP三次握手的完整建立过程，第一个报文SYN从发起方发出，第二个报文SYN,ACK是从被连接方发出，第三个报文ACK确认对方的SYN，ACK已经收到，如下图：

但是数据实际上并没有传输，请求是有数据的，第四个报文才是数据传输开始的过程，细心的读者应该能够发现wireshark把第四个报文解析成HTTP协议，HTTP协议的GET方法和URI也解析出来，所以说TCP层是没有请求的概念，HTTP协议是事务性协议才有请求的概念，TCP报文承载HTTP协议的请求(Request)和响应(Response)。

现在才是开始说明为什么要有KeepAlive。链接建立之后，如果应用程序或者上层协议一直不发送数据，或者隔很长时间才发送一次数据，当链接很久没有数据报文传输时如何去确定对方还在线，到底是掉线了还是确实没有数据传输，链接还需不需要保持，这种情况在TCP协议设计中是需要考虑到的。TCP协议通过一种巧妙的方式去解决这个问题，当超过一段时间之后，TCP自动发送一个数据为空的报文给对方，如果对方回应了这个报文，说明对方还在线，链接可以继续保持，如果对方没有报文返回，并且重试了多次之后则认为链接丢失，没有必要保持链接。

如何开启KeepAlive

KeepAlive并不是默认开启的，在Linux系统上没有一个全局的选项去开启TCP的KeepAlive。需要开启KeepAlive的应用必须在TCP的socket中单独开启。Linux Kernel有三个选项影响到KeepAlive的行为：
1.net.ipv4.tcpkeepaliveintvl = 75
2.net.ipv4.tcpkeepaliveprobes = 9
3.net.ipv4.tcpkeepalivetime = 7200
tcpkeepalivetime的单位是秒，表示TCP链接在多少秒之后没有数据报文传输启动探测报文; tcpkeepaliveintvl单位是也秒,表示前一个探测报文和后一个探测报文之间的时间间隔，tcpkeepaliveprobes表示探测的次数。

TCP socket也有三个选项和内核对应，通过setsockopt系统调用针对单独的socket进行设置：
TCPKEEPCNT: 覆盖 tcpkeepaliveprobes
TCPKEEPIDLE: 覆盖 tcpkeepalivetime
TCPKEEPINTVL: 覆盖 tcpkeepalive_intvl

举个例子，以我的系统默认设置为例，kernel默认设置的tcpkeepalivetime是7200s, 如果我在应用程序中针对socket开启了KeepAlive,然后设置的TCP_KEEPIDLE为60，那么TCP协议栈在发现TCP链接空闲了60s没有数据传输的时候就会发送第一个探测报文。

TCP KeepAlive和HTTP的Keep-Alive是一样的吗？

估计很多人乍看下这个问题才发现其实经常说的KeepAlive不是这么回事，实际上在没有特指是TCP还是HTTP层的KeepAlive，不能混为一谈。TCP的KeepAlive和HTTP的Keep-Alive是完全不同的概念。TCP层的KeepAlive上面已经解释过了。 HTTP层的Keep-Alive是什么概念呢？在讲述TCP链接建立的时候，我画了一张三次握手的示意图，TCP在建立链接之后， HTTP协议使用TCP传输HTTP协议的请求(Request)和响应(Response)数据，一次完整的HTTP事务如下图：

各位看官请注意，这张图我简化了HTTP(Req)和HTTP(Resp)，实际上的请求和响应需要多个TCP报文。从图中可以发现一个完整的HTTP事务，有链接的建立，请求的发送，响应接收，断开链接这四个过程,早期通过HTTP协议传输的数据以文本为主，一个请求可能就把所有要返回的数据取到，但是，现在要展现一张完整的页面需要很多个请求才能完成，如图片,JS,CSS等，如果每一个HTTP请求都需要新建并断开一个TCP，这个开销是完全没有必要的，开启HTTP Keep-Alive之后，能复用已有的TCP链接，当前一个请求已经响应完毕，服务器端没有立即关闭TCP链接，而是等待一段时间接收浏览器端可能发送过来的第二个请求，通常浏览器在第一个请求返回之后会立即发送第二个请求，如果某一时刻只能有一个链接，同一个TCP链接处理的请求越多，开启KeepAlive能节省的TCP建立和关闭的消耗就越多。当然通常会启用多个链接去从服务器器上请求资源，但是开启了Keep-Alive之后，仍然能加快资源的加载速度。HTTP/1.1之后默认开启Keep-Alive, 在HTTP的头域中增加Connection选项。当设置为Connection:keep-alive表示开启，设置为Connection:close表示关闭。实际上HTTP的KeepAlive写法是Keep-Alive，跟TCP的KeepAlive写法上也有不同。所以TCP KeepAlive和HTTP的Keep-Alive不是同一回事情。

Nginx的TCP KeepAlive如何设置

开篇提到我最近遇到的问题，Client发送一个请求到Nginx服务端，服务端需要经过一段时间的计算才会返回，时间超过了LVS Session保持的90s,在服务端使用Tcpdump抓包,本地通过wireshark分析显示的结果如第二副图所示，第5条报文和最后一条报文之间的时间戳大概差了90s。在确定是LVS的Session保持时间到期的问题之后，我开始在寻找Nginx的TCP KeepAlive如何设置，最先找到的选项是keepalivetimeout,从同事那里得知keepalivetimeout的用法是当keepalivetimeout的值为0时表示关闭keepalive,当keepalivetimeout的值为一个正整数值时表示链接保持多少秒，于是把keepalivetimeout设置成75s,但是实际的测试结果表明并不生效。显然keepalivetimeout不能解决TCP层面的KeepAlive问题，实际上Nginx涉及到keepalive的选项还不少，Nginx通常的使用方式如下：

从TCP层面Nginx不仅要和Client关心KeepAlive,而且还要和Upstream关心KeepAlive, 同时从HTTP协议层面，Nginx需要和Client关心Keep-Alive,如果Upstream使用的HTTP协议，还要关心和Upstream的Keep-Alive，总而言之，还比较复杂。所以搞清楚TCP层的KeepAlive和HTTP的Keep-Alive之后，就不会对于Nginx的KeepAlive设置错。我当时解决这个问题时候不确定Nginx有配置TCP keepAlive的选项，于是我打开Ngnix的源代码，在源代码里面搜索TCP_KEEPIDLE,相关的代码如下：

 519 #if (NGX_HAVE_KEEPALIVE_TUNABLE)
 520                 
 521         if (ls[i].keepidle) { 
 522             if (setsockopt(ls[i].fd, IPPROTO_TCP, TCP_KEEPIDLE,
 523                            (const void *) &ls[i].keepidle, sizeof(int))
 524                 == -1)
 525             {
 526                 ngx_log_error(NGX_LOG_ALERT, cycle->log, ngx_socket_errno,
 527                               "setsockopt(TCP_KEEPIDLE, %d) %V failed, ignored",
 528                               ls[i].keepidle, &ls[i].addr_text);
 529             }
 530         }

从代码的上下文我发现TCP KeepAlive可以配置，所以我接着查找通过哪个选项配置，最后发现listen指令的so_keepalive选项能对TCP socket进行KeepAlive的配置。

so_keepalive=on|off|[keepidle]:[keepintvl]:[keepcnt]
on表示开启
off表示关闭
有些系统提供跟精确的控制，比如linux:
    keepidle表示等待时间，keepintvl表示探测报的发送间隔，keepcnt表示探测报文发送的次数。

以上三个参数只能使用一个，不能同时使用，比如sokeepalive=on, sokeepalive=off或者sokeepalive=30s::(表示等待30s没有数据报文发送探测报文)。通过设置listen 80,sokeepalive=60s::之后成功解决Nginx在LVS保持长链接的问题，避免了使用其他高成本的方案。在商用负载设备上如果遇到类似的问题同样也可以通过这种方式解决。

参考资料

《TCP/IP协议详解VOL1》--强烈建议对于网络基本知识不清楚同学有空去看下。

http://tldp.org/HOWTO/html_single/TCP-Keepalive-HOWTO/#overview

http://nginx.org/en/docs/http/ngx_http_core_module.html

Nginx Source code: https://github.com/alibaba/tengine

(文章转自我的blog, 欢迎大家访问http://blog.sunburst-tech.net/,墙外需科学上网，你懂的。)

http://coolshell.cn/articles/11564.html

分享到：

Percona-Server安装记录 | Storm 概念梳理

2014-07-28 14:48
浏览 1034
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Vue中keep-alive 实现后退不刷新并保持滚动位置: 首先，我们要明确我们谈的是TCP的 KeepAlive 还是HTTP的 Keep-Alive。TCP的KeepAlive和HTTP的Keep-Alive是完全不同的概念，不能混为一谈。实际上HTTP的KeepAlive写法是Keep-Alive，跟TCP的KeepAlive写法上也有不同。...

300lean 与 smart200 之间 TCP通讯案例: 另外，心跳包（Keepalive）的使用可以检测对方是否在线，防止因长时间无数据交换导致的连接断开。压缩包中的文件"lean smart 706ok.smart"可能是smart200的工程文件，包含了TCP通信的相关程序代码和配置。而"Lea_...

浅谈Nginx10m+高并发内核优化详解: 3. `net.ipv4.tcp_keepalive_time`：调整TCP保持活动检查的时间间隔，有助于快速检测并清理无效连接。 4. `net.ipv4.tcp_fin_timeout`：控制FIN_WAIT_2状态的持续时间，减少等待时间可提高效率。 5. `...

计算机硬件控制_驱动级键盘鼠标同步_PS2接口UDP协议多机协同_基于rabirdwinio和pynput的跨设备输入共享系统_实现多台Windows电脑的键盘鼠标同步操作_支持.zip: 计算机硬件控制_驱动级键盘鼠标同步_PS2接口UDP协议多机协同_基于rabirdwinio和pynput的跨设备输入共享系统_实现多台Windows电脑的键盘鼠标同步操作_支持

嵌入式八股文面试题库资料知识宝典-TCPIP协议栈.zip: 嵌入式八股文面试题库资料知识宝典-TCPIP协议栈.zip

少儿编程scratch项目源代码文件案例素材-开膛手杰克.zip: 少儿编程scratch项目源代码文件案例素材-开膛手杰克.zip

基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型: 基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型，个人经导师指导并认可通过的高分设计项目，评审分99分，代码完整确保可以运行，小白也可以亲自搞定，主要针对计算机相关专业的正在做大作业的学生和需要项目实战练习的学习者，可作为毕业设计、课程设计、期末大作业，代码资料完整，下载可用。基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现遥感图像滑坡识别源码+数据集+训练好的模型基于深度学习CNN网络+pytorch框架实现

电力弹簧技术在主动配电网规划与运行优化调度中的应用研究: 内容概要：本文详细探讨了电力弹簧技术在主动配电网规划及运行优化调度中的应用。首先介绍了电力弹簧技术作为智能电网调控手段的优势，如自适应性强、响应速度快、节能环保等。接着阐述了主动配电网规划的目标和策略，包括优化电网结构、提高能源利用效率和降低故障风险。随后讨论了运行优化调度的原则和方法，强调了实时监测、智能调度策略以及优化调度模型的重要性。最后通过实际案例分析展示了电力弹簧技术在提升电网稳定性、可靠性和能效方面的显著效果，展望了其广阔的应用前景。适合人群：从事电力系统规划、运行管理的研究人员和技术人员，以及对智能电网感兴趣的学者和学生。使用场景及目标：适用于希望深入了解电力弹簧技术及其在主动配电网规划和运行优化调度中具体应用的专业人士。目标是掌握电力弹簧技术的工作原理、优势及其在实际项目中的实施方法。其他说明：本文不仅提供了理论分析，还有具体的案例支持，有助于读者全面理解电力弹簧技术的实际应用价值。

嵌入式八股文面试题库资料知识宝典-C语言思维导图.zip: 嵌入式八股文面试题库资料知识宝典-C语言思维导图.zip

电路教学与科研案例的结合—以最大功率传输定理为例.pdf: 电路教学与科研案例的结合—以最大功率传输定理为例.pdf

【HarmonyOS文件系统】分布式架构下的多设备协同与文件管理：构建万物互联新生态: 内容概要：本文深入介绍了HarmonyOS文件系统及其在万物互联时代的重要性。HarmonyOS自2019年发布以来，逐步覆盖多种智能设备，构建了庞大的鸿蒙生态。文件系统作为其中的“数字管家”，不仅管理存储资源，还实现多设备间的数据协同。文章详细介绍了常见的文件系统类型，如FAT、NTFS、UFS、EXT3和ReiserFS，各自特点和适用场景。特别强调了HarmonyOS的分布式文件系统（hmdfs），它通过分布式软总线技术，打破了设备界限，实现了跨设备文件的无缝访问。此外，文章对比了HarmonyOS与Android、iOS文件系统的差异，突出了其在架构、跨设备能力和安全性方面的优势。最后，从开发者视角讲解了开发工具、关键API及注意事项，并展望了未来的技术发展趋势和对鸿蒙生态的影响。适合人群：对操作系统底层技术感兴趣的开发者和技术爱好者，尤其是关注物联网和多设备协同的用户。使用场景及目标：①理解HarmonyOS文件系统的工作原理及其在多设备协同中的作用；②掌握不同文件系统的特性和应用场景；③学习如何利用HarmonyOS文件系统进行应用开发，提升跨设备协同和数据安全。阅读建议：本文内容详实，涵盖了从基础概念到高级开发技巧的多个层次，建议读者结合自身需求，重点关注感兴趣的部分，并通过实践加深理解。特别是开发者可参考提供的API示例和开发技巧，尝试构建基于HarmonyOS的应用。

嵌入式八股文面试题库资料知识宝典-海康嵌入式笔试题.zip: 嵌入式八股文面试题库资料知识宝典-海康嵌入式笔试题.zip

三电平有源电力滤波器仿真：基于瞬时无功功率理论的双闭环控制与SVPWM调制技术: 内容概要：本文详细介绍了基于瞬时无功功率理论的三电平有源电力滤波器（APF）仿真研究。主要内容涵盖并联型APF的工作原理、三相三电平NPC结构、谐波检测方法（ipiq）、双闭环控制策略（电压外环+电流内环PI控制）以及SVPWM矢量调制技术。仿真结果显示，在APF投入前后，电网电流THD从21.9%降至3.77%，显著提高了电能质量。适用人群：从事电力系统研究、电力电子技术开发的专业人士，尤其是对有源电力滤波器及其仿真感兴趣的工程师和技术人员。使用场景及目标：适用于需要解决电力系统中谐波污染和无功补偿问题的研究项目。目标是通过仿真验证APF的有效性和可行性，优化电力系统的电能质量。其他说明：文中提到的仿真模型涉及多个关键模块，如三相交流电压模块、非线性负载、信号采集模块、LC滤波器模块等，这些模块的设计和协同工作对于实现良好的谐波抑制和无功补偿至关重要。

基于环比增长的销售统计分析——2019年中青杯全国数学建模竞赛C题.pdf: 基于环比增长的销售统计分析——2019年中青杯全国数学建模竞赛C题.pdf

嵌入式八股文面试题库资料知识宝典-linux面试题.zip: 嵌入式八股文面试题库资料知识宝典-linux面试题.zip

嵌入式八股文面试题库资料知识宝典-linux常见面试题.zip: 嵌入式八股文面试题库资料知识宝典-linux常见面试题.zip

基于Matlab的小电流接地系统单相故障仿真分析及其应对策略研究: 内容概要：本文探讨了小电流接地系统在配电网络中的应用，特别是在单相故障情况下的仿真分析。文中介绍了小电流接地系统的背景和发展现状，重点讨论了两种常见的接地方式——中性点不接地和中性点经消弧线圈接地。利用Matlab作为仿真工具，作者构建了详细的电路模型，模拟了单相故障的发生过程，并通过多个结果图表展示了故障电流、电压波形及系统运行状态。此外，文章还包括了详细的设计说明书和PPT介绍，帮助读者全面理解仿真过程和技术细节。适合人群：从事电力系统研究、维护的技术人员，尤其是关注配电网络安全和稳定的工程师。使用场景及目标：适用于希望深入了解小电流接地系统的工作原理和故障处理机制的专业人士。通过本研究，读者可以掌握如何使用Matlab进行电力系统仿真，评估不同接地方式的效果，优化配电网络的安全性能。其他说明：随文附带完整的仿真工程文件、结果图、设计说明书及PPT介绍，便于读者进一步探索和实践。

少儿编程scratch项目源代码文件案例素材-激烈的殴斗.zip: 少儿编程scratch项目源代码文件案例素材-激烈的殴斗.zip

嵌入式八股文面试题库资料知识宝典-小米嵌入式软件工程师笔试题目解析.zip: 嵌入式八股文面试题库资料知识宝典-小米嵌入式软件工程师笔试题目解析.zip

车辆主动避撞技术：紧急制动与紧急转向策略及其临界安全距离分析: 内容概要：本文详细探讨了车辆主动避撞技术中的两种常见策略——纵向紧急制动避撞和横向紧急转向避撞。首先介绍了这两种避撞策略的基本概念，接着深入分析了临界纵向安全距离的概念及其对避撞模式选择的影响。文中特别强调了五次多项式换道轨迹模型在计算横向紧急转向避撞安全距离中的应用。最后，通过一个简化的程序实现了避撞策略的模拟和可视化展示，帮助读者更好地理解不同避撞方式的应用场景和技术细节。适合人群：汽车工程技术人员、交通安全研究人员、自动驾驶开发者。使用场景及目标：适用于研究和开发车辆主动避撞系统的专业人士，旨在提高对避撞策略的理解，优化避撞算法的设计，提升行车安全性。其他说明：文章不仅提供了理论分析，还结合了具体的数学模型和程序实现，使读者能够从多个角度全面掌握车辆避撞技术的关键要素。

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论