- 浏览: 166428 次
- 性别:
- 来自: 南京
文章分类
- 全部博客 (327)
- JAVA (130)
- 工作笔记 (49)
- SQLSERVER (5)
- ORACLE (28)
- nginx (1)
- Unix C (16)
- 系统 (19)
- 网络技术 (17)
- WEB前端 (22)
- Eclipse (2)
- Tomcat (1)
- spring (7)
- MYSQL (12)
- Maven (6)
- JETTY (2)
- 设计 (2)
- 开源项目 (7)
- asterisk (0)
- C++ (2)
- WINDOWS (2)
- SCALA (0)
- 协议 (1)
- Netty (1)
- SHELL (1)
- mybaits (4)
- 并发 (2)
- 架构 (2)
- TCP/IP (8)
- 虚拟化 (3)
- 不要再说java慢 (0)
- mac (2)
- mysql乱码完美解决 (1)
最新评论
【转】 CLOSE_WAIT状态的生成原因
重用本地地址和端口
从容关闭还是强行关闭?
总结
摘要:本文阐述了为何socket连接锁定在CLOSE_WAIT状态,以及通过什么措施力求避免这种情况。
不久前,我的Socket Client程序遇到了一个非常尴尬的错误。它本来应该在一个socket长连接上持续不断地向服务器发送数据,如果socket连接断开,那么程序会自动不断地重试建立连接。
有一天发现程序在不断尝试建立连接,但是总是失败。用netstat查看,这个程序竟然有上千个socket连接处于CLOSE_WAIT状态,以至于达到了上限,所以无法建立新的socket连接了。
为什么会这样呢?
它们为什么会都处在CLOSE_WAIT状态呢?
CLOSE_WAIT状态的生成原因
首先我们知道,如果我们的Client程序处于CLOSE_WAIT状态的话,说明套接字是被动关闭的!
因为如果是Server端主动断掉当前连接的话,那么双方关闭这个TCP连接共需要四个packet:
Server ---> FIN ---> Client
Server <--- ACK <--- Client
这时候Server端处于FIN_WAIT_2状态;而我们的程序处于CLOSE_WAIT状态。
Server <--- FIN <--- Client
这时Client发送FIN给Server,Client就置为LAST_ACK状态。
Server ---> ACK ---> Client
Server回应了ACK,那么Client的套接字才会真正置为CLOSED状态。
我们的程序处于CLOSE_WAIT状态,而不是LAST_ACK状态,说明还没有发FIN给Server,那么可能是在关闭连接之前还有许多数据要发送或者其他事要做,导致没有发这个FIN packet。
原因知道了,那么为什么不发FIN包呢,难道会在关闭己方连接前有那么多事情要做吗?
elssann举例说,当对方调用closesocket的时候,我的程序正在调用recv中,这时候有可能对方发送的FIN包我没有收到,而是由TCP代回了一个ACK包,所以我这边套接字进入CLOSE_WAIT状态。
所以他建议在这里判断recv函数的返回值是否已出错,是的话就主动closesocket,这样防止没有接收到FIN包。
因为前面我们已经设置了recv超时时间为30秒,那么如果真的是超时了,这里收到的错误应该是WSAETIMEDOUT,这种情况下也可以主动关闭连接的。
还有一个问题,为什么有数千个连接都处于这个状态呢?难道那段时间内,服务器端总是主动拆除我们的连接吗?
不管怎么样,我们必须防止类似情况再度发生!
首先,我们要保证原来的端口可以被重用,这可以通过设置SO_REUSEADDR套接字选项做到:
重用本地地址和端口
以前我总是一个端口不行,就换一个新的使用,所以导致让数千个端口进入CLOSE_WAIT状态。如果下次还发生这种尴尬状况,我希望加一个限定,只是当前这个端口处于CLOSE_WAIT状态!
在调用
sockConnected = socket(AF_INET, SOCK_STREAM, 0);
之后,我们要设置该套接字的选项来重用:
/// 允许重用本地地址和端口:
/// 这样的好处是,即使socket断了,调用前面的socket函数也不会占用另一个,而是始终就是一个端口
/// 这样防止socket始终连接不上,那么按照原来的做法,会不断地换端口。
int nREUSEADDR = 1;
setsockopt(sockConnected,
SOL_SOCKET,
SO_REUSEADDR,
(const char*)&nREUSEADDR,
sizeof(int));
教科书上是这么说的:这样,假如服务器关闭或者退出,造成本地地址和端口都处于TIME_WAIT状态,那么SO_REUSEADDR就显得非常有用。
也许我们无法避免被冻结在CLOSE_WAIT状态永远不出现,但起码可以保证不会占用新的端口。
其次,我们要设置SO_LINGER套接字选项:
从容关闭还是强行关闭?
LINGER是“拖延”的意思。
默认情况下(Win2k),SO_DONTLINGER套接字选项的是1;SO_LINGER选项是,linger为{l_onoff:0,l_linger:0}。
如果在发送数据的过程中(send()没有完成,还有数据没发送)而调用了closesocket(),以前我们一般采取的措施是“从容关闭”:
因为在退出服务或者每次重新建立socket之前,我都会先调用
/// 先将双向的通讯关闭
shutdown(sockConnected, SD_BOTH);
/// 安全起见,每次建立Socket连接前,先把这个旧连接关闭
closesocket(sockConnected);
我们这次要这么做:
设置SO_LINGER为零(亦即linger结构中的l_onoff域设为非零,但l_linger为0),便不用担心closesocket调用进入“锁定”状态(等待完成),不论是否有排队数据未发送或未被确认。这种关闭方式称为“强行关闭”,因为套接字的虚电路立即被复位,尚未发出的所有数据都会丢失。在远端的recv()调用都会失败,并返回WSAECONNRESET错误。
在connect成功建立连接之后设置该选项:
linger m_sLinger;
m_sLinger.l_onoff = 1; // (在closesocket()调用,但是还有数据没发送完毕的时候容许逗留)
m_sLinger.l_linger = 0; // (容许逗留的时间为0秒)
setsockopt(sockConnected,
SOL_SOCKET,
SO_LINGER,
(const char*)&m_sLinger,
sizeof(linger));
另外:
通常来说,一个CLOSE_WAIT会维持至少2个小时的时间。如果有个流氓特地写了个程序,给你造成一堆的CLOSE_WAIT,消耗
你的资源,那么通常是等不到释放那一刻,系统就已经解决崩溃了。
只能通过修改一下TCP/IP的参数,来缩短这个时间:修改tcp_keepalive_*系列参数有助于解决这个问题。tcp_keepalive_time :INTEGER
默认值是7200(2小时)当keepalive打开的情况下,TCP发送keepalive消息的频率。(由于目前网络攻击等因素,造成了利用这个进行的攻击很频繁,曾经也有cu的朋友提到过,说如果2边建立了连接,然后不发送任何数据或者rst/fin消息,那么持续的时间是不是就是2小时,空连接攻击? tcp_keepalive_time就是预防此情形的.我个人在做nat服务的时候的修改值为1800秒)
总结
也许我们避免不了CLOSE_WAIT状态冻结的再次出现,但我们会使影响降到最小,希望那个重用套接字选项能够使得下一次重新建立连接时可以把CLOSE_WAIT状态踢掉。
重用本地地址和端口
从容关闭还是强行关闭?
总结
摘要:本文阐述了为何socket连接锁定在CLOSE_WAIT状态,以及通过什么措施力求避免这种情况。
不久前,我的Socket Client程序遇到了一个非常尴尬的错误。它本来应该在一个socket长连接上持续不断地向服务器发送数据,如果socket连接断开,那么程序会自动不断地重试建立连接。
有一天发现程序在不断尝试建立连接,但是总是失败。用netstat查看,这个程序竟然有上千个socket连接处于CLOSE_WAIT状态,以至于达到了上限,所以无法建立新的socket连接了。
为什么会这样呢?
它们为什么会都处在CLOSE_WAIT状态呢?
CLOSE_WAIT状态的生成原因
首先我们知道,如果我们的Client程序处于CLOSE_WAIT状态的话,说明套接字是被动关闭的!
因为如果是Server端主动断掉当前连接的话,那么双方关闭这个TCP连接共需要四个packet:
Server ---> FIN ---> Client
Server <--- ACK <--- Client
这时候Server端处于FIN_WAIT_2状态;而我们的程序处于CLOSE_WAIT状态。
Server <--- FIN <--- Client
这时Client发送FIN给Server,Client就置为LAST_ACK状态。
Server ---> ACK ---> Client
Server回应了ACK,那么Client的套接字才会真正置为CLOSED状态。
我们的程序处于CLOSE_WAIT状态,而不是LAST_ACK状态,说明还没有发FIN给Server,那么可能是在关闭连接之前还有许多数据要发送或者其他事要做,导致没有发这个FIN packet。
原因知道了,那么为什么不发FIN包呢,难道会在关闭己方连接前有那么多事情要做吗?
elssann举例说,当对方调用closesocket的时候,我的程序正在调用recv中,这时候有可能对方发送的FIN包我没有收到,而是由TCP代回了一个ACK包,所以我这边套接字进入CLOSE_WAIT状态。
所以他建议在这里判断recv函数的返回值是否已出错,是的话就主动closesocket,这样防止没有接收到FIN包。
因为前面我们已经设置了recv超时时间为30秒,那么如果真的是超时了,这里收到的错误应该是WSAETIMEDOUT,这种情况下也可以主动关闭连接的。
还有一个问题,为什么有数千个连接都处于这个状态呢?难道那段时间内,服务器端总是主动拆除我们的连接吗?
不管怎么样,我们必须防止类似情况再度发生!
首先,我们要保证原来的端口可以被重用,这可以通过设置SO_REUSEADDR套接字选项做到:
重用本地地址和端口
以前我总是一个端口不行,就换一个新的使用,所以导致让数千个端口进入CLOSE_WAIT状态。如果下次还发生这种尴尬状况,我希望加一个限定,只是当前这个端口处于CLOSE_WAIT状态!
在调用
sockConnected = socket(AF_INET, SOCK_STREAM, 0);
之后,我们要设置该套接字的选项来重用:
/// 允许重用本地地址和端口:
/// 这样的好处是,即使socket断了,调用前面的socket函数也不会占用另一个,而是始终就是一个端口
/// 这样防止socket始终连接不上,那么按照原来的做法,会不断地换端口。
int nREUSEADDR = 1;
setsockopt(sockConnected,
SOL_SOCKET,
SO_REUSEADDR,
(const char*)&nREUSEADDR,
sizeof(int));
教科书上是这么说的:这样,假如服务器关闭或者退出,造成本地地址和端口都处于TIME_WAIT状态,那么SO_REUSEADDR就显得非常有用。
也许我们无法避免被冻结在CLOSE_WAIT状态永远不出现,但起码可以保证不会占用新的端口。
其次,我们要设置SO_LINGER套接字选项:
从容关闭还是强行关闭?
LINGER是“拖延”的意思。
默认情况下(Win2k),SO_DONTLINGER套接字选项的是1;SO_LINGER选项是,linger为{l_onoff:0,l_linger:0}。
如果在发送数据的过程中(send()没有完成,还有数据没发送)而调用了closesocket(),以前我们一般采取的措施是“从容关闭”:
因为在退出服务或者每次重新建立socket之前,我都会先调用
/// 先将双向的通讯关闭
shutdown(sockConnected, SD_BOTH);
/// 安全起见,每次建立Socket连接前,先把这个旧连接关闭
closesocket(sockConnected);
我们这次要这么做:
设置SO_LINGER为零(亦即linger结构中的l_onoff域设为非零,但l_linger为0),便不用担心closesocket调用进入“锁定”状态(等待完成),不论是否有排队数据未发送或未被确认。这种关闭方式称为“强行关闭”,因为套接字的虚电路立即被复位,尚未发出的所有数据都会丢失。在远端的recv()调用都会失败,并返回WSAECONNRESET错误。
在connect成功建立连接之后设置该选项:
linger m_sLinger;
m_sLinger.l_onoff = 1; // (在closesocket()调用,但是还有数据没发送完毕的时候容许逗留)
m_sLinger.l_linger = 0; // (容许逗留的时间为0秒)
setsockopt(sockConnected,
SOL_SOCKET,
SO_LINGER,
(const char*)&m_sLinger,
sizeof(linger));
另外:
通常来说,一个CLOSE_WAIT会维持至少2个小时的时间。如果有个流氓特地写了个程序,给你造成一堆的CLOSE_WAIT,消耗
你的资源,那么通常是等不到释放那一刻,系统就已经解决崩溃了。
只能通过修改一下TCP/IP的参数,来缩短这个时间:修改tcp_keepalive_*系列参数有助于解决这个问题。tcp_keepalive_time :INTEGER
默认值是7200(2小时)当keepalive打开的情况下,TCP发送keepalive消息的频率。(由于目前网络攻击等因素,造成了利用这个进行的攻击很频繁,曾经也有cu的朋友提到过,说如果2边建立了连接,然后不发送任何数据或者rst/fin消息,那么持续的时间是不是就是2小时,空连接攻击? tcp_keepalive_time就是预防此情形的.我个人在做nat服务的时候的修改值为1800秒)
总结
也许我们避免不了CLOSE_WAIT状态冻结的再次出现,但我们会使影响降到最小,希望那个重用套接字选项能够使得下一次重新建立连接时可以把CLOSE_WAIT状态踢掉。
发表评论
-
CentOS安装iftop查看网络带宽使用情况
2015-08-01 16:28 401转自 http://mycnarms.blog.51cto.c ... -
wireshark 用法
2014-08-07 10:11 502http://www.doc88.com/p-97335415 ... -
转来的虚拟化技术文章
2014-07-11 08:08 408http://www.cnblogs.com/skyme/ar ... -
转来的@陶辉的TCP 专讲
2014-07-08 22:55 587http://yuanbor.blog.163.com/blo ... -
零拷贝
2014-07-01 21:11 767Networking interface card ? ... -
NAT 穿透
2014-06-30 21:59 264NAT 穿透的JAVA库。 http://www.javaw ... -
惊群”,看看nginx是怎么解决它的(转)
2014-05-06 17:26 505惊群”,看看nginx是怎么解决它的 惊群通常发生在ser ... -
0 拷贝
2014-03-14 10:32 291http://blog.csdn.net/zzz_781111 ... -
部分 TCP 内核参数彻底了解 (转)
2014-03-05 10:28 325深入一些了解TCPIP协议 backlog 参数 http: ... -
SSL作用
2014-01-31 22:36 522http://blog.csdn.net/zhuyingqin ... -
U 盘不能拷贝 大文件.
2014-01-23 11:55 379简单的方法:选择U盘--属性--硬件--属性--策略--高性能 ... -
SNMP
2013-12-24 17:27 484http://blog.csdn.net/jiangtaohu ... -
TCPIP协议第一卷的笔记
2013-12-02 15:21 468http://blog.csdn.net/goodboy188 ... -
各种缓存
2013-10-12 16:36 458http://snowolf.iteye.com/catego ... -
Linger
2013-04-25 17:51 717http://blog.csdn.net/fullsail/a ... -
反向代理
2013-04-20 19:51 675以下中文信息摘自百度。 代理就是你的访问通过一台机器来访 ...
相关推荐
CLOSE_WAIT 状态的生成原因是程序写的不好。服务器程序 APACHE 处于 CLOSE_WAIT 状态,说明套接字是被动关闭的!如果是客户端主动断开连接,服务器端的连接会处在“挂起”状态。 TCP SYNC 基础知识非常重要,对于...
CLOSE_WAIT 状态的生成原因 CLOSE_WAIT 状态是 TCP 连接中一种常见的状态。当服务器程序 APACHE 处于 CLOSE_WAIT 状态时,说明套接字是被动关闭的。这是因为如果客户端主动断掉当前连接,那么双方关闭这个 TCP 连接...
2. **第二次挥手**:被动关闭一方(通常是服务器)接收到FIN包后,会发送一个ACK确认包,表示接收到对方的FIN请求,但此时服务器可能仍有未发送完的数据,所以不会立即关闭连接,服务器进入CLOSE_WAIT状态。...
2. 第二次挥手:另一方(被动关闭方)收到FIN后,发送一个ACK报文,确认序号为收到的序列号加1,然后进入CLOSE_WAIT状态,表示接收完了所有数据,但还有数据要发送。 3. 第三次挥手:被动关闭方发送自己的FIN报文,...
2. 服务器收到FIN包,发送一个ACK包给客户端,进入CLOSE_WAIT状态。 3. 服务器完成数据发送后,发送一个FIN包给客户端,进入LAST_ACK状态。 4. 客户端收到服务器的FIN包,发送ACK包给服务器,进入TIME_WAIT状态,...
此时,主动关闭方进入TIME_WAIT状态,等待2MSL时间以确保所有分组都能在网络中消失,防止旧的数据包被误接收。 TCP的状态转换图包括了多个状态,如LISTEN、SYN_SENT、SYN_RECV、ESTABLISHED、FIN_WAIT_1、FIN_WAIT_...
- **第二次挥手**:服务器响应ACK,确认序号为收到的序号+1,进入CLOSE_WAIT状态。 - **第三次挥手**:服务器发送FIN,请求关闭连接,进入LAST_ACK状态。 - **第四次挥手**:客户端收到FIN,发送ACK确认,进入...
服务器(主机2)收到FIN报文段后,发送一个ACK报文段确认,然后进入CLOSE_WAIT状态。随后,服务器也发送一个FIN报文段,请求关闭连接,并进入LAST_ACK状态。最后,客户端收到FIN报文段后,发送一个ACK报文段确认,并...
- `tcp_conn`:表示TCP连接的状态机,管理连接的各种状态,如CLOSED、LISTEN、SYN_SENT、SYN_RCVD、ESTABLISHED、FIN_WAIT_1、FIN_WAIT_2、CLOSE_WAIT、CLOSING、LAST_ACK、TIME_WAIT等。 - `tcp_input()`:处理接收...
1. **TCP同步状态机**:分析和理解TCP连接的各个状态,如CLOSED、LISTEN、SYN_SENT、SYN_RECEIVED、ESTABLISHED、FIN_WAIT_1、FIN_WAIT_2、CLOSE_WAIT、CLOSING、LAST_ACK和TIME_WAIT。 2. **滑动窗口机制**:TCP...
- **服务器**进入**CLOSE_WAIT**状态。 - **客户端**进入**FIN_WAIT_2**状态。 3. **FIN挥手**: - 当**服务器**完成所有数据传输后,也会发送一个带有`FIN`标志的TCP段给**客户端**,请求关闭服务器到客户端的...
被动方收到FIN后回复ACK,进入CLOSE_WAIT状态,等待应用层调用close函数。主动方收到FIN后,会再次确认,进入TIME_WAIT状态,等待一段时间确保数据完全传输。被动方收到确认后关闭连接。主动方在FIN_WAIT1状态等待...
13. **TCP四次挥手**:终止TCP连接的过程,TIME_WAIT和CLOSE_WAIT是挥手过程中的状态,TIME_WAIT状态确保数据完全传输。 14. **TIME_WAIT的解决和回收机制**:可以通过设置TIME_WAIT超时时间或使用连接池等方式减少...
7. **CLOSE_WAIT**:服务器收到客户端的FIN报文后进入的状态。 8. **FIN_WAIT2**:客户端收到服务器的ACK后进入的状态,此时客户端等待服务器发送FIN报文。 9. **LAST_ACK**:服务器发送FIN报文后进入的状态,等待...
13. **四次挥手(TIME_WAIT与CLOSE_WAIT)**:TCP关闭连接的阶段,确保数据传输完整,防止旧连接复用导致问题。 14. **解决TIME_WAIT问题**:可以通过设置系统参数缩短TIME_WAIT时间或复用TIME_WAIT连接。 15. **...
2. **第二次挥手**: 服务器收到客户端的FIN报文段后,发出确认报文ACK=1,但自己的FIN位仍为0,表示同意关闭连接,此时服务器进入CLOSE_WAIT状态。 - **源端口**:服务器的知名端口。 - **目标端口**:客户端的...
7. 状态检查:`PSOCK_NEWDATA`用于检查是否有新的数据到达,`PSOCK_WAIT_UNTIL`和`PSOCK_WAIT_THREAD`用于等待特定条件满足。 原始套接字库提供的这些宏简化了网络编程,但也带来了限制,比如对局部变量的管理。在...
但在此期间,服务器端可能还需要继续接收数据,因此它不会立刻发送自己的FIN报文,这时服务器端处于CLOSE_WAIT状态。 - **原因**:通常出现在服务器端处理请求时未能及时发送FIN报文的情况。可能是由于服务器端程序...
2. **SN_SR** 寄存器:读取Socket状态,如ESTABLISHED(已建立连接)、CLOSE_WAIT(等待关闭)等。 3. **SN_RXBUF_SIZE** 和 **SN_TXBUF_SIZE** 寄存器:获取和设置接收/发送缓冲区的大小。 4. **SN_RD** 和 **SN_WR...
- **第二次挥手**:服务器回应ACK报文,确认客户端的请求,服务器状态变更为CLOSE_WAIT。 - **第三次挥手**:服务器发送FIN报文,请求断开连接,服务器状态变更为LAST_ACK。 - **第四次挥手**:客户端回应ACK报文,...