`

【转】经过一年时间的沉淀 再次回首 TCP Socket服务器编程

阅读更多

引用地址:http://www.cnblogs.com/zc22/archive/2010/06/27/1766007.html

 

------------------

前言

------------------

开发了这么多年,发现最困难的程序开发就是通讯系统。

 

其他大部分系统,例如CRM/CMS/权限框架/MIS之类的,无论怎么复杂,基本上都能够本地代码本地调试,性能也不太重要。(也许这个就是.net的企业级开发的战略吧)

 

可是来到通讯系统,一切变得困难复杂。原因实在太多了,如:

  • 性能永远是第一位:有时候一个if判断都要考虑性能,毕竟要损耗一个CPU指令,而在通讯系统服务器,每秒钟都产生上百万级别的通讯量,这样一个if就浪费了1个毫秒了。
  • 系统环境极其恶劣:所有我们可以想象的恶意攻击、异常输入等都要考虑;
  • 网络说断就断:在socket环境下,客户端可以以各种理由断开链接,而且服务器根本不会知道,连一个流水作业的业务逻辑都无法保证正常执行,因此需要设计各种辅助的协议、架构去监督。
  • 各种网络链接问题:例如代理、防火墙等等。。。

经过了1年的跌跌撞撞,我总算收获了点有用的经验,本文先从设计角度介绍一些我在Socket编程中的经验,下一篇在放出源代码。

 

------------------

现有的Socket编程资源

------------------

1. 首选推荐开源的XMPP框架,也就是Google的Gtalk的开源版本。里面的架构写的非常漂亮。特点就是:简洁、清晰。

 

2. 其次推荐LumaQQ.net,这套框架本身写的一般般,但是腾讯的服务器非常的猛,这样必然导致客户端也要比较猛。通过学习这套框架,能够了解腾讯的IM传输协议设计,而且他们的协议是TCP/UDP结合,一举两得。

 

3. 最后就是DotMsn。这个写的实在很一般般,而且也主要针对了MSN的协议特点。是能够学习到一点点的框架知识的,不过要有所鉴别。

 

------------------

Socket的选择

------------------

在Java,到了Java5终于出现了异步编程,NIO,于是各种所谓的框架冒了出来,例如MINA, xsocket等等;而在.NET,微软一早就为我们准备好了完善的Socket模型。主要包括:同步Socket、异步Socket;我还听说了.net 3.x之后,异步的Socket内置了完成端口。综合各种模型的性能,我总结如下:

 

1. 如果是短链接,使用同步socket。例如http服务器、转接服务器等等。

 

2. 如果是长链接,使用异步socket。例如通讯系统(QQ / Fetion)、webgame等。

 

3. .net的异步socket的连接数性能在 7500/s(每秒并发7500个socket链接)。而听说完成端口在1.5w所有。但是我到目前还没有正式见过所谓的完成端口,不知道到底有多牛逼。

 

4. 我听说了java的NIO性能在5000/s所有,我们项目内部也进行了链接测试,在4000~5000比较稳定,当然如果代码调优之后,能提高一点点。

 

------------------

TCP Socket协议定义

------------------

本文从这里开始,主要介绍TCP的socket编程。

新手们(例如当初的我),第一次写socket,总是以为在发送方压入一个"Helloworld",接收方收到了这个字符串,就“精通”了Socket编程了。而实际上,这种编程根本不可能用在现实项目,因为:

 

1. socket在传输过程中,helloworld有可能被拆分了,分段到达客户端),例如 hello   +   world,一个分段就是一个包(Package),这个就是分包问题

 

2. socket在传输过成功,不同时间发送的数据包有可能被合并,同时到达了客户端,这个就是黏包问题。例如发送方发送了hello+world,而接收方可能一次就接受了helloworld.

 

3. socket会自动在每个包后面补n个 0x0 byte,分割包。具体怎么去补,这个我就没有深入了解。

 

4. 不同的数据类型转化为byte的长度是不同的,例如int转为byte是4位(int32),这样我们在制作socket协议的时候要特别小心了。具体可以使用以下代码去测试:

代码
        public void test()
        {
            
int myInt = 1;
            
byte[] bytes = new byte[1024];
            BinaryWriter writer 
= new BinaryWriter(new MemoryStream(bytes));
            writer.Write(myInt);
            writer.Write(
"j");
            writer.Close();
        }

 

 

尽管socket环境如此恶劣,但是TCP的链接也至少保证了:

  • 包发送顺序在传输过程中是不会改变的,例如发送方发送 H E L L,那么接收方一定也是顺序收到H E L L,这个是TCP协议承诺的,因此这点成为我们解决分包、黏包问题的关键。
  • 如果发送方发送的是helloworld, 传输过程中分割成为hello+world,那么TCP保证了在hello与world之间没有其他的byte。但是不能保证helloworld和下一个命令之间没有其他的byte。

 

因此,如果我们要使用socket编程,就一定要编写自己的协议。目前业界主要采取的协议定义方式是:包头+包体长度+包体。具体如下:

 

1. 一般包头使用一个int定义,例如int = 173173173;作用是区分每一个有效的数据包,因此我们的服务器可以通过这个int去切割、合并包,组装出完整的传输协议。有人使用回车字符去分割包体,例如常见的SMTP/POP协议,这种做法在特定的协议是没有问题的,可是如果我们传输的信息内容自带了回车字符串,那么就糟糕了。所以在设计协议的时候要特别小心。

 

2. 包体长度使用一个int定义,这个长度表示包体所占的比特流长度,用于服务器正确读取并分割出包。

 

3. 包体就是自定义的一些协议内容,例如是对像序列化的内容(现有的系统已经很常见了,使用对象序列化、反序列化能够极大简化开发流程,等版本稳定后再转入手工压入byte操作)。

 

一个实际编写的例子:比如我要传输2个整型 int = 1, int = 2,那么实际传输的数据包如下:

   173173173               8                  1         2

|------包头------|----包体长度----|--------包体--------|

这个数据包就是4个整型,总长度 = 4*4  = 16。

 

说说我走的弯路:

我曾经偷懒,使用特殊结束符去分割包体,这样传输的数据包就不需要指名长度了。可是后来高人告诉我,如果使用特殊结束符去判断包,性能会损失很大,因为我们每次读取一个byte,都要做一次if判断,这个性能损失是非常严重的。所以最终还是走主流,使用以上的结构体。

 

 

------------------

Socket接收的逻辑概述

------------------

针对了我们的数据包设计+socket的传输特点,我们的接收逻辑主要是:

1. 寻找包头。这个包头就是一个int整型。但是写代码的时候要非常注意,一个int实际上占据了4个byte,而可悲的是这4个byte在传输过程中也可能被socket 分割了,因此读取判断的逻辑是:

  • 判断剩余长度是否大于4
  • 读取一个int,判断是否包头,如果是就跳出循环。
  • 如果不是包头,则倒退3个byte,回到第一点。
  • 如果读取完毕也没有找到,则有可能包头被分割了,因此当前已读信息压入接收缓存,等待下一个包到达后合并判断。

2. 读取包体长度。由于长度也是一个int,因此判断的时候也要小心,同上。

3. 读取包体,由于已知包体长度,因此读取包体就变得非常简单了,只要一直读取到长度未知,剩余的又回到第一条寻找包头。

 

这个逻辑不要小看,就这点东西忙了我1天时间。而非常奇怪的是,我发现c#写的socket,似乎没有我说的这么复杂逻辑。大家可以看看LumaQQ.net / DotMsn等,他们的socket接收代码都非常简单。我猜想:要么是.net的socket进行了优化,不会对int之类的进行分割传输;要么就是作者偷懒,随便写点代码开源糊弄一下。

 

------------------

Socket服务器参数概述

------------------

我在开篇也说了,Socket服务器的环境是非常糟糕了,最糟糕的就是客户端断线之后服务器没有收到通知。 因为socket断线这个也是个信息,也要从客户端传递到我们socket服务器。有可能网络阻塞了,导致服务器连断开的通知都没有收到。

因此,我们写socket服务器,就要面对2个环境:

1. 服务器在处理业务逻辑中的任何时候都会收到Exception, 任何时候都会因为链接中断而断开。

2. 服务器接收到的客户端请求可以是任意字符串,因此在处理业务逻辑的时候,必须对各种可能的输入都判断,防止恶意攻击。

 

针对以上几点,我们的服务器设计必须包含以下参数:

1. 客户端链接时间记录:主要判断客户端空连接情况,防止连接数被恶意占用。

2. 客户端请求频率记录:要防止客户端频繁发送请求导致服务器负荷过重。

3. 客户端错误记录:一次错误可能导致服务器产生一次exception,而这个性能损耗是非常严重的,因此要严格监控客户端的发送协议错误情况。

4. 客户端发送信息长度记录:有可能客户端恶意发送非常长的信息,导致服务器处理内存爆满,直接导致宕机。

 

5. 客户端短时间暴涨:有可能在短时间内,客户端突然发送海量数据,直接导致服务器宕机。因此我们必须有对服务器负荷进行监控,一旦发现负荷过重,直接对请求的socket返回处理失败,例如我们常见的“404”。

 

6. 服务器短时间发送信息激增:有可能在服务器内部处理逻辑中,突然产生了海量的数据需要发送,例如游戏中的“群发”;因此必须对发送进行队列缓存,然后进行合并发送,减轻socket的负荷。

 

 

------------------

后记

------------------

本文从架构设计分析了一个socket服务器的设计要点。如果您有其他见解,欢迎留言与讨论。

分享到:
评论

相关推荐

    回首过去的一年.doc

    回首过去的一年.doc

    TCP-IP详解卷一

    《TCP/IP详解卷一》是网络编程领域的一本经典著作,深入浅出地介绍了TCP/IP协议族的基础知识和原理。本书由Steven S. McQuain撰写,被广大IT从业者视为理解网络通信机制的重要参考书。在本文中,我们将对TCP/IP协议...

    初中语文文学讨论名著导读再次回首〈狼图腾的魅力与减色

    初中语文文学讨论名著导读再次回首〈狼图腾的魅力与减色

    TCP-IP详解卷三:TCP事务协议,HTTP,NNTP和UNIX域协议

    《TCP-IP详解卷三:TCP事务协议,HTTP,NNTP和UNIX域协议》是网络编程领域的经典之作,深入解析了TCP/IP协议族中的关键协议和技术。本卷书主要涵盖了四个核心主题:TCP事务协议、HTTP协议、NNTP协议以及UNIX域协议。...

    TCP-IP详解卷二:实现

    《TCP/IP详解卷二:实现》是一本深入探讨网络编程的经典著作,主要涵盖了TCP/IP协议栈的实现细节和网络编程的实践知识。本书是网络工程师、程序员和对网络技术有深厚兴趣者的宝贵参考资料。 首先,TCP(传输控制...

    回顾2009:中国RFID市场的喜与忧

    而当一年匆匆走过,回首总结,我们却兴奋地发现,2009年对于中国RFID产业和市场竟是有那么多的惊喜,这一年喜远大于忧。总结2009年中国RFID产业的喜与忧,使人在兴奋中充满了希望,在希望中又有一份客观的冷静和期盼...

    任职一年新教师述职报告.docx

    回首这一年,我深感幸运和感激。虽然我只有一年的教学经验,但我坚信,只有持续努力,才能在教育这条路上走得更远。我期待自己能在未来的工作中,继续以实际行动展现一名实力派教师的责任与担当。谢谢大家!

    初中语文文摘社会再回首花已凋零

    然而,这不仅仅是一个关于时间流逝的哲思,它还隐喻了在信息技术迅猛发展的今天,我们如何面对时间的管理、决策的准确性以及把握机会的重要性。 在IT行业,每一项技术的更新迭代,每一个项目的推进,都是与时间赛跑...

    编程珠玑番外篇-G. 程序员心底的小声音

    编程珠玑番外篇-G. 程序员心底的小声音 在《编程珠玑》这本经典著作的影响下,本文作为其番外篇,试图揭示那些在编程学习和成长的漫长旅途中,程序员心中常常响起的细微声音。在不断求知和实践的过程中,程序员会...

    Java十年再回首

    ### Java十年再回首:经典重现与重要里程碑 #### Java5.0:开发者的福音 - **核心主题**:“Ease of development”(易于开发),这是Java 5.0(代号为Tiger)的核心主题。 - **语言特性改进**:Tiger在语言特性上...

    Discuz! 回首2005

    这一年的更新可能包括功能增强、性能优化以及用户体验的改进。 【标签】"网页模版" 提示我们关注的是Discuz! 在2005年的模板设计和应用。网页模板是论坛用户自定义其网站外观的关键工具,2005年的Discuz! 可能推出...

    编程高手箴言.pdf

    编程高手精通各种调试工具和技术,能够在最短时间内定位并修复bug。同时,他们也擅长性能分析和优化,确保软件运行高效稳定。 ### 8. **团队协作与沟通** 在大型项目中,团队协作至关重要。编程高手具备优秀的团队...

    再回首恍然如梦的相关文章推荐.doc

    【文章标题】:再回首恍然如梦的相关文章推荐 【文章内容概要】:文章主要讲述了主人公昙花的人生经历,从大学毕业到成为一名教师,再到逐步晋升为中层干部的过程。文章通过昙花的成长和挫折,揭示了社会现实和个人...

    Discuz! x2.5回首经典模板

    3. **上传至服务器**:通过FTP客户端将解压后的模板文件夹上传到你的Discuz! 安装目录下的`template`文件夹内。 4. **后台设置**:登录Discuz! 的管理后台,进入“界面” - “风格与模板”设置,选择“回首经典模板...

    大型多媒体视频会议服务器端和客户端源码VC.zip

    5. **网络通信**:实现与服务器的TCP/UDP通信,处理心跳包、控制命令、音视频数据流。 6. **兼容性和适配**:考虑到跨平台运行,可能有对Windows、MacOS、Linux甚至移动设备的适配代码。 这套源码对于深入理解...

    回首过去(共10篇).pdf

    但是,根据标题“回首过去(共10篇).pdf”和描述“回首过去(共10篇).pdf”,我们可以假设文件为一系列文章,涉及回顾和总结过去的主题。基于此,我将提供关于回顾和总结的一般性知识。 在撰写回顾过去的文章时,作者...

    2021各行业述职报告开头示例自查报告.docx

    回首过去,令人鼓舞;展望未来,我们充满信心。在过去的一年里,财务部全体成员坚持服务、规范、创新的原则,深化认识,明确我们的工作核心在于提供优质服务,确保财务管理的规范化,同时寻求创新,以推动公司的稳健...

    《[回首历史展望未来作文]回首往昔展望未来国庆周年演讲稿》.doc

    《[回首历史展望未来作文]回首往昔展望未来国庆周年演讲稿》.doc

    回首温习青春.docx

    回首温习青春.docx

    愿意岁月可回首.doc

    愿意岁月可回首.doc

Global site tag (gtag.js) - Google Analytics