`

玩家被踢下线原因分析

阅读更多

我们游戏在开心网上线之后,最高有一千多的同时在线人数,不过好景不长,有几天晚上8-10点之间,发生了所有玩家被踢下线的情况。

 

一次发生在晚上9点左右,此时人数在持续上升,突然发生玩家全部掉线,当时几个同事都在现场,查看数据库状态show processlist,发现有几百个请求正在进行中,有几张myisam表处于lock状态,试图重启数据库,不过非常缓慢,查看tomcat日志发现,玩家掉线这段时间,基本不刷什么日志了,之前我们将web应用的session过期时间设置成3分钟,这段时间内如果没有玩家访问tomcat的话,session都将过期,因此所有玩家都被踢下线了,当时重启了mysql,恢复正常,此时已经10点多,玩家继续登录的不多,因此问题没有在发生。

 

后来又过了几天,悲剧的事情继续上演,晚上8点左右服务器在线800多人的时候,所有玩家被踢下线,据运维同事反映,mysql状态正常,当时由于不在公司,没法看到当时db的状态,只能去公司分析tomcat日志,发现tomcat有10分钟左右的时间段没有刷日志,之后有大量的乐观锁异常,用jstack查看tomcat进程,发现有将近500个线程在跑,几乎达到了tomcat线程池配置的最大线程数,这种情况很不正常,我们看到其他几个服的tomcat线程在40个左右,为线程池配置的最小值,经过网上查看相关文章了解到,大量线程很容易产生死锁,而且线程间切换的开销也很大,所以初步判断,是线程死锁导致tomcat停止响应,造成了玩家被踢下线。

 

在之前服务器端spring事务配置中,将事务的timeout时间设置成了无限长,此时当db有lock被阻塞的时候,tomcat的线程一直处于占用状态,而此时玩家不断有请求发送到tomcat,使得tomcat线程数不断增长,达到线程池的最大值,之后无法再处理玩家的请求了。之后将spring事务超时时间设置成了5s,经测试没有大的异常,放到外网之后没有再产生过类似问题,也可能跟人数没有达到当时的高峰有关。

 

这种情况的发生,一部分是由于tomcat6采用servlet2的机制导致的,老的servlet采用了block io的方法实现,web 容器的线程与应用的线程一致,因此应用发生异常,会影响到tomcat的稳定性。而最新的servlet3.0,引入了异步处理,Servlet 线程不再需要一直阻塞,直到业务处理完毕才能再输出响应,最后才结束该 Servlet 线程。在接收到请求之后,Servlet 线程可以将耗时的操作委派给另一个线程来完成,自己在不生成响应的情况下返回至容器。针对业务处理较耗时的情况,这将大大减少服务器资源的占用,并且提高并发处理速度。应用部分可以自己创建线程池,灵活地处理业务请求。

 

另外部分原因是mysql瓶颈导致服务器失去响应的,是否需要有一个统一的数据服务器来管理与mysql的连接,这个值得考虑。

 

1.http://blog.csdn.net/aking21alinjuju/article/details/5583820

2.大宝,网游服务器架构设计.pptx

分享到:
评论

相关推荐

    Android单点登录,互踢下线代码实现

    本文将详细探讨如何在Android平台上实现单点登录,特别是实现互踢下线功能。 首先,我们需要理解单点登录的工作原理。在Android环境中,SSO通常通过共享存储(如SharedPreferences、数据库或网络服务)来实现。当...

    Broadcast广播实现强制下线功能

    - 静态注册:在AndroidManifest.xml文件中添加BroadcastReceiver的声明,这样即使应用在后台或者被杀死,仍然能接收到广播。 ```xml ``` - 动态注册:在Activity或Service的onCreate()方法中注册...

    易语言恶搞QQ下线

    这个“易语言恶搞QQ下线”项目,从标题和描述来看,主要是利用易语言编写的一个程序,其功能可能是发送某种指令或消息,使得目标QQ账号被迫下线,这在编程领域被称为一种恶作剧或黑客行为。 首先,我们要明确,这种...

    Java使用Sa-Token框架完成踢人下线功能.rar

    在用户需要被踢下线时,只需要调用`StpUtil.kickout(userId)`即可。 为了确保用户下线操作能够实时生效,你可能需要配合WebSocket或其他实时通信技术,当服务器端执行踢人操作时,可以即时通知客户端断开连接。同时...

    基于zookeeper 监控dubbo provider 下线,提供dubbo 服务下线 邮箱预警

    - 结合日志系统,记录下线事件,便于后期分析服务稳定性。 通过这个系统,运维人员可以在服务出现问题时,得到及时的预警,从而快速定位和解决问题,提升系统的整体稳定性。同时,这种独立部署、代码0入侵的设计,...

    强制下线功能

    8. **日志记录**:每次强制下线操作都应记录在日志中,便于后期分析和审计,了解操作原因,以及预防和解决问题。 总之,实现强制下线功能涉及用户状态跟踪、指令生成与分发、客户端和服务器的响应处理等多个环节,...

    Java后台实现前台下线通知推送

    当会话被创建或销毁时,这些方法会被调用,从而我们可以在此触发通知推送。 3. **推送通知**:有多种方法可以实现实时推送,包括Ajax轮询、长轮询、WebSocket等。对于简单的场景,可以使用Ajax轮询,即前端定时向...

    基于javaScript+shell开发的信号衰减比较踢客户端下线脚本,支持弱信号剔除与强信号剔除+源码+项目文档+使用教程

    基于javaScript+shell开发的信号衰减比较踢客户端下线脚本,支持弱信号剔除与强信号剔除+源码+项目文档+使用教程,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,...

    Android端“被挤下线”功能的单点登录实现

    1. API 请求中后台返回特定的 code,缺点是需要下次请求才知道被踢下线。 2. 使用推送,后台可以推送给 APP,从而使 APP 得知已在其他地方登录,可以及时响应。 3. 使用第三方的监听器,例如集成了环信,环信自身...

    锐捷4.21 破解强制下线问题

    3. 网络管理策略:分析管理员如何通过网络管理系统设定强制下线的条件,例如超时、流量限制、安全策略等。 4. 软件bug修复:探讨如何通过编程和调试找出并修复导致错误下线的代码问题。 5. 兼容性优化:学习如何针对...

    强制下线功能源码

    通过分析和学习这些代码,你可以更好地理解如何在实际项目中实现和优化强制下线功能。同时,也可以学习到如何在Android Studio环境中调试和测试BroadcastReceiver,这对于提高你的Android开发技能是非常有帮助的。在...

    neobux国外网赚站点用的下线分析器

    neobux国外网赚站点用的下线分析器!用了就知道哦!!

    关于Freeradius用户非正常下线的问题

    #### 一、问题背景与原因分析 在使用Freeradius作为认证服务器的过程中,可能会遇到一种情况:即用户在非正常下线后,再次尝试登录时无法成功认证。这种现象通常发生在设置了`Simultaneous-Use:=1`的情况下,即限制...

    Android通过广播实现强制下线功能

    在Android应用开发中,有时需要实现一种机制,当用户在其他设备或平台上登录时,当前设备上的应用会接收到通知并自动强制用户下线。这种功能可以确保账号安全,防止同一账号在多个设备上同时在线可能引发的问题。...

    Python-kong网关的JWT插件含踢下线功能

    实现了Jwt拦截,登录时调用第三方登录接口。登录后会生成JWT-token,把返回的jwt-token放入hearder里面,下次请求插件会解析出加密前的登录信息,放入hearder里面,然后再访问相应的业务系统

    强制当前账号下线

    3. **广播消息**:在分布式系统或实时应用中,服务器可能会通过广播消息的方式通知所有节点,让它们知道某个账号已被标记为下线。这样,无论用户在哪个节点上尝试操作,都会收到下线提示。 4. **对话框提示**:在...

    q恶搞下线通知

    很抱歉,但根据您给出的信息,"q恶搞下线通知"似乎与常规的IT知识点不相符,且提供的标签"Q下线.rar"和压缩包子文件的文件名称"Q下线.exe"也没有明确指向某个具体的IT概念或技术。通常,".exe"文件是Windows操作系统...

    复杂需求的设计处理--五级之内发展的下线名单的归属

    在多级营销中,每个用户可以推荐其他人加入,被推荐的人称为该用户的“下线”。当一个用户有多个下线时,就会形成一个树状结构,其中用户是节点,推荐关系是边。这个系统需要追踪每个用户的直接和间接下线,直到第五...

    CDH5.9.0节点删除下线

    在CDH5.9.0集群环境中,有时由于硬件更新、资源优化或故障处理等原因,可能需要删除或下线部分节点。以下是一个详尽的步骤指南,帮助你安全地从CDH5.9.0集群中移除节点。 首先,确保你已经了解了CDH(Cloudera ...

Global site tag (gtag.js) - Google Analytics