今年年初刚来到目前这家公司时,一个十五平米左右的小机房,摆了两个服务器机柜,一个网络机柜,里面放满了服务器,一个不给力的空调费劲的吹着不冷的风,噩梦就这样开始了。
三月底的北京,还算是比较冷的,可是我们的机房却不冷,空调吹出来的风还没室外的风凉,当时机房的温度估计在30度左右,温度这个问题当时是我一个最大的心病,在接下来的两个多月中,服务器的故障率非常高,平均每周都有服务器出现故障,经过统计,从我刚来公司,到机房温度问题得到解决这段时间里,有29次服务器故障,其中2次硬件故障,5次服务器性能问题,7次服务器死机,4次服务器宕机,11次服务器重启。在这段时间里干着非常被动的运维工作,在机房温度这个大问题没有解决的情况下,每次服务器出现故障都要明确找出故障原因给领导汇报,除了服务器重启和宕机还有硬件故障在惠普ilo里有明确的记录外,服务器莫名其妙出现性能问题,莫名其妙卡死、宕机,虽然在linux 日志里有相应的记录,可大多是一篇一篇看不懂的信息,却没有明确表明是温度引起的(虽然这个时候机房温度偏高)。两次硬件故障分别是电源模块坏了,网卡坏了,领导一方面质疑硬件质量,一方面想知道为什么坏了,却不关心机房温度已经破30了,无奈通过惠普服务器ilo收集服务器一个星期的温度情况,做成曲线图给领导看,得到的回复是新机房正在规划,再坚持一段时间,随着时间的推移,北京的天气也变热了,机房温度升到了34、35、36度,服务器机箱内的温度也长期维持在40度以上,45度就要宕机的呀,眼看服务器实在受不住了,跟领导汇报后,这才又买了一台空调,两台空调温度调到最低,之后,服务器几乎再没有出现过问题。
回头看看那两个月被动的工作,心有余悸,但是也让我在linux服务器故障排查方面有些感悟。在有几次服务器莫名出现性能问题,莫名宕机时,linux系统也记录了相关的日志信息,把这些日志信息放到google一查,也有人遇到了一样的问题,在网上讨论问题原因,大多数回复是根据日志信息字面上的问题做出相应的猜测,他们做出那样的猜测不无道理,不过他们的思路局限在了linux系统,忽略了linux系统之外的大环境(服务器硬件,机房环境,网络环境等)。
在我接触到的问题中,有不少是由于系统以外的问题导致系统不正常的,所以我觉得在做linux系统运维时,当服务器出现问题,除非明确是系统问题,否则故障的排查应该从外往内,既从外围的机房环境(温度,湿度等)到网络环境(需要有一定的网络基础),到服务器硬件(磁盘,raid卡、网卡,内存等),再到操作系统,这样才能准确又快速的找到问题的原因。
相关推荐
嵌入式Linux系统开发是将Linux操作系统移植到各种嵌入式设备上的技术,涉及硬件、驱动程序、内核裁剪、文件系统构建等多个方面。在《嵌入式Linux系统开发手册》中,读者可以深入了解到这个领域的核心知识。 首先,...
ARM嵌入式Linux系统开发不仅需要对硬件有深入的理解,还需要软件方面的技术支持,包括系统编程、网络编程、多任务管理等。因此,本书的读者应当具备一定的软件开发背景,并对嵌入式系统有浓厚的兴趣。 在后续的学习...
Linux 在 Xilinx FPGA 上的...本文通过对 Linux 在 Xilinx FPGA 上的移植的研究和实现,验证了该系统的稳定性和可靠性,证明了 Linux 在 Xilinx FPGA 上的移植是实现高性能、低功耗、灵活编程的嵌入式系统的可行方案。
嵌入式Linux系统移植是一项复杂而关键的任务,它涉及到硬件平台的选择、内核配置、根文件系统的构建等多个环节。在深度实践中,我们需要了解并掌握这些关键知识点,以便将Linux操作系统成功地部署到特定的嵌入式设备...
本文将介绍基于S3C2410芯片的嵌入式Linux系统开发环境的设计与实现,采用嵌入式Linux操作系统和三星公司的嵌入式处理器芯片S3C2410作为研究对象,具体阐述搭建嵌入式系统开发环境的设计思想与实现方法。同时,文中还...
5. 车载导航系统的硬件组成:车载导航系统的硬件组成包括HMS30C7202嵌入式微处理器、LCD液晶显示模块、存储器模块、GPS模块、串行接口、USB接口、IrDA红外通讯接口、网络接口等外围部分。 6. Linux操作系统在嵌入式...
3. **丰富的I/O接口**:Linux系统支持更多的外设连接,可以方便地添加和管理多个外围设备,如传感器和存储设备。 4. **可扩展性**:嵌入式Linux支持操作系统内核裁剪和应用程序的开发,可以根据需要添加新的功能或...
3. 配置并移植嵌入式 Linux 内核:内核是操作系统的核心组件,对不同的硬件平台,需对标准 Linux 内核进行定制与裁剪,在满足系统的需求的基础上优化系统的性能及资源占用量。 指纹识别门禁软件系统设计与实现 ...
### ARM嵌入式Linux系统开发详解 #### 一、嵌入式系统定义及特性 嵌入式系统,作为计算机科学领域的重要分支,以其独特的体积小、功能专一、软硬件可裁剪的特性,深入人们的日常生活。从智能家电到工业自动化,从...
### C基于局域网Linux环境下的心跳检测系统实现 #### 概述 随着网络技术的快速发展,局域网(Local Area Network, LAN)已经成为企业和机构内部数据交换的主要平台。然而,伴随着网络规模的不断扩大,网络故障的...
在嵌入式Linux系统的移植中,开发环境的构建是非常重要的。开发环境主要包括嵌入式硬件平台和嵌入式软件平台两个部分。嵌入式硬件平台的核心部件是一个三星s3c2410 ARM92OT芯片,其工作频率最高达到200MHz。外围包括...
LTIB是飞思卡尔官方提供的一个工具,用于在I.MX6平台上生成一个定制化的Linux系统镜像。 此外,手册还指导用户如何配置内核,以及如何编译和烧写Uboot(一个开源的引导加载程序)。编译内核和烧写Uboot是Linux环境...
2. **Linux内核移植**:将Linux内核编译并适配到选定的ARM处理器上,包括配置内核选项、调整硬件驱动和优化性能。 3. **根文件系统**:构建包含所需应用程序、库和配置文件的文件系统。这可能包括 BusyBox、BusyBox...
这里ARM处理器的高速计算能力和Linux系统的多任务处理能力显得尤为重要。 4. 网络通信:风力发电机控制系统的远程监控和维护需要建立可靠的通信机制。ARM-Linux嵌入式系统通常具备多种通信接口,如RS485、CAN总线、...
总的来说,嵌入式Linux系统基础的学习涵盖了硬件平台的选择、软件开发流程、调试技术,以及对嵌入式系统特性的理解。掌握这些知识对于开发和维护嵌入式设备至关重要,也是推动现代科技产品不断创新的关键。