`
starryshi
  • 浏览: 12565 次
文章分类
社区版块
存档分类
最新评论

如何排除Linux故障技术详解

 
阅读更多

(一)单用户模式

  Linux系统提供了单用户模式(类似Windows安全模式),可以在最小环境中进行系统维护。在单用户模式(运行级别1)中,Linux引导进入根shell,网络被禁用,只有少数进程运行。单用户模式可以用来修改文件系统损坏、还原配置文件、移动用户数据等。

  以下列举了几个单用户模式修复系统故障的典型案例:

  案例一:root密码忘记

  在单用户模式中,Linux不需要root密码(Red Hat系统不需要root密码,但SuSe则需要,不同Linux系统稍有差别,本文以Fedora Core 6为例讲解),这使更改root密码非常容易。了解当系统引导进入多用户模式失败时,如何进入单用户模式,非常重要。

  1、 在系统启动过程中,会出现开始界面,按任意键,进入GRUB菜单选项。

  若希望以后无此提示,直接进入GRUB菜单选项,删除配置文件grub.conf中“hiddenmenu”项即可。

  2、 按“e”键编辑GRUB引导菜单选项,按“e”键后的GRUB屏幕。通过箭头键下移到kernel行,并按“e”键,

  3、在尾行光标处添加single,按回车键返回前一个屏幕,按“b”键进行引导,则系统自动进入单用户模式,如果要改变root密码,则执行命令:sh-3.1# passwd root

  更改成功后,执行命令exit退出重启即可。

  大家可以在单用户模式中去纠正阻止系统正常启动的很多问题,比如:

  1、 禁用可能中止系统运行的服务如禁用Samba服务,则执行:sh-3.1# chkconfig smb off下次系统引导就不会启动Samba服务了。

  2、 更改系统缺省运行级如果X Window无法启动或者出现故障,可以编辑/etc/inittab文件,采用文本方式登录,更改initdefault引导级别为3:id:3:initdefault:

  案例二:硬盘扇区错乱

  在启动过程中最容易遇到的问题就是硬盘可能有坏道或扇区错乱(数据损坏)的情况,这种情况多由于异常断电、不正常关机导致。此种问题发生,在系统启动的时候,屏幕会显示:

  Press root password or ctrl+D:此时输入root密码系统自动进入单用户模式,输入“fsck -y /dev/hda6”(fsck为文件系统检测修复命令,“-y”设定检测到错误自动修复,/dev/hda6为发生错误的硬盘分区,请依据具体情况更改此参数),系统修复完成后,用命令“reboot”重新启动即可。

  案例三、GRUB选项设置错误

  “Error 15”显示系统无法找到grub.conf中指定的内核。 GRUB引导错误信息,我们观察发现因为打字错误,内核文件的“vmlinuz”打成了“vmlinux”,所以系统无法找到内核的可执行文件。我们可以按任意键回到GRUB编辑界面,修改此错误,回车保存后按“b”键即可正常引导,当然不要忘记进入系统后修改grub.conf文件中此处错误。这是很多初学Linux的用户在修改GRUB设置时很容易犯的错误,出现此黑屏提示时注意观察报错信息,即可针对性修复。

  (二)GRUB引导故障排除

  我发现有时Linux启动后会直接进入GRUB命令行界面(只有“grub>”提示符),此时很多用户就选择了重新安装GRUB甚至重新安装系统。其实一般而言此故障的原因最常见的有两个:一是GRUB配置文件中选项设置错误;二是GRUB配置文件丢失(还有少数原因,如内核文件或镜像文件损坏、丢失,/boot目录误删除等),如果是第一种情况,可以首先通过GRUB命令引导系统后修复;若是第二种情况,则要使用Linux救援模式修复了(本文后续有描述)。

  首先,我们需要了解GRUB启动系统的引导过程,grub.conf文件中主要的配置选项如下(注意,GRUB配置文件为/boot/grub/grub.conf, /etc/grub.conf只是此文件的软链接):

  title Fedora Core (2.6.18-1.2798.fc6)

  root (hd0,0)

  kernel /boot/vmlinuz-2.6.18-1.2798.fc6 ro root=LABEL=/ rhgb quiet initrd /boot/initrd-2.6.18-1.2798.fc6.img

  其中“title”段指定了GRUB引导的系统:“root”段指定了/boot分区所在的位置:“kernel”段指定了内核文件所在位置,内核加载时权限属性为只读(“ro”)以及指定根分区所在位置(root=LABEL=/);initrd指定了镜像文件所在位置。所以GRUB在引导时顺序为首先加载/boot分区,然后依次载入内核与镜像文件。

  案例:“title Fedora Core (2.6.18-1.2798.fc6)”段被误删除

  此时,系统启动后会自动进入“GRUB>”命令行,为排除故障我们可以依次做如下操作:

  1、查找/boot/grub/grub.conf文件所在分区GRUB> find /boot/grub/grub.conf(hd0,0)

  2、查看grub.conf文件错误GRUB>cat (hd0,0)/boot/grub/grub.conf建议系统安装设置好后,要将grub.conf文件备份,如果有备份文件如grub.conf.bak,则此时可以查看备份文件,与当前文件比较,发现错误:GRUB>cat (hd0,0)/boot/grub/grub.conf.bak

  3、确认错误后,先通过命令行方式完成GRUB引导,进入系统后再行修复grub.conf文件错误:1)指定/boot分区root (hd0,0)

  2)指定内核加载kernel /boot/vmlinuz-2.6.18-1.2798.fc6 ro root=LABEL=/ rhgb quiet 3)指定镜像文件所在位置initrd /boot/initrd-2.6.18-1.2798.fc6.img

  提示:GRUB支持tab键命令补全功能

  4、从/boot分区启动boot (hd0,0)

  命令行模式可以在GRUB菜单模式中通过按“c”键调用,也可以用于测试新编译的内核(设置kernel、initrd引导新内核及镜像文件)。增加对GRUB引导以及Linux系统引导知识的了解将对此类故障排除大有帮助。

  (三)Linux救援模式应用

  当系统连单用户模式都无法进入时或出现GRUB命令行也不能解决的引导问题,我们就需要使用Linux救援模式来进行故障排除了。步骤如下:

  1、将Linux安装光盘(如果使用CD光盘,则放入第一张引导光盘)放入光驱,设置固件CMOS/BIOS为光盘引导,当Linux安装画面出现后,在“boot:”提示符后输入“linux rescue”回车进入救援模式。(想了解救援模式详细信息,还可以按F5键查看)

  2、系统会检测硬件,引导光盘上的Linux环境,依次提示你选择救援模式下使用的语言(建议选择默认的英文即可,根据笔者测试,部分Linux系统选择中文会出现乱码);键盘设置用默认的“us”就好;网络设置可以根据需要,大部分故障修复不需要网络连接,可不进行此项设置,选择“No”。

  3、接下来系统将试图查找根分区,出现挂载提示,设置默认在救援模式,硬盘的根分区将挂载到光盘Linux环境的/mnt/sysimage目录下,默认选项“continue”表示挂载权限为读写:“Read-only”为只读,如果出现检测失败可以选择“skip”跳过。此处,因为要对系统进行修复,所以需要有读写权限,一般选择默认选项“continue”。

  进入下一步后,系统提示执行“chroot /mnt/sysimage”命令,可以将根目录挂载到我们硬盘系统的根目录中去。

  案例一:双系统启动修复

  当我们安装双系统环境,先安装Linux再安装Windows;或者已经安装好双系统环境的Windows损坏,在重新安装Windows后,保存 GRUB的MBR(Master Boot Record,主引导记录)会被Windows系统的自举程序NTLDR所覆盖,造成Linux系统无法引导。

  1、如果要恢复双系统引导,首先用上述方法进入救援模式,执行chroot命令如下:

  sh-3.1# chroot /mnt/sysimage

  2、将根目录切换到硬盘系统的根目录中,然后执行grub-install命令重新安装GRUB:

  sh-3.1# grub-install /dev/hda

  “/dev/hda”为硬盘名称,如使用SCSI硬盘或Linux安装在第二块IDE硬盘,此项设置要做相应调整。

  3、然后依次执行exit命令,退出chroot模式及救援模式(执行两次exit命令):

  sh-3.1# exit

  系统重启后,将恢复GRUB引导的双系统启动。

  案例二:系统配置文件丢失修复

  系统在引导期间,很重要的一个过程就是init进程读取其配置文件/etc/inittab,启动系统基本服务程序及默认运行级别的服务程序完成系统引导,如果/etc/inittab误删除或修改错误,Linux将无法正常启动,如图7所示。此时,只有通过救援模式才可以解决此类问题。

  /etc/inittab文件丢失引导错误示例

  1、有备份文件的恢复办法进入救援模式,执行chroot命令后,如果有此文件的备份(强烈建议系统中的重要数据目录,如/etc、/boot等要进行备份),直接将备份文件拷贝回去,退出重启即可。如果是配置文件修改错误,如比较典型的/boot/grub/grub.conf及/etc/passwd的文件修改错误,也可以直接修正恢复。假设有备份文件/etc/inittab.bak,则在救援模式下执行:

  sh-3.1# chroot /mnt/sysimage

  sh-3.1# cp /etc/inittab.bak /etc/inittab

  2、没有备份文件的恢复办法如果一些配置文件丢失或软件误删除,且无备份,可以通过重新安装软件包来恢复,首先查找到/etc/inittab属于哪一个RPM包(即便文件丢失,因为存在RPM数据库,一样可以查找到结果):sh-3.1# chroot /mnt/sysimage sh-3.1# rpm -qf /etc/inittab initscripts-8.45.3-1

  退出chroot模式:

  sh-3.1# exit

  挂载存放RPM包的安装光盘(在救援模式下,光盘通常挂载在/mnt/source目录下):

  sh-3.1# mount /dev/hdc /mnt/source

  Fedora系统的RPM包存放在光盘Fedora/RPMS目录下,其他Linux存放位置大同小异,我在这里不一一列举;另外,因为要修复的硬盘系统的根目录在/mnt/sysimage下,需要使用——root选项指定其位置。覆盖安装/etc/inittab文件所在的RPM包:

  sh-3.1# rpm -ivh ——replacepkgs ——root /mnt/sysimage /mnt/source/Fedora/RPMS/ initscripts-8.45.3-1.i386.rpm

  其中的rpm命令选项“——replacepkgs”表示覆盖安装,执行完成后,即已经恢复了此文件。

  如果想只提取RPM包中的/etc/inittab文件进行恢复,可以在进入救援模式后,执行命令:

  sh-3.1# rpm2cpio /mnt/source/Fedora/RPMS/initscripts-8.45.3-1.i386.rpm | cpio -idv ./etc/inittab

  sh-3.1# cp etc/inittab /mnt/sysimage/etc

  注意此命令执行时不能将文件直接恢复至/etc目录,只能提取到当前目录下,且恢复的文件名称所在路径要写完整的绝对路径。提取文件成功后,将其复制到根分区所在的/mnt/sysimage目录下相应位置即可。

  救援模式是维护Linux的有力武器,本文以上述两个例子讲解了它的应用方法,希望能够给读者一点启示。解决Linux系统启动的故障,必须充分理解Linux的引导过程,才能够对故障进行有效的判断和处理。

5
21
分享到:
评论

相关推荐

    LINUX应用开发技术详解

    本资源包“LINUX应用开发技术详解”显然包含了关于这个主题的完整源代码,这将帮助我们深入理解Linux环境下的编程实践。 首先,我们要了解Linux操作系统的基本架构和工作原理。Linux是一个开源的操作系统内核,它...

    ARM嵌入式Linux系统开发详解

    作者弓雷以其丰富的实践经验,为读者揭示了嵌入式Linux开发的各个环节,帮助读者掌握这一领域的核心技术和知识。 在嵌入式领域,ARM处理器因其低功耗、高性能的特点,广泛应用于各种设备,如智能手机、物联网设备、...

    Linux高级配置详解

    以下是对"Linux高级配置详解"这一主题的深入探讨: 1. **系统管理**: - **文件系统管理**:了解EXT2、EXT3、EXT4、XFS、Btrfs等文件系统的特性,并能进行挂载、卸载、检查和修复。 - **用户与组管理**:掌握`...

    oracle enterprise Linux故障排除

    ### Oracle Enterprise Linux故障排除知识点详解 #### 一、概述与文档要求 在处理Oracle Enterprise Linux系统中的问题时,首先需要确保拥有完整的部署文档,这包括但不限于Oracle数据库在Dell PowerEdge系统的...

    Linux_procfs详解

    ### Linux_procfs详解 #### 一、引言 在Linux操作系统中,有一个非常重要的伪文件系统,名为`procfs`。这个特殊的文件系统为用户提供了一种简单而直接的方式来访问正在运行的内核的状态以及进程信息。它允许用户...

    ARM嵌入式Linux系统开发详解(第2版)

    这部分会讲解如何优化Linux内核以满足实时性需求,以及如何通过电源管理技术降低功耗。 9. **应用程序开发**:除了系统层面的知识,也会介绍如何在ARM上的Linux环境中进行C/C++应用程序开发,以及Qt、GTK+等图形...

    linux网络命令详解.doc

    在Linux操作系统中,网络命令是进行网络管理、故障排查和信息查询不可或缺的工具。本篇主要介绍了几个常用的Linux网络命令,包括`ftp`、`telnet`、`r`、`netstat`、`nslookup`、`finger`、`ping`以及它们的具体用途...

    linux目录作用详解(超详细,树状排版)

    ### Linux目录作用详解 本文将基于提供的树状结构对Linux中的关键目录进行详细的解析与说明。这些目录在日常管理和维护Linux系统时具有重要的作用。理解它们的功能有助于更好地配置和使用Linux系统。 #### 根目录...

    linux MDIO详解.pdf

    "Linux MDIO详解" Linux MDIO是用于连接MAC和PHY的标准接口,MII是IEEE-802.3定义的以太网标准,MII接口可以同时控制多个PHY。MDIO是MII接口中的一部分,用于管理PHY的寄存器,MDIO原理是通过MAC从PHY读取相关管理...

    Linux_CAN编程详解_socketCAN_canbus_linux_linuxcan_

    它提供了类似TCP/IP的套接字API,使得开发者可以方便地使用标准的网络编程技术来处理CAN消息。socketCAN支持三种不同的套接字类型:RAW、BROADCAST_MANAGER(BM)和CAN_RAW。 二、CAN总线基础 1. 数据帧结构:CAN...

    Linux命令详解手册

    Linux命令详解手册是一本适合Linux新手和有一定基础的用户深入学习Linux命令的指南。它详细介绍了大量的Linux命令,涵盖了系统管理、系统设置、文档编辑以及压缩备份等多个方面的操作。掌握这些命令对于理解和使用...

    linux实用基本命令完整版详解

    ### Linux实用基本命令详解 Linux系统作为开源世界中的明珠,其强大的功能与灵活性深受开发者与系统管理员的喜爱。本文将深入解读一系列Linux基本命令,旨在帮助读者掌握这些命令,从而更高效地管理和操作Linux系统...

    Linux 故障恢复技巧

    ### Linux故障恢复技巧详解 #### 一、引言 在日常使用Linux系统的过程中,难免会遇到各种各样的问题,如系统崩溃、文件损坏等。掌握有效的Linux故障恢复技巧对于维护系统的稳定性和数据的安全性至关重要。本文将...

    Linux下FTP命令详解.pdf

    ### Linux下FTP命令详解 FTP(File Transfer Protocol)是一种用于在网络上进行文件传输的标准协议,而Linux作为一款广泛使用的操作系统,在其环境下熟练掌握FTP命令对于高效地管理文件和资源至关重要。以下是对...

    《ARM嵌入式Linux系统开发技术详解》资料

    《ARM嵌入式Linux系统开发技术详解》是一份专为初学者和有经验的开发者设计的资源,旨在帮助读者深入理解如何在基于ARM架构的硬件上构建和开发Linux嵌入式系统。这份资料涵盖了一系列关键知识点,对于想要在这个领域...

    linux目录详解 linux目录详解

    理解Linux目录结构不仅有助于日常管理和维护工作,还能提高故障排查效率。每个目录都有其特定的功能和用途,了解这些可以帮助用户更高效地使用Linux系统。希望本文能够帮助读者更好地掌握Linux的基础知识。

    嵌入式Linux系统开发技术详解—基于ARM

    《嵌入式Linux系统开发技术详解—基于ARM》是一本专为嵌入式开发者和爱好者设计的专业指南,它深入探讨了在ARM架构上构建和优化Linux系统的各个方面。这本书旨在帮助读者掌握嵌入式Linux开发的核心技能,从而在实际...

    Linux阵列 RAID详解

    ### Linux阵列 RAID详解 #### 一、RAID详解 **RAID**(Redundant Array of Independent Disks),即独立磁盘冗余阵列,是一种通过将多个物理磁盘组合成一个逻辑单元来提高存储性能和数据可靠性的技术。RAID技术通过...

    Linux系统救援详解+Usb系统+PXE

    Linux系统救援详解、USB系统和PXE网络启动是IT领域中重要的系统管理和维护技术,尤其在服务器运维和数据中心管理中不可或缺。以下是对这些主题的详细解释: **Linux系统救援** Linux系统救援通常指的是在系统出现...

Global site tag (gtag.js) - Google Analytics