`
Michaelmatrix
  • 浏览: 215278 次
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

Linux系统启动过程分析 -- by 王斌斌

 
阅读更多

Linux 系统启动过程分析
操作系统的启动过程,实际上是控制权移交 的过程。Linux 系统启动包含四个主要的阶段: BIOS initialization, boot loader, kernel initialization, and init startup .见下图:

阶段一、 BIOS initialization ,主要功能如下:

  1. Peripherals detected
  2. Boot device selected
  3. First sector of boot device read and executed

系统上电开机后,主板BIOS(Basic Input / Output System) 运行POST(Power on self test) 代码,检测系统外围关键设备(如:CPU 、内存、显卡、I/O 、键盘鼠标等)。硬件配置信息及一些用户配置参数存储在主板的CMOS ( Complementary Metal Oxide Semiconductor ) 上(一般64字节),实际上就是主板上一块可读写的RAM芯片,由主板上的电池供电,系统掉电后,信息不会丢失。
执行POST代码对系统外围关键设备检测通过后,系统启动自举程序,
根据我们在 BIOS 中设置的启动顺序搜索启动驱动器(比如的硬盘、光驱、网络服务器等)。选择合适的启动器,比如通常情况下的硬盘设备,BIOS会读取硬盘设备的第一个扇区(MBR ,512字节),并执行其中的代码。实际上这里BIOS并不关心启动设备第一个扇区中是什么内容,它只是负责读取该扇区内容、并执行,BIOS的任务就完成了。此后将系统启动的 控制权移交 MBR 部分的代码。
注:
在我们的现行系统中,大多关键设备都是连在主板上的。因此主板BIOS提供了一个操作系统(软件)和系统外围关键设备(硬件)最底级别的接口,在这个阶段,检测系统外围关键设备是否“准备好”,以供操作系统使用。

阶段二、
Boot Loader
关于 Boot Loader 简单的说就是启动操作系统的程序,如 grub,lilo ,也可以将 boot loader 本身看成一个小系统。
The BIOS invokes the boot loader in one of two ways:

  1. It pass control to an initial program loader (IPL ) installed within a driver's Master Boot Record (MBR )
  2. It passes control to another boot loader, which passes control to an IPL installed within a partition's boot sector.

In either case, the IPL must exist within a very small space, no larger than 446 bytes. Therefore, the IPL for GRUB is merely a first stage, whose sole task is to locate and load a second stage boot loader, which does most of the work to boot the system.

There are two possible ways to configure boot loaders:
Primary boot loader: Install the first stage of your Linux boot loader into the MBR . The boot loader must be configure to pass control to any other desired operating systems.
Secondary boot loader: Install the first stage of your Linux boot loader into the boot sector of some partition. Another boot loader must be installed into the MBR , and configured to pass control to your Linux boot loader.


假设 Boot Loader grub (grub-0.97) ,其引导系统的过程如下:
grub 分为 stage1 (stage1_5) stage2 两个阶段。stage1 可以看成是 initial program loaderI IPL ,而stage2 则实现了 grub 的主要功能,包括对特定文件系统的支持(如 ext2,ext3,reiserfs等),grub自己的 shell,以及内部程序(如: kernrlinitrd , root )等。
stage 1: MBR (512 字节,0头0道1扇区),前446字节 存放的是 stage1,后面存放硬盘分区表信息,BIOS 将 stag1载入内存中 0x7c00 处并跳转执行。 stage1(/stage1/stage.S)的任务非常但存,仅仅是将硬盘0头0道2扇区读入内存。0头0道2扇区内容是源代码中的 /stage2/start.S,编译后512字节,它是stage2或者stage1_5的入口。
注:此时stage1是没有能力识别文件系统的,其定位硬盘0头0道2扇区过程如下:
BIOS将stage1载入内存0x7c00处并执行,然后调用BIOS INIT 13 中断,将硬盘
0头0道2扇区内容载入内存0x7000处,然后调用copy_buffer将其转移到内存0x8000处。定位 0头0道2扇区有两种寻址方式:LBACHS ,代码如下:

// LBA: 调用BIOS INIT 13 中断0x42 号功能
/*
* BIOS call "INT 0x13 Function 0x42" to read sectors from disk into memory
* Call with %ah = 0x42
* %dl = drive number
* %ds : % si = segment: offset of disk address packet
* Return:
* %al = 0x0 on success; err code on failure
* /

movb $0x42, %ah
int $0x13

/* LBA read is not supported, so fallback to CHS. * /
jc chs_mode

movw $STAGE1_BUFFERSEG, %bx // STAGE1_BUFFERSEG在stag1. h中定义,为0x7000
jmp copy_buffer


//CHS:调用 BIOS INIT 13 中断 0x2 号功能
/*
* BIOS call "INT 0x13 Function 0x2" to read sectors from disk into memory
* Call with %ah = 0x2
* %al = number of sectors
* %ch = cylinder
* %cl = sector ( bits 6- 7 are high bits of "cylinder" )
* %dh = head
* %dl = drive ( 0x80 for hard disk, 0x0 for floppy disk)
* %es : % bx = segment: offset of buffer
* Return:
* %al = 0x0 on success; err code on failure
* /

movw $STAGE1_BUFFERSEG, %bx // STAGE1_BUFFERSEG在stag1. h中定义,为0x7000
movw %bx, %es /* load %es segment with disk buffer * /

xorw %bx, %bx /* %bx = 0, put it at 0 in the segment * /
movw $0x0201, %ax /* function 2 * /
int $0x13

jc read_error

movw %es , %bx

// COPY_BUFFER
copy_buffer:
movw ABS( stage2_segment) , %es

/*
* We need to save %cx and %si because the startup code in
* stage2 uses them without initializing them.
* /
pusha
pushw %ds

movw $0x100, %cx
movw %bx, %ds
xorw %si , %si
xorw %di , %di

cld

rep
movsw

popw %ds
popa

/* boot stage2 * /
jmp * ( stage2_address) //stage2_address 为0x8000


start.S : st art.S的主要功能是将 stage2 或 stage1_5 从硬盘载入内存,如果是 stage2,则载入 0x8200处;如果是 stage1_5,则载入 0x2200处。参见如下代码:

bootit:
/* print a newline * /
MSG( notification_done)
popw %dx /* this makes sure %dl is our "boot" drive * /
#ifdef STAGE1_5
ljmp $0, $0x2200 // 跳转到0x2200执行
#else /* ! STAGE1_5 * /
ljmp $0, $0x8200 // 跳转到0x8200处执行
#endif /* ! STAGE1_5 * /


注:这里的 stage2 或者 stage1_5 不是 /boot 分区 /boot/grub目录下的文件,这个时候 grub 还没有能力识别任何文件系统。分以下两种情况:
(1)假如 start.S 读取的是stage1_5,它存放在硬盘
0头0道3扇区向后的位置,stage1_5作为stage1和stage2中间的桥梁,stage1_5有识别文件系统的能力,此后,grub 才有能力去访问 /boot 分区 /boot/grub目录下的 stage2 文件,将stage2载入内存并执行。
(2)假如 start.S 读取的是 stage2,同样,这个 stage2 也不是
/boot 分区 /boot/grub 目录下的 stage2,这个时候start.S读取的是存放在 /boot 分区 Boot Sector的stage2。这种情况下就有一个限制:因为 start.S通过BIOS中断方式直接对硬盘寻址(而非通过访问具体的文件系统),其寻址范围有限,限制在8GB以内。 因此这种情况需要将 /boot 分区分在硬盘 8GB寻址空间之前。
如下图:



trouble shootting 很明显,假如是情形(2),我们将/boot/grub目录下的内容清空,依然能成功启动grub;假如是情形(1),将/boot/grub目录下stage2删除后,则系统启动过程中grub会启动失败。

stage2, 如 上所说,start.S作为stage2或者stage1_5的入口,最终都会把stage2载入内存并执行。stage2作为 grub 的主要功能实现,其存放于具体的文件系统下,如 /boot/grub/stage2,也可存放于/boot分区的 boot sector。下面分析stage2过程。
stage2的入口是 asm.S(/stage2/asm.S) ,asm.S文件对一些变量做初始化,如 config _file,参见如下代码:

VARIABLE( config_file)
#ifndef STAGE1_5
. string "/boot/grub/menu.lst"
#else /* STAGE1_5 * /
. long 0xffffffff
. string "/boot/grub/stage2"
#endif /* STAGE1_5 * /

假设定义了STAGE1_5 ,则 config _file 是 /boot/grub/stage2;如果定义的是stage2,则 config _file 是 /boot/grub/menu.lst
asm .S 之前都是汇编语言 ,这部分汇编代码很重要的工作是完成了C语言环境的初始还 ,从汇编进化到C。asm .S中会调用init _bios_info (void) ,这是整个C语言代码的入口,在/stage2/common.c中定义。
C语言运行环境初始化好后,转入 stage2.c 文件的 void cmain (void)函数。

/* This is the starting function in C. */
void
cmain ( void )
{
… …
}


之后调用grub_open()函数打开 config _file

is_opened = grub_open ( config_file) ;


不论是图形菜单选选择相应的启动项,还是在 grub> shell下执行相应的指令。

<!-- @page { size: 8.5in 11in; margin: 0.79in } P { margin-bottom: 0.08in } -->都由 find_command() 函数在 struct builtin *builtin _table[] 变量中找相应的指令 , <!-- @page { size: 8.5in 11in; margin: 0.79in } P { margin-bottom: 0.08in } -->然后执行对应指令的 XXX_func() 函数,都是static 类型的函数。其主要代码如下:

// stage2 . c
/* This is the starting function in C. */
void
cmain ( void )
{
. . . . . .
/* Get the pointer to the builtin structure. */
builtin = find_command ( cmdline) ;
. . . . . .
}

// builtins . c
/* Find the builtin whose command name is COMMAND and return the pointer. If not found, return 0. */
struct builtin *
find_command ( char * command)
{
struct builtin * * builtin;
. . . . . .
for ( builtin = builtin_table; * builtin ! = 0; builtin+ + )
{
. . . . . .
}
}
// builtins . c
/* The table of builtin commands. Sorted in dictionary order. */
struct builtin * builtin_table[ ] =
{
. . . . . .
}

static int
XXX_func( )
{
. . . . . .
}


关于 grub 常用的几个指令对应的函数:

grub>root (hd0,0)
grub>kernel /xen.gz-2.6.18-37.el5
grub>module /vmlinuz-2.6.18-37.el5xen ro root= / dev/sda2
grub>module /initrd-2.6.18-37.el5xen.img
grub>boot

如上显示,是RHLE 5系统启动grub用的几个指令:
(1) root 指令为grub指定了一个根分区,其对应的函数是:

static int
root_func ( char * arg , int flags)
{
return real_root_func ( arg , 1) ;
}

static int
real_root_func ( char * arg , int attempt_mount)
{
. . . . . .
}


(2) kernel 指令将操作系统内核载入内存,其对应的函数是:

/* kernel */
static int
kernel_func ( char * arg , int flags)
{
. . . . . .
}


(3) module 指令加载指定的模块,其对应的函数是:

/* module */
static int
module_func ( char * arg , int flags)
{
. . . . . .
}


(4) boot 指令调用相应的启动函数启动OS内核,其对应的函数是:

/* boot */
static int
boot_func ( char * arg , int flags)
{
. . . . . .
}


阶段三、 Kernel Initialization
如阶段2所述,grub>boot 指令后,系统启动的控制权移交 给 kernel。 <!-- @page { size: 8.5in 11in; margin: 0.79in } P { margin-bottom: 0.08in } -->Kernel会立即初始化系统中各设备并做相关配置工作,其中包括 CPU I/O 、存储设备等 <!-- @page { size: 8.5in 11in; margin: 0.79in } P { margin-bottom: 0.08in } (关于Kernel这部分工作,具体怎么处理不清楚)

关于设备驱动加载,有两部分:一部分设备驱动编入Linux Kernel 中,Kernel会调用这部分驱动初始化相关设备,同时将日志输出到kernel message buffer,系统启动后,dmesg可以查看到这部分输出信息。另外有一部分设备驱动并没有编入Kernel,而是作为模块形式放在 initrd ( ramdisk ) 中。下面详述一下 initrd。

<!-- @page { size: 8.5in 11in; margin: 0.79in } P { margin-bottom: 0.08in } --> 2.6 内核中,支持两种格式的 initrd ,一种是 2.4 内核的文件系统镜像 image-initrd ,一种是 cpio 格式。以 cpio 格式为例,内核判断 initrd cpio 的文件格式后,会将 initrd 中的内容释放到 rootfs 中。 initrd 一种基于内存的文件系统,启动过程中,系统在访问真正的根文件系统 / 时,会先访问 initrd 文件系统。将 initrd 中的内容打开来看,会发现有 bin devetc lib procsys sysroot init 等文件(包含目录)。其中包含了一些设备的驱模拟块,比如 scsi ata 等设备驱动模块,同时还有几个基本的可执行程序 insmod, modprobe, lvm nash 。主要目的是加载一些存储介质的驱动模块,如上面所说的 scsi ideusb 等设备驱动模块,初始化 LVM,把 / 根文件系统以只读方式挂载

initrd 中的内容释放到 rootfs 中后,Kernel会执行其中的 init 文件,这里的 init 是一个脚本,由 nash 解释器执行。 这个时候 内核的控制权移交 init 文件处理,我们查看 init 文件的内容,主要也是加载各种存储介质相关的设备驱动。

驱动加载后,会创建一个根设备,然后将根文件系统 / 以只读的方式挂载。这步结束后,执行 switchroot ,转换到真正的根 / 上面去,同时运行 /sbin/init 程序,开启系统的 1 号进程,此后,系统启动的控制权移交 给 init 进程。关于 switchroot ,这是在 nash 中定义的程序。

initrd处理流程图

思考: 为什么会存在一个 initrd 文件系统?Linux Kernel需要适应多种不同的硬件架构,但是将所有的硬件驱动编入Kernel又是不实际的,而且Kernel也不可能每新出一种硬件结构,就将该硬件 的设备驱动写入内核。实际上Linux Kernel仅是包含了基本的硬件驱动,在系统安装过程中会检测系统硬件信息,根据安装信息和系统硬件信息将一部分设备驱动写入 initrd 。这样在以后启动系统时,一部分设备驱动就放在 initrd 中来加载。

阶段四、
init Initialization
init进程起来后,系统启动的控制权移交 给 init 进程。参考曲芸芸关于“ init的初始化过程 ”,摘抄如下:
/sbin/init进程是所有进程的父进程,当init起来之后,它首先会读取配置文件/etc/inittab,进行以下工作:
1)执行系统初始化脚本(/etc/rc.d/rc.sysinit),对系统进行基本的配置,以读写方式挂载根文件系统及其它文件系统,具体作用见后面说明。到这一步系统基本算运行起来了,后面需要进行运行级别的确定及相应服务的启动。
2)确定启动后进入的运行级别
3) 执行/etc/rc.d/rc, 该文件定义了服务启动的顺序是先K后S,而具体的每个运行级别的服务状态是放在/etc/rc.d/rcn.d(n=0~6)目录下,所有的文件均链接至/etc/init.d下的相应文件。
4)有关key sequence的设置
5) 有关UPS的脚本定义
6)启动虚拟终端/sbin/mingetty
7)在运行级别5上运行X
这时呈现给用户的就是最终的登录界面。
至此,系统启动过程完毕:)

说明:
1)
/etc/rc.d/rc.sysint -- System Initialization Tasks
它的主要工作有:
配置selinux,
系统时钟,
内核参数(/etc/sysctl.conf),
hostname,
使能swap分区,
根文件系统的检查和二次挂载(读写),
激活RAID和LVM设备
使能磁盘quota
检查并挂载其它文件系统
等等。
分享到:
评论

相关推荐

    JAVA图书管理系统.rar

    《15436234王斌斌图书管理系统.zip》这个文件很可能是该系统的一个版本或者开发者的个人项目,包含了源代码、配置文件和其他相关资源。解压后,开发者可以研究代码结构,学习如何用Java实现图书管理系统的具体功能,...

    web技术和开发课程设计汇本论文.doc

    需求分析是项目启动的第一步,它涉及到对系统功能、性能、用户界面以及系统限制等方面的明确。对于考勤管理系统,主要需求可能包括:记录每个人的出勤记录、自动计算迟到早退次数、支持请假申请及审批、生成考勤报告...

    基于几何特征与深度数据的三维人脸识别.pdf

    本文由厦门大学计算机科学系的陈立生和王斌斌共同撰写,探讨了一种基于三维点云数据的多特征融合人脸识别方法。 在摘要部分,作者提出了一种创新的方法,利用深度信息来提取人脸的轮廓特征,包括中央垂直轮廓线和...

    1300张图片训练效果

    1300张图片训练效果

    springboot116基于java的教学辅助平台.zip

    教学辅助平台的出现,是为了更好地服务于教育工作者和学生,提高教学效果和学习效率。该平台集成了多个功能模块,旨在为用户提供全面、便捷的教学辅助服务。 平台首页作为导航入口,提供了清晰的界面布局和便捷的导航功能,方便用户快速找到所需功能。需要注意的是,“首页”这一选项在导航菜单中出现了多次,可能是设计上的冗余,需要进一步优化。 “个人中心”模块允许用户查看和管理自己的个人信息,包括修改密码等账户安全设置,确保用户信息的准确性和安全性。 在教育教学方面,“学生管理”和“教师管理”模块分别用于管理学生和教师的信息,包括学生档案、教师资料等,方便教育工作者进行学生管理和教学安排。同时,“课程信息管理”、“科目分类管理”和“班级分类管理”模块提供了课程信息的发布、科目和班级的分类管理等功能,有助于教育工作者更好地组织和管理教学内容。 此外,“课程作业管理”模块支持教师布置和批改作业,学生可以查看和提交作业,实现了作业管理的线上化,提高了教学效率。而“交流论坛”模块则为学生和教师提供了一个交流和讨论的平台,有助于促进师生互动和学术交流。 最后,“系统管理”模块为平台管理员提供了系统配置.

    yolo算法-火灾探测数据集-3466张图像带标签-火灾fire_detect-oqlpv.zip

    yolo系列算法目标检测数据集,包含标签,可以直接训练模型和验证测试,数据集已经划分好,适用yolov5,yolov8,yolov9,yolov7,yolov10,yolo11算法; 包含两种标签格:yolo格式(txt文件)和voc格式(xml文件),分别保存在两个文件夹中; yolo格式:<class> <x_center> <y_center> <width> <height>, 其中: <class> 是目标的类别索引(从0开始)。 <x_center> 和 <y_center> 是目标框中心点的x和y坐标,这些坐标是相对于图像宽度和高度的比例值,范围在0到1之间。 <width> 和 <height> 是目标框的宽度和高度,也是相对于图像宽度和高度的比例值

    基于go语言的参数解析校验器项目资源.zip

    基于go语言的参数解析校验器项目资源

    matlab主成分分析代码

    matlab主成分分析代码

    华南农业大学在四川2020-2024各专业最低录取分数及位次表.pdf

    那些年,与你同分同位次的同学都去了哪里?全国各大学在四川2020-2024年各专业最低录取分数及录取位次数据,高考志愿必备参考数据

    Spire.XLS是一个基于.NET的组件

    Spire.XLS是一个基于.NET的组件,使用它我们可以创建Excel文件,编辑已有的Excel并且可以转换Excel文件.dll

    基于爬虫技术的股票分析系统.doc

    现如今,随着互联网的发展,人们获取信息的方式也各有不同。以前的传统方式的信息流与电视,报纸,书籍,信件,等等,因为互联网的使用,现在的互联网媒体已经成为人们获取信息的最重要来源。更新互联网,让人们得到最新、最完整的信息变得越来越容易。 现在企业已经越来越重视互联网所能带来的利益,借助互联网来对自己的企业进行营销推广已经获得绝大部分企业的认可。本文我们主要进行的是股票分析系统网站的设计。何为股票分析,就是指股票投资人之间的根据市场价格对已发行上市的股票进行的买卖。而国内股票市场的迅速发展让这次开发设计显得十分必要。通过该股票分析系统网站,我们可以随时随地通过该股票分析网站,了解股票行业最新信息;根据股票行业分析来进行相关交易。本网站采用的是Springboot技术和mongodb数据库,运用 stock、 vue2、echarts、bootstrap等技术,使用eclipse开发工具完成股票数据的爬取分析。

    厨房食品佐料检测数据集VOC+YOLO格式602张18类别.zip

    文件太大放服务器了,请先到资源详情查看然后下载 样本图参考:blog.csdn.net/2403_88102872/article/details/143395913 数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):602 标注数量(xml文件个数):602 标注数量(txt文件个数):602 标注类别数:18 标注类别名称:["apple","chocolate","cloth","cononut_water","detergent","fanta","gelatin","kuat","mustard","nescau","peanut","pear","sauce","shoyo","sponge","tangerine","tea","treloso"] 18种常见的厨房食品和佐料,包括苹果、巧克力、椰子水、洗涤剂、饮料、明胶、芥末、花生、酱油等

    基于卷积神经网络参数优化的情感分析论文code_cnn-text-classification.zip

    基于卷积神经网络参数优化的情感分析论文code_cnn-text-classification

    河北传媒学院在四川2020-2024各专业最低录取分数及位次表.pdf

    那些年,与你同分同位次的同学都去了哪里?全国各大学在四川2020-2024年各专业最低录取分数及录取位次数据,高考志愿必备参考数据

    Python实现的人脸识别系统及其应用

    内容概要:本文档详细描述了一个基于 Python 的人脸识别系统的构建过程,涵盖了从系统设计理念到具体功能实现的各个方面。首先介绍了系统总体设计流程,包括摄像头图像捕获、人脸检测、特征值计算、特征均值处理以及分类识别。接着深入探讨了 Dlib、NumPy、OpenCV 等关键技术库的应用,特别是 Dlib 人脸检测器接口、人脸预测器接口和人脸识别模型的具体使用方法。最后,本文档介绍了如何通过 Euclidean 距离进行人脸特征比对,实现人脸的成功识别与身份确认。此外,还讨论了人脸识别在实际生活中的多种应用场景和重要意义。 适用人群:具有一定编程基础的软件开发者和技术爱好者,尤其是从事机器学习、图像处理和计算机视觉领域的专业技术人员。 使用场景及目标:①开发人脸识别系统,实现实时图像处理和人脸特征提取;②掌握 Dlib、NumPy、OpenCV 等技术库的实际应用技巧;③深入了解人脸识别技术在安全监控、身份认证、智慧社区等领域的应用。 其他说明:本文档提供了丰富的理论背景和技术实现细节,帮助读者更好地理解和应用人脸识别技术。此外,还包括了一些实用的编码技巧和最佳实践,有助于提高开发效率和代码质量。

    轻量级高性能GO语言开发框架。支持MVC、依赖注入、动态返回.zip

    轻量级高性能GO语言开发框架。支持MVC、依赖注入、动态返回

    stm32的串口hex文件发送与文本文件发送

    stm32的串口hex文件发送与文本文件发送

    广西医科大学在四川2020-2024各专业最低录取分数及位次表.pdf

    那些年,与你同分同位次的同学都去了哪里?全国各大学在四川2020-2024年各专业最低录取分数及录取位次数据,高考志愿必备参考数据

    macOS_Sonoma_14.1.1.rdr.split.003

    macOS_Sonoma_14.1.1.rdr.split.003

Global site tag (gtag.js) - Google Analytics