我们对每个c或者汇编文件进行单独编译,但是不去连接,生成很多.o
的文件,这些.o文件首先是分散的,我们首先要考虑的如何组合起来;其次,这些.o文件存在相互调用的关系;再者,我们最后生成的bin文件是要在硬件中
运行的,每一部分放在什么地址都要有仔细的说明。我觉得在写makefile的时候,最为重要的就是ld的理解,下面说说我的经验:
首先,要确定我们的程序用没有用到标准的c库,或者一些系统的库文件,这些一般是在操作系统之上开发要注意的问题,这里并不多说,熟悉在Linux编程的人,基本上都会用ld命令;这里,我们从头开始,直接进行汇编语言的连接。
我们写一个汇编程序,控制GPIO,从而控制外接的LED,代码如下;
.text
.global _start
_start:
LDR R0,=0x56000010 @GPBCON寄存器
MOV R1,# 0x00000400
str R1,[R0]
LDR R0,=0x56000014
MOV R1,#0x00000000
STR R1,[R0]
MAIN_LOOP:
B MAIN_LOOP
代码很简单,就是一个对io口进行设置然后写数据。我们看它是如何编译的,注意我们这里使用的不是arm-linux-gcc而是arm-elf-
gcc,二者之间没有什么比较大的区别,arm-linux-gcc可能包含更多的库文件,在命令行的编译上面是没有区别。我们来看是如何编译的:
arm-elf-gcc -g -c -o led_On.o led_On.s 首先纯编译不连接
arm-elf-ld -Ttext 0x00000000 -g led_On.o -o led_on_elf
用Ttext指明我们程序存储的地方,这里生成的是elf文件,还不是我们真正的bin,但是可以借助一些工具可以进行调试。然后:
arm-elf-objcopy -O binary -S led_on_elf led_on.bin
生成bin文件。
-T选项是ld命令中比较重要的一个选项,可以用它直接指明代码的代码段、数据段、博士生、
段,对于复杂的连接,可以专门写一个脚本来告诉编译器如何连接。
-Ttext addr
-Tdata addr
-Tbss addr
arm-elf-ld -Ttext 0x00000000 -g led_On.o -o led_on_elf
,运行地址为0x00000000,由于没有指明数据段和bss,他们会默认的依次放在后面。相同的代码
不同的Ttext,你可以对比一下他们之间会变的差异,ld会自动调整跳转的地址。
第二个概念:section,section可以理解成一块,例如像c里面的一个子函数,就是一个section,链接器ld把object文件中
的每个section都作为一个整体,为其分配运行的地址(memory
layout),这个过程就是重定位(relocation);最后把所有目标文件合并为一个目标文件。
链接通过一个linker script来控制,这个脚本描述了输入文件的sections到输出文件的映射,以及输出文件的memory layout。
因此,linker总会使用一个linker script,如果不特别指定,则使用默认的script;可以使用‘-T’命令行选项来指定一个linker script。
*映像文件的输入段与输出段
linker把多个输入文件合并为一个输出文件。输出文件和输入文件都是目标文件(object file),输出文件通常被称为可执行文件(executable)。
每个目标文件都有一系列section,输入文件的section称为input section,输出文件的section则称为output section。
一
个section可以是loadable的,即输出文件运行时需要将这样的section加载到memory(类似于RO&RW段);也可以是
allocatable的,这样的section没有任何内容,某些时候用0对相应的memory区域进行初始化(类似于ZI段);如果一个
section既非loadable也非allocatable,则它通常包含的是调试信息。
每个loadable或
allocatable的output section都有两个地址,一是VMA(virtual memory
address),是该section的运行时域地址;二是LMA(load memory address),是该section的加载时域地址。
可以通过objdump工具附加'-h'选项来查看目标文件中的sections。
*简单的Linker script
(1) SECTIONS命令:
The SECTIONS command
tells the linker how to map input sections into output sections, and
how to place the output sections in memory.
命令格式如下:
SECTIONS
{
sections-command
sections-command
......
}
其中sections-command可以是ENTRY命令,符号赋值,输出段描述,也可以是overlay描述。
(2) 地址计数器‘.’(location counter):
该符号只能用于SECTIONS命令内部,初始值为‘0’,可以对该符号进行赋值,也可以使用该符号进行计算或赋值给其他符号。它会自动根据SECTIONS命令内部所描述的输出段的大小来计算当前的地址。
(3) 输出段描述(output section description):
前面提到在SECTIONS命令中可以作输出段描述,描述的格式如下:
section [address] [(type)] : [AT(lma)]
{
output-section-command
output-section-command
...
} [>region] [AT>lma_region] [:phdr :phdr ...] [=fillexp]
很多附加选项是用不到的。其中的output-section-command又可以是符号赋值,输入段描述,要直接包含的数据值,或者某一特定的输出段关键字。
*linker script 实例
==============================
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS {
. = 0xa3f00000;
__boot_start = .;
.start ALIGN(4) : {
*(.text.start)
}
.setup ALIGN(4) : {
setup_block = .;
*(.setup)
setup_block_end = .;
}
.text ALIGN(4) : {
*(.text)
}
.rodata ALIGN(4) : {
*(.rodata)
}
.data ALIGN(4) : {
*(.data)
}
.got ALIGN(4) : {
*(.got)
}
__boot_end = .;
.bss ALIGN(16) : {
bss_start = .;
*(.bss)
*(COMMON)
bss_end = .;
}
.comment ALIGN(16) : {
*(.comment)
}
stack_point = __boot_start + 0x00100000;
loader_size = __boot_end - __boot_start;
setup_size = setup_block_end - setup_block;
}
=============================
在SECTIONS命令中的类似于下面的描述结构就是输出段描述:
.start ALIGN(4) : {
*(.text.start)
}
.start
为output section name,ALIGN(4)返回一个基于location
counter(.)的4字节对齐的地址值。*(.text.start)是输入段描述,*为通配符,意思是把所有被链接的object文件中
的.text.start段都链接进这个名为.start的输出段。
源文件中所标识的section及其属性实际上就是对输入段的描述,例如.text.start输入段在源文件start.S中的代码如下:
.section .text.start
.global _start
_start :
b start
arm-elf-ld -Ttimer.lds -o timer_elf header .o
这里就必须存在一个timer.lds的文件。
对于
.lds
文件,它定义了整个程序编译之后的连接过程,决定了一个可执行程序的各个段的存储位置。虽然现在我还没怎么用它,但感觉还是挺重要的,有必要了解一下。
先看一下
GNU
官方网站上对
.lds
文件形式的完整描述:
SECTIONS {
...
secname
start
BLOCK(
align
) (NOLOAD) : AT (
ldadr
)
{
contents
} >
region
:
phdr
=
fill
...
}
secname
和contents
是必须的,其他的都是可选的。下面挑几个常用的看看:
1
、
secname
:段名
2
、
contents
:决定哪些内容放在本段,可以是整个目标文件,也可以是目标文件中的某段(代码段、数据段等)
3
、
start
:本段连接(运行)的地址,如果没有使用
AT
(
ldadr
),本段存储的地址也是
start
。
GNU
网站上说
start
可以用任意一种描述地址的符号来描述。
4
、
AT
(
ldadr
):定义本段存储(加载)的地址。
/* nand.lds */
SECTIONS {
firtst 0x00000000 : { head.o init.o }
second 0x30000000 : AT(4096) { main.o }
}
以上,
head.o
放在
0x00000000
地址开始处,
init.o
放在
head.o
后面,他们的运行地址也是
0x00000000
,即连接和存储地址相同(没有
AT
指定);
main.o
放在
4096
(
0x1000
,是
AT
指定的,存储地址)开始处,但是它的运行地址在
0x30000000
,运行之前需要从
0x1000
(加载处)复制到
0x30000000
(运行处),此过程也就用到了读取
Nand flash
。
这就是存储地址和连接(运行)地址的不同,称为加载时域和运行时域,可以在
.lds
连接脚本文件中分别指定。
编写好的
.lds
文件,在用
arm-linux-ld
连接命令时带
-Tfilename
来调用执行,如
arm-linux-ld –Tnand.lds x.o y.o –o xy.o
。也用
-Ttext
参数直接指定连接地址,如
arm-linux-ld –Ttext 0x30000000 x.o y.o –o xy.o
。
既然程序有了两种地址,就涉及到一些跳转指令的区别,这里正好写下来,以后万一忘记了也可查看,以前不少东西没记下来现在忘得差不多了。
ARM
汇编中,常有两种跳转方法:
b
跳转指令、
ldr
指令向
PC
赋值。
我自己经过归纳如下:
b step1
:
b
跳转指令是相对跳转,依赖当前
PC
的值,偏移量是通过该指令本身的
bit[23:0]
算出来的,这使得使用
b
指令的程序不依赖于要跳到的代码的位置,只看指令本身。
ldr pc, =step1
:该指令是从内存中的某个位置(
step1
)读出数据并赋给
PC
,同样依赖当前
PC
的值,但是偏移量是那个位置(
step1
)的连接地址(运行时的地址),所以可以用它实现从
Flash
到
RAM
的程序跳转。
此外,有必要回味一下
adr
伪指令,
U-boot
中那段
relocate
代码就是通过
adr
实现当前程序是在
RAM
中还是
flash
中。仍然用我当时的注释
adr r0, _start /* r0
是代码的当前位置
*/
/* adr
伪指令,汇编器自动通过当前
PC
的值算出
如果执行到
_start
时
PC
的值,放到
r0
中:
当此段在
flash
中执行时
r0 = _start = 0
;当此段在
RAM
中执行时
_start = _TEXT_BASE(
在
board/smdk2410/config.mk
中指定的值为
0x33F80000
,即
u-boot
在把代码拷贝到
RAM
中去执行的代码段的开始
) */
ldr r1, _TEXT_BASE /*
测试判断是从
Flash
启动,还是
RAM */
/*
此句执行的结果
r1
始终是
0x33FF80000
,因为此值是又编译器指定的
(ads
中设置,或
-D
设置编译器参数
) */
cmp r0, r1 /*
比较
r0
和
r1
,调试的时候不要执行重定位
*/
下面,结合
u-boot.lds
看看一个正式的连接脚本文件。这个文件的基本功能还能看明白,虽然上面分析了好多,但其中那些
GNU
风格的符号还是着实让我感到迷惑。
OUTPUT_FORMAT("elf32­littlearm", "elf32­littlearm", "elf32­littlearm")
;
指定输出可执行文件是
elf
格式
,32
位
ARM
指令
,
小端
OUTPUT_ARCH(arm)
;
指定输出可执行文件的平台为
ARM
ENTRY(_start)
;
指定输出可执行文件的起始代码段为
_start.
SECTIONS
{
. = 0x00000000 ;
从
0x0
位置开始
. = ALIGN(4) ;
代码以
4
字节对齐
.text : ;
指定代码段
{
cpu/arm920t/start.o (.text) ;
代码的第一个代码部分
*(.text) ;
其它代码部分
}
. = ALIGN(4)
.rodata : { *(.rodata) } ;
指定只读数据段
. = ALIGN(4);
.data : { *(.data) } ;
指定读
/
写数据段
. = ALIGN(4);
.got : { *(.got) } ;
指定
got
段
, got
段式是
uboot
自定义的一个段
,
非标准段
__u_boot_cmd_start = . ;
把
__u_boot_cmd_start
赋值为当前位置
,
即起始位置
.u_boot_cmd : { *(.u_boot_cmd) } ;
指定
u_boot_cmd
段
, uboot
把所有的
uboot
命令放在该段
.
__u_boot_cmd_end = .;
把
__u_boot_cmd_end
赋值为当前位置
,
即结束位置
. = ALIGN(4);
__bss_start = .;
把
__bss_start
赋值为当前位置
,
即
bss
段的开始位置
.bss : { *(.bss) };
指定
bss
段
_end = .;
把
_end
赋值为当前位置
,
即
bss
段的结束位置
分享到:
相关推荐
《ARM-Linux-ld指令详解》 在嵌入式Linux系统开发中,连接器`ld`扮演着至关重要的角色。`ld`负责将编译器生成的`.o`目标文件整合成可执行文件或库,处理各个文件间的依赖关系,并为程序的各个部分分配内存空间。...
**ARM-Linux-ld指令详解** 在嵌入式系统开发中,`arm-linux-ld`是一个关键的链接器,用于将编译后的`.o`对象文件整合成可执行的二进制文件。`arm-linux-ld`是GNU Binutils的一部分,专为ARM架构的Linux系统设计,...
使用这套工具链,开发者可以在Linux x86机器上为Android ARM设备编写和编译代码,特别适合于处理浮点运算,因为ARM处理器的某些版本可能不支持硬件浮点运算,而交叉编译工具链可以生成适当的指令集来实现浮点运算。...
ARM(Advanced RISC Machines)是一种精简指令集计算(RISC)架构,广泛应用于移动设备、嵌入式系统以及服务器等。由于其低功耗、高性能的特点,ARM处理器在各种硬件平台上都有广泛应用。 **3. 交叉编译原理** 在非...
ARM(Advanced RISC Machines)是一种广泛应用于嵌入式系统、移动设备、服务器等领域的精简指令集计算机(RISC)架构。由于其低功耗、高性能的特点,ARM处理器在全球范围内被广泛应用。`arm-linux-gcc-3.4.5`便是...
《ARM-2009Q3交叉编译工具链详解》 在嵌入式系统开发领域,ARM架构因其低功耗、高性能的特点被广泛应用。在为ARM处理器编写软件时,由于开发环境通常运行在非ARM架构(如x86)的主机上,因此需要借助一种特殊的工具...
**ARM Linux GCC 知识点详解** ARM Linux GCC 是一个专为 ARM 架构的 Linux 系统设计的交叉编译工具链。它允许开发者在非 ARM 平台(如 x86 或者 x86_64)上构建适用于 ARM 设备的应用程序和系统软件。GCC(GNU ...
### Arm+Linux系统移植知识点详解 #### 一、前言 **Arm+Linux系统移植**是将Linux操作系统适配到基于ARM架构的目标硬件平台上的一项技术工作。这项工作不仅包括了软件层面的操作系统移植,还涉及到了硬件环境的...
- **集成环境**:DS-5 Eclipse是一款集成开发环境(IDE),它集成了ARM的编译和调试工具,支持ARMLinux GNU工具链的开发。 - **关键特性**: - **项目管理**:支持项目文件和依赖项的增删操作,以及项目的导入、...
本篇将围绕“ARM嵌入式Linux系统开发详解源代码”这一主题,深入探讨相关知识点。 1. **ARM架构与指令集** - ARM架构:ARM(Advanced RISC Machines)是一种精简指令集计算机(RISC)架构,以其高效能、低功耗的...
### ARM嵌入式Linux系统开发知识点详解 #### 一、ARM架构简介 - **发展历史与特点**:ARM(Advanced RISC Machines)是一种基于精简指令集计算机(RISC)技术的处理器架构。ARM架构因其低功耗、高性能等特点,在...
综上所述,《嵌入式Linux系统开发技术详解--基于ARM(完整版)》这本书全面覆盖了嵌入式Linux系统开发所需的知识点,从基础知识到具体实践均有详细介绍,对于从事嵌入式领域的工程师和技术人员来说是一本非常实用的...
### 黑色经典之嵌入式Linux系统开发技术详解—基于ARM #### 一、概述 **嵌入式系统**是指用于控制、监视或者辅助操作机器和设备的专用计算机系统。这类系统通常具有高可靠性和实时性,广泛应用于工业自动化、消费...
### Linux下ARM汇编语法详解 #### 一、引言 在嵌入式系统和低级别编程领域,ARM架构因其高效能和低功耗特性而备受青睐。在Linux环境下使用ARM汇编语言进行编程,虽然不如高级语言如C或C++那样方便,但对于系统的...
《LINUX系统开发技术详解-基于ARM》这本书深入探讨了在ARM架构下进行Linux系统开发的各个方面,旨在为读者提供一套完整的知识体系和技术实践指导。以下是对各章节内容的详细阐述: **第一章 LINUX介绍** 本章主要...
- `arm-linux-ld`:链接目标文件和库,生成可执行文件。 - `arm-linux-objcopy`:在不同格式之间转换目标文件。 - `arm-linux-objdump`:显示目标文件信息,常用于调试和分析。 通过理解和掌握这些知识点,...
**交叉编译器详解** 在Linux环境中,"aarch64-linux"交叉编译器是一个专为64位AArch64架构(也称为ARMv8-A)设计的工具链,用于在非AArch64架构的主机系统上构建运行在AArch64设备上的软件。这种编译器允许开发者在...
1. **简化编译过程**:无需手动输入复杂的编译参数,如arm-elf-gcc和arm-elf-ld参数,uClinux-dist自动处理这些细节。 2. **自动文本和节区处理**:自动进行Linux内核的.text/.section节区处理,以及ELF格式转换为...
编写好的.lds 文件,在用 arm-linux-ld 连接命令时带-Tfilename 来调用执行,如arm-linux-ld –Tnand.lds x.o y.o –o xy.o。也用-Ttext 参数直接指定连接地址,如arm-linux-ld –Ttext 0x30000000 x.o y.o –o xy.o...