嵌入式系统 Boot Loader 技术内幕


blob 的方法,也即:以 memory page 为被测试单位,测试每个 memory page 开始的两个字是否是可读写的。为了后面叙述的方便,我们记这个检测算法为:test_mempage,其具体步骤如下:

1. 先保存 memory page 一开始两个字的内容。

2. 向这两个字中写入任意的数字。比如:向第一个字写入 0x55,第 2 个字写入 0xaa。

3. 然后,立即将这两个字的内容读回。显然,我们读到的内容应该分别是 0x55 和 0xaa。如果不是,则说明这个 memory page 所占据的地址范围不是一段有效的 ram 空间。

4. 再向这两个字中写入任意的数字。比如:向第一个字写入 0xaa,第 2 个字中写入 0x55。

5. 然后,立即将这两个字的内容立即读回。显然,我们读到的内容应该分别是 0xaa 和 0x55。如果不是,则说明这个 memory page 所占据的地址范围不是一段有效的 ram 空间。

6. 恢复这两个字的原始内容。测试完毕。

为了得到一段干净的 ram 空间范围,我们也可以将所安排的 ram 空间范围进行清零操作。

3.1.3 拷贝 stage2 到 ram 中

拷贝时要确定两点:(1) stage2 的可执行映象在固态存储设备的存放起始地址和终止地址;(2) ram 空间的起始地址。

3.1.4 设置堆栈指针 sp

堆栈指针的设置是为了执行 c 语言代码作好准备。通常我们可以把 sp 的值设置为(stage2_end-4),也即在 3.1.2 节所安排的那个 1mb 的 ram 空间的最顶端(堆栈向下生长)。

此外,在设置堆栈指针 sp 之前,也可以关闭 led 灯,以提示用户我们准备跳转到 stage2。

经过上述这些执行步骤后,系统的物理内存布局应该如下图2所示。

3.1.5 跳转到 stage2 的 c 入口点

在上述一切都就绪后,就可以跳转到 boot loader 的 stage2 去执行了。比如,在 arm 系统中,这可以通过修改 pc 寄存器为合适的地址来实现。


图2 bootloader 的 stage2 可执行映象刚被拷贝到 ram 空间时的系统内存布局
嵌入式系统 Boot Loader 技术内幕

3.2 boot loader 的 stage2

正如前面所说,stage2 的代码通常用 c 语言来实现,以便于实现更复杂的功能和取得更好的代码可读性和可移植性。但是与普通 c 语言应用程序不同的是,在编译和链接 boot loader 这样的程序时,我们不能使用 glibc 库中的任何支持函数。其原因是显而易见的。这就给我们带来一个问题,那就是从那里跳转进 main() 函数呢?直接把 main() 函数的起始地址作为整个 stage2 执行映像的入口点或许是最直接的想法。但是这样做有两个缺点:1)无法通过main() 函数传递函数参数;2)无法处理 main() 函数返回的情况。一种更为巧妙的方法是利用 trampoline(弹簧床)的概念。也即,用汇编语言写一段trampoline 小程序,并将这段 trampoline 小程序来作为 stage2 可执行映象的执行入口点。然后我们可以在 trampoline 汇编小程序中用 cpu 跳转指令跳入 main() 函数中去执行;而当 main() 函数返回时,cpu 执行路径显然再次回到我们的 trampoline 程序。简而言之,这种方法的思想就是:用这段 trampoline 小程序来作为 main() 函数的外部包裹(external wrapper)。

下面给出一个简单的 trampoline 程序示例(来自blob):

.text.globl _trampoline_trampoline:blmain/* if main ever returns we just call it again */b_trampoline

可以看出,当 main() 函数返回后,我们又用一条跳转指令重新执行 trampoline 程序――当然也就重新执行 main() 函数,这也就是 trampoline(弹簧床)一词的意思所在。

3.2.1初始化本阶段要使用到的硬件设备

这通常包括:(1)初始化至少一个串口,以便和终端用户进行 i/o 输出信息;(2)初始化计时器等。

在初始化这些设备之前,也可以重新把 led 灯点亮,以表明我们已经进入 main() 函数执行。

设备初始化完成后,可以输出一些打印信息,程序名字字符串、版本号等。

3.2.2 检测系统的内存映射(memory map)

所谓内存映射就是指在整个 4gb 物理地址空间中有哪些地址范围被分配用来寻址系统的 ram 单元。比如,在 sa-1100 cpu 中,从 0xc000,0000 开始的 512m 地址空间被用作系统的 ram 地址空间,而在 samsung s3c44b0x cpu 中,从 0x0c00,0000 到 0x1000,0000 之间的 64m 地址空间被用作系统的 ram 地址空间。虽然 cpu 通常预留出一大段足够的地址空间给系统 ram,但是在搭建具体的嵌入式系统时却不一定会实现 cpu 预留的全部 ram 地址空间。也就是说,具体的嵌入式系统往往只把 cpu 预留的全部 ram 地址空间中的一部分映射到 ram 单元上,而让剩下的那部分预留 ram 地址空间处于未使用状态。 由于上述这个事实,因此 boot loader 的 stage2 必须在它想干点什么 (比如,将存储在 flash 上的内核映像读到 ram 空间中) 之前检测整个系统的内存映射情况,也即它必须知道 cpu 预留的全部 ram 地址空间中的哪些被真正映射到 ram 地址单元,哪些是处于 "unused" 状态的。

(1) 内存映射的描述

可以用如下数据结构来描述 ram 地址空间中的一段连续(continuous)的地址范围:

typedef struct memory_area_struct {u32 start; /* the base address of the memory region */u32 size; /* the byte number of the memory region */int used;} memory_area_t;

这段 ram 地址空间中的连续地址范围可以处于两种状态之一:(1)used=1,则说明这段连续的地址范围已被实现,也即真正地被映射到 ram 单元上。(2)used=0,则说明这段连续的地址范围并未被系统所实现,而是处于未使用状态。

基于上述 memory_area_t 数据结构,整个 cpu 预留的 ram 地址空间可以用一个 memory_area_t 类型的数组来表示,如下所示:

memory_area_t memory_map[num_mem_areas] = {[0 ... (num_mem_areas - 1)] = {.start = 0,.size = 0,.used = 0},};

(2) 内存映射的检测

下面我们给出一个可用来检测整个 ram 地址空间内存映射情况的简单而有效的算法:

/* 数组初始化 */for(i = 0; i < num_mem_areas; i++)memory_map[i].used = 0;/* first write a 0 to all memory locations */for(addr = mem_start; addr < mem_end; addr += page_size)* (u32 *)addr = 0;for(i = 0, addr = mem_start; addr < mem_end; addr += page_size) {     /*      * 检测从基地址 mem_start+i*page_size 开始,大小为* page_size 的地址空间是否是有效的ram地址空间。      */     调用3.1.2节中的算法test_mempage();     if ( current memory page isnot a valid ram page) {/* no ram here */if(memory_map[i].used )i++;continue;}/* * 当前页已经是一个被映射到 ram 的有效地址范围 * 但是还要看看当前页是否只是 4gb 地址空间中某个地址页的别名? */if(* (u32 *)addr != 0) { /* alias? *//* 这个内存页是 4gb 地址空间中某个地址页的别名 */if ( memory_map[i].used )i++;continue;}/* * 当前页已经是一个被映射到 ram 的有效地址范围 * 而且它也不是 4gb 地址空间中某个地址页的别名。 */if (memory_map[i].used == 0) {memory_map[i].start = addr;memory_map[i].size = page_size;memory_map[i].used = 1;} else {memory_map[i].size += page_size;}} /* end of for (…) */

在用上述算法检测完系统的内存映射情况后,boot loader 也可以将内存映射的详细信息打印到串口。

3.2.3 加载内核映像和根文件系统映像

(1) 规划内存占用的布局

这里包括两个方面:(1)内核映像所占用的内存范围;(2)根文件系统所占用的内存范围。在规划内存占用的布局时,主要考虑基地址和映像的大小两个方面。

对于内核映像,一般将其拷贝到从(mem_start+0x8000) 这个基地址开始的大约1mb大小的内存范围内(嵌入式 linux 的内核一般都不操过 1mb)。为什么要把从 mem_start 到 mem_start+0x8000 这段 32kb 大小的内存空出来呢?这是因为 linux 内核要在这段内存中放置一些全局数据结构,如:启动参数和内核页表等信息。

而对于根文件系统映像,则一般将其拷贝到 mem_start+0x0010,0000 开始的地方。如果用 ramdisk 作为根文件系统映像,则其解压后的大小一般是1mb。

(2)从 flash 上拷贝

由于像 arm 这样的嵌入式 cpu 通常都是在统一的内存地址空间中寻址 flash 等固态存储设备的,因此从 flash 上读取数据与从 ram 单元中读取数据并没有什么不同。用一个简单的循环就可以完成从 flash 设备上拷贝映像的工作:

 while(count) {*dest++ = *src++; /* they are all aligned with word boundary */count -= 4; /* byte number */};

3.2.4 设置内核的启动参数

应该说,在将内核映像和根文件系统映像拷贝到 ram 空间中后,就可以准备启动 linux 内核了。但是在调用内核之前,应该作一步准备工作,即:设置 linux 内核的启动参数。

linux 2.4.x 以后的内核都期望以标记列表(tagged list)的形式来传递启动参数。启动参数标记列表以标记 atag_core 开始,以标记 atag_none 结束。每个标记由标识被传递参数的 tag_header 结构以及随后的参数值数据结构来组成。数据结构 tag 和 tag_header 定义在 linux 内核源码的include/asm/setup.h 头文件中:

/* the list ends with an atag_none node. */#define atag_none0x00000000struct tag_header {u32 size; /* 注意,这里size是字数为单位的 */u32 tag;};……struct tag {struct tag_header hdr;union {struct tag_corecore;struct tag_mem32mem;struct tag_videotextvideotext;struct tag_ramdiskramdisk;struct tag_initrdinitrd;struct tag_serialnrserialnr;struct tag_revisionrevision;struct tag_videolfbvideolfb;struct tag_cmdlinecmdline;/* * acorn specific */struct tag_acornacorn;/* * dc21285 specific */struct tag_memclkmemclk;} u;};

COPYRIGHT(C) 2011 厦门永宏亚得机电科技有限公司版权所有(闽ICP备05025945号) ALL RIGHTS RESERVED?

电话: 0592-5190891 传真: 0592-5190720 E-Mail: E-mail:yade8895@163.com
地址: 厦门市海沧区兴港六里17号2607室 邮编:361009 联系人:翟先生