摘要:Bootloader是系统上电或复位后首先运行的一段代码,是连接操作系统和硬件的桥梁,负责初始化硬件和引导操作系统等。目前已有很多通用的Bootloader,但是如何根据特定的嵌入式平台,移植自己的引导程序是一个重点和难点。文章详细说明了从Nandflash引导操作系统要完成的主要任务和实现方法,并给出了在S3C2410上实现Nandflash启动的试验结果。
关键词:Bootloader; 移植;Nandflash;S3C2410
0 引言
Bootloader通常称为系统的引导加载程序,是系统加电或复位后执行的第一段代码[ 1 ]。一般它只在系统启动时运行非常短的时间,但对于嵌入式系统来说,这是一个非常重要的系统组成部分。通过这段小程序,可以初始化硬件设备、建立内存空间的映射图,从而将系统的软硬件环境带到一个合适的状态,以便为调用操作系统内核准备好正确的环境,并同时提供基本输入、输出系统监控功能和程序调试功能。
Bootloader是严重地依赖于硬件而实现的。每种不同体系结构的处理器都有不同的Bootloader。除了依赖于处理器的体系结构以外,Bootloader实际上也依赖于具体的嵌入式板级设备的配置,也就是说,对于两块不同的嵌入式板而言,即使它们是基于同一种处理器而构建的,要想让运行在一块板子上的Bootloader程序也能运行在另一块板子上,通常也都需要修改与目标硬件相关的代码。因此有必要分析Bootloader,并理解和找出其中的原理和规律,就其特定的嵌入式系统,移植或开发属于自己的Bootloader。
1 系统硬件平台简介
本系统采用的是SamSung公司的S3C2410处理器[ 2 ],它是专门为移动手持设备提供的高性价比和高性能的嵌入式微处理器解决方案。其内核是ARM920T,最高能工作在202.8MHz,为了减少系统总成本和减少外围器件,它集成了如下部件:分别为16KB指令和数据Cahce、1个LCD控制器、SDRAM控制器、NANDFLASH控制器、3通道UART、4通道DMA、4个具有PWM功能的计时器和1个内部时钟、8通道10位ADC、触摸屏接口、I²S总线接口,2个USB主机接口、1个USB设备接口,2个SPI接口、SD和MMC卡接口、看门狗定时器、117位通用IO口、24位外部中断源、8通道10位AD控制器等。本文涉及的S3C2410开发板的硬件结构如图1所示,本文主要阐述从Nandflash引导操作系统要完成的主要任务和实现方法,至于从Norflash引导操作系统,不打算具体实现。
2 存储空间分布和映射图
硬件平台的Nandflash(型号是:K9F1208U0M[ 3])空间为64MB,SDRAM(型号是:HY57V561620[ 4 ],32Mx2)空间为64M(0x30000000-0x33ffffff),采用如图2所示的存储空间分布图,因为Nandflash只能存储程序,无法运行程序。为了能够从Nandflash启动,上电复位时,S3C2410通过硬件逻辑把Nandflash的前4KB的内容复制到片内SRAM中,而片内SRAM被映射到地址0x0,这样就可以从地址0x0处取到有效指令,开始执行bootloader,完成把Nandflash中的内核代码复制到sdram中等工作。
图2 引导代码和操作系统内核在Nandflash和存储空间中的分布情况
3 Bootloader的设计流程
Bootloader引导程序是硬件上电复位后首先运行的代码,由它来加载嵌入式操作系统。然后由操作系统接管整个系统,进行进程管理、内存管理、磁盘管理和各个外设管理等工作。 BootLoader是操作系统内核运行之前的一段自举程序,用来初始化硬件设备、改变处理器运行模式和重组中断向量,建立内存空间的映射图,将系统的软硬件环境带到一个由用户定制的特定状态,然后加载操作系统内核。从操作系统的角度来看,Bootloader的总目标就是正确地调用内核来执行。Bootloader一般分为stage1和stage2两大部分[ 5 ],对于依赖于CPU体系结构的代码,比如设备初始化代码等,通常都放在stage1中,而且通常都用汇编语言来实现,以达到短小精悍的目的,也就是前面说的启动代码。而stage2则通常用C语言来实现,这样可以实现复杂的功能,而且代码会具有更好的可读性和可移植性。
3.1 Bootloader的stage1
这部分代码必须首先完成一些基本的硬件初始化。为stage2 的执行以及随后的内核的执行准备好一些基本的硬件环境。Bootloader 的stage1 一般通用的内容包括:
(1)设置中断和异常向量;(2)禁止看门狗;(3) 屏蔽所有的中断, 在Boot Loader 的执行全过程中可以不必响应任何中断, 中断屏蔽可以通过写CPU 的中断屏蔽寄存器或状态寄存器CPSR 寄存器来完成;(4) 设置CPU 的速度和时钟频率;(5) 对RAM进行初始化, 包括正确设置系统的内存控制器的功能寄存器等;(6)初始化LED或UART,就是通过GPIO来驱动LED,也可以通过初始化UART向串口打印Bootloader的调试信息来表明系统的状态是OK还是ERROR,以便跟踪系统运行情况;(7)关闭CPU 内部指令/数据高速缓存(cache);(8)为加载Bootloader的stage2准备RAM空间;(9)设置好堆栈;(10)跳转到stage2的C入口点;其流程图如图3所示。
图3 Bootloader的stage1的实现
3.2 Bootloader的stage2
为了让程序跳入C 语言的“main”函数, 我们采用直接跳转到“main”函数的方法, 实现代码如下:
b Main
进入main 函数后即可以开始本阶段stage2 的初始化任务, 这包括:
(1) 如果在stage1没有初始化UART,这时候至少初始化一个串口, 以便和终端用户进行交互,当然也可以继续点亮或熄 灭LED来判断程序执行情况;
(2) 修改时钟频率;
(3) 使能指令Cache;
(5) 从串口中打印一些必要的交互信息,了解系统状态;
(6) 初始化中断, 包括屏蔽中断, 清除中断悬挂标志, 初始化中断向量表, 注册需要的中断处理函数等;
(8)打印版本、时间等信息,并从Nandflash复制内核到SDRAM中;
(9)修改指针,直接跳到内核在SDRAM中的首地址处,至此,完成了Bootloader的全部运行加载工作;
下面是main()函数和从Nandflash复制内核到SDRAM中的ReadImageFromNandflash()函数的具体实现,但省略了一些具体细节,包括从串口打印的启动、交互、调试信息和一些具体函数的实现。一些具体函数的实现可以参考三星评估版源代码。
void Main(void)
{
JumpAddr=0x30200000; //拷贝内核到sdram中的起始地址,也是内核开始执行的地址
ChangeClockDivider(1,1); //1:2:4
ChangeMPllValue(0x5c,0x1,0x1); // FCLK=202.8MHz
MMU_EnableICache(); //使能指令Cache
Uart_Init(); // 初始化串口
Port_Init(); //初始化I/O口
NF_Init(); //初始化Nandflash控制器
NF_ReadID(); //读取Nandflash存储器ID号
ReadImageFromNandflash();//把存储在Nandflash中的内核拷贝到SDRAM中
rINTMSK=BIT_ALLMSK; //屏蔽所有中断
Launch(JumpAddr); //跳转到sdram中内核开始处,并运行内核
}
从Nandflash(Flash是K9F1208U0M)拷贝内核到SDRAM的函数具体实现如下:
void ReadImageFromNandflash(void)
{
U8 Image_Buf[512];
U32 Sram_Space=0;
U32 j,k, numberblock;
static U32 i, SECTOR_SIZE=512;
static U8 isbad;
volatile U32 IMAGE_BASE=0x30200000; //内核在sdram中运行的开始地址
rINTMSK = BIT_ALLMSK; //屏蔽所有中断
i=2; //从第2个block开始拷贝内核,第0个用于存储本文的bootloader,第1个没用到
numberblock=2047; //拷贝多少个block到sdram中,视内核大小设置此值
while(1)
{
nextblock:
isbad=0;
isbad=NF_IsBadBlock(i); //判断正在拷贝的block是否是坏block
if (isbad) //是坏block,就进行相应的处理;否则就忽略此处,进行下面的拷贝
{
i=i+1; //调整,指向下一个block
isbad=0;
if(i>= numberblock) //判断是否拷贝完了所需的block
{
Launch(JumpAddr); //拷贝完了所需的block,就跳到sdram中内核开始处
}
goto nextblock;
}
for(k=0;k<32;k++) //1 block=32 pages
{ // FMD_ReadSector()函数实现从Nandflash存储器中读取数据到数据缓冲区中
FMD_ReadSector(i, (U8 *)&Image_Buf, k);
for (j=0;j<SECTOR_SIZE;j++) //1 page=512 bytes
{ //从数据缓冲区中拷贝到sdram中
*((U8 *)(IMAGE_BASE+Sram_Space+j))=Image_Buf[j];
}
Sram_Space=Sram_Space+SECTOR_SIZE; //调整sdram中的偏移地址
}
i=i+1; //调整,指向下一个block
if(i>= numberblock) //判断是否拷贝完了所需的block
{
Launch(JumpAddr); //拷贝完了所需的block,就跳到sdram中内核开始处
}
}
}
4 试验结果
由于三星公司的S3C2410集成了Nandflash控制器,它通过硬件逻辑把Nandflash的前4KB内容,即把Bootloader复制到片内sram中,并被映射到地址0x0处。通过跳线设置默认从nandflash启动,那么,系统每次上电或复位后,首先开始运行的就是Bootloader。使用ADS1.2集成开发环境建立Bootloader应用工程,添加必需的文件并设置好编译环境,如Bootloader的RO_Base设置为0x0,RW_Base设置为0x33ff0000等,调试并最后生成可执行二进制文件,通过JTAG接口把Bootloader烧写到Nandflash的第0个block地址开始处,通过usb下载工具把操作系统烧写到第2个block地址开始处,复位启动系统运行后的结果如图4所示,该程序用于基于uCOS操作系统的图像采集系统的引导。用同样的方法烧写不同的操作系统内核应用程序,试验结果每一次表明:Bootloader运行良好,启动加载内核快,且简单、实用、可靠。
5 结论
Bootloader的设计与实现是一个非常复杂的过程,因此要根据具体的硬件和软件需求分析来进行移植或设计。本文设计的Bootloader完成的主要功能包括:试验板硬件的初始化、串口初始化、时钟频率修改以及从Nandflash复制操作系统到SDRAM中运行等,并通过PC机上的超级终端显示了正确的启动运行信息,且可执行代码只有3K左右。因此,本文所详细描述的Bootloader启动运行的全过程,对理解、设计和移植Bootloader具有一定的参考意义。