实验一大纲

  • 环境配置
  • 第一部分:PC Bootstrap
    • x86汇编
    • 模拟x86
    • PC的物理地址空间
    • ROM BIOS
  • 第二部分:The Boot Loader
    • 加载内核
  • 第三部分:The kernel

环境配置

MIT6.828的环境配置花了我不少时间,主要是对Ubuntu的编译环境不太熟悉,根据Tools used in MIT6.828对本机环境进行配置。我是在Ubuntu的操作系统上进行实验的。有时间专门写一下如何在自己的Ubuntu上配置lab所需环境。

环境配置好后就可以开始做实验了,先要将项目clone到本地文件夹:

$ mkdir ~/6.828
$ cd ~/6.828
$ add git
$ git clone https://pdos.csail.mit.edu/6.828/2016/jos.git lab
Cloning into lab...
$ cd lab

这样lab1实验环境就有了。

##第一部分:PC Bootstrap 这部分主要介绍x86 汇编语言和PC的引导过程,并开始QEMU和QEMU/GDB的调试。

从x86汇编开始

PC Assembly Language Book中的例子是在NASM上汇编的,而我们要用GUN汇编。NASM用的是Intel语义而GUN用的是AT&T语义,幸运的是它们间的区别可以在Brennan’s Guide to Inline Assembly上看到。

练习1:从参考资料中熟悉汇编语言,不用现在阅读,但要保证在读写x86汇编程序时会参考这些资料。推荐阅读一下Brennan’s Guide to Inline Assembly,它给出了我们在JOS中用的GUN编译器AT&T汇编语义的比较好的描述。

针对x86汇编程序指定的是Intel的指令集,可见80386 Programmer’s Reference Manual,这要比最近的Manual要短很多确拥有我们实验所需的所有指令。在Intel的 IA-32 Intel Architecture Software Developer’s Manuals 中有着更完整的指令。类似的,AMD也有相应Manual:Developer Guides, Manuals & ISA Documents。将它们收藏起来准不会错。

模拟x86

我们不在物理上开发操作系统而是在仿真器上完成,这样便于调试、设置断点,而这在真实的物理器不易实现。

  • QEMU Emulator
  • GUN debugger

到目录下并运行

$ cd lab
$ make
+ as kern/entry.S
+ cc kern/entrypgdir.c
+ cc kern/init.c
+ cc kern/console.c
+ cc kern/monitor.c
+ cc kern/printf.c
+ cc kern/kdebug.c
+ cc lib/printfmt.c
+ cc lib/readline.c
+ cc lib/string.c
+ ld obj/kern/kernel
+ as boot/boot.S
+ cc -Os boot/main.c
+ ld boot/boot
boot block is 380 bytes (max 510)
+ mk obj/kern/kernel.img

这是在建立6.828的boot loader以及要开始的kernel(称这里的代码为kernel有点generous)。那么运行qemu就很简单了,直接在终端输入:

$ make qemu

得到如下图中的运行结果:

make qemu run pic

在上面的信息出现之后,就在Qemu上出现了JOS的内核显示器,发现控制台和显示器显示的内容是相同的。在内核显示器上可以给其两个command:help和kerninfo,如下图:

quem command run pic

虽然命令很简单,但这说明了内核直接在仿真PC的虚拟硬件上运行,这意味着可以将obj/kern/kernel.img的内容复制到一个真实硬件磁盘上的第一个小的扇区,然后将其插入真实的PC中并打开,能够看到与此事QEMU一样的窗口(不过不推荐这样做,会影响硬件磁盘资料的丢失)。

PC物理地址空间

                    +------------------+  <- 0xFFFFFFFF (4GB)
                    |      32-bit      |
                    |  memory mapped   |
                    |     devices      |
                    |                  |
                    /\/\/\/\/\/\/\/\/\/\

                    /\/\/\/\/\/\/\/\/\/\
                    |                  |
                    |      Unused      |
                    |                  |
                    +------------------+  <- depends on amount of RAM
                    |                  |
                    |                  |
                    | Extended Memory  |
                    |                  |
                    |                  |
                    +------------------+  <- 0x00100000 (1MB)
                    |     BIOS ROM     |
                    +------------------+  <- 0x000F0000 (960KB)
                    |  16-bit devices, |
                    |  expansion ROMs  |
                    +------------------+  <- 0x000C0000 (768KB)
                    |   VGA Display    |
                    +------------------+  <- 0x000A0000 (640KB)
                    |                  |
                    |    Low Memory    |
                    |                  |
                    +------------------+  <- 0x00000000

起初的PC是建立在16位的Intel 8088处理器上的,仅有1M的物理地址空间。因此这样只能从0x00000000开始并在0x000FFFFF结束。640K的空间被标记为“低内存”,也就是早年PC能够用的随机存取存储器。事实上最早的PC只能识别RAM的16KB、32KB、64KB空间。

在往上点的384K的空间提供硬件的特殊需求,例如VGA缓冲。最最要的一段空间是BIOS(基本输入输出系统),占据64KB(0x000F0000到0x000FFFFF)。以前BIOS都是用的ROM,现在一般都用flash了。BIOS一般用于初始化系统,例如激活video card和检测安装的内存数量。在初始化之后,BIOS从相应的位置,譬如floppy disk、hard disk、CD-ROM或者the network加载操作系统并将控制权交给操作系统。

当Intel终于从80286处理器(16MB)跨越到80386处理器(4GB)并打破兆级后,PC架构保留了低1M的物理地址空间,保证能过向后兼容软件。而新一代的PC就有了巨大的物理空间,也就是从0x000A0000 到0x00100000,将RAM分为之前的640KB和剩下的拓展空间。另外在顶上的PC的32位物理地址空间也由BIOS的32位的PCI设备保留。

x86处理器能支持大于4GB的物理RAM,即RAM可以拓展到0xFFFFFFFF以上。JOS将只用PC物理内存的一开始的256MB。

The ROM BIOS

在这段实验中,用QEMU的调试特性来研讨兼容IA-32的计算机怎样开机。

打开两个控制台分别输入

$ make qemu-gdb
$ make gdb

make gdb run pic

如图,看到一行

[f000:fff0] 0xffff0: ljmp $0xf000,$0xe05b

这是第一条执行的指令,从该输出可以得到一些结论:

  • IBM PC在物理地址0x000fff0开始执行,这是由ROM BIOS保留的靠上的64KB
  • PC开始执行,并且CS = 0xf000、IP = 0xfff0
  • 第一条指令执行的是jmp指令,跳到CS = 0xf000且IP = 0xe05b

那为什么QEMU要这样开始呢 这就是IBM早期用在他们PC上的Intel 8088处理器。由于在PC中的BIOS的物理地址范围在0x000f0000-0x000fffff,这样的设计可以使PC在一通电,BIOS总是能够首先控制机器。QEMU中,处理器重置,进入实模式(real mode)设置CS为0xf000,IP为0xfff0,以便在片地址(CS:IP)下执行。

练习2:利用GDB的si命令跟踪一些ROM BIOS的指令,尝试猜测它们在干什么。不用全部弄清楚,只要大致知道BIOS在干嘛就好。可以参考Phil Storrs I/O Ports Description 。

当BIOS执行,它就建立一个中断描述表并初始化各种设备,这也就是为啥我们能看到QEMU窗口上的“Starting SeaBIOS”信息。之后,它就寻找一个类似floppy、hard drive或CD-ROM的设备,一旦找到,BIOS读取 boot loader并转交控制权。