x86体系的计算机，经典的启动模式是BIOS先初始化硬件，然后把启动盘的MBR加载到0x7c00处并跳转执行。这时候，系统还处于16位实模式的状态，有非常多的文章和书籍介绍如何编写16位实模式汇编代码并且转入32位保护模式，此时也就顺理成章地可以使用C语言。但是，如果是否可以直接在实模式下使用C语言呢？

利用gcc的16位代码生成功能，答案是肯定的，以下以一个HelloWorld程序为例进行讲解。

1. 代码

代码中打印单个字符的功能因为涉及到BIOS调用，需要以汇编的形式实现，其余部分都通过C语言来完成。

/* mbr.c */

// 即使裸机运行，stdint.h中定义的类型或宏仍然可以使用，因为这些内容只作用于编译期
#include <stdint.h>

const char str[] = "Hello, world!";
void printChar(uint8_t row, uint8_t column, char ch, uint8_t color);

// 程序入口函数
void main()
{
    // 打印15行的HelloWorld
    for (uint8_t row = 0; row < 15; row++) {
        // 背景为黑色，前景色逐行改变
        uint8_t color = 0x01 + row;
        for (uint8_t column = 0; column < sizeof(str) - 1; ++column) {
            printChar(row, column, str[column], color);
        }
    }
    // 其实更好的死循环方式是hlt指令，这里就不计较那么多了
    while (1);
}

// 在屏幕指定的行列位置打印一个字符
// 输入参数：行位置，列位置，字符，颜色属性
// 颜色属性参见 https://en.wikipedia.org/wiki/BIOS_color_attributes
void printChar(uint8_t row, uint8_t column, char ch, uint8_t color)
{
    /* 
     * 整个内联汇编分两步，先设置光标位置，后在光标位置输出字符。
     * 设置光标位置：AH=02h, BH = 页号, DH = 行, DL = 列
     * 输出字符：AH=09h, AL = 字符, BH = 页号, BL = 颜色, CX = 重复次数
     */
    __asm__ __volatile__ (
        "mov $0x02, %%ah\n\t"
        "int $0x10\n\t"
        "mov $0x09, %%ah\n\t"
        "mov %0, %%al\n\t"
        "int $0x10\n\t"
        :
        : "m"(ch),
        "b"(((uint16_t) 0 << 8) | color),
        "c"((uint16_t) 1),
        "d"(((uint16_t) row << 8) | column)
        : "ax");
}

2. 运行

2.1. 编译

gcc -m16 -ffreestanding -fno-asynchronous-unwind-tables -fno-pic -c mbr.c

-m16 最为关键，用来告诉编译器生成16位模式的代码
-ffreestanding 告诉编译器，不要假定标准标准库的存在，编译成独立的程序
-fno-asynchronous-unwind-tables 防止生成eh_frame这类有关异常处理的section
-fno-pic 不生成位置无关代码，也就禁用掉了GOT表

2.2. 链接

gcc -m16 -nostdlib -static -e main -Wl,-Ttext=0x7c00,-build-id=none -o mbr.elf mbr.o

-m16 依然要告诉连接器生成16位代码
-nostdlib 禁用标准库
-static 生成静态代码
-e main 代码入口为函数main
-Wl,-Ttext=0x7c00,-build-id=none 链接.text节到0x7c00处，这x86启动代码被加载的内存地址；此外，不需要build-id

2.3. 检测elf生成

启动代码不同一般程序，必须小心检查各类section的生成情况，加载位置，实际上，更加合理的方法是编写linker script链接脚本，而不是如下的手工检查。

objdump -h mbr.elf

mbr.elf：     文件格式 elf32-i386

节：
Idx Name          Size      VMA       LMA       File off  Algn
  0 .text         000000fa  00007c00  00007c00  00000c00  2**0
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
  1 .rodata       0000000e  00007cfc  00007cfc  00000cfc  2**2
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  2 .comment      0000002a  00000000  00000000  00000d0a  2**0
                  CONTENTS, READONLY

此中，只有两个需要ALLOC的段，.text代码段和.rodata只读数据段，分别对应了程序可执行代码和常量字符串。

.text段从0x7c00开始，大小为0xfa
.text和.rodata之间有两个字节空隙，这是gcc为了数据对齐自动添加的
.rodata从0x7cfc开始，大小为0xe（即为”Hello, world!”字符串的数据长度）
.comment不需要考虑

经过检查，.rodata结束位置距离.text开始位置只有266字节，程序大小合适。

另外如果gcc版本不同，这个过程中也许会发现有其他的需要ALLOC的段，这样的可执行代码是有问题的，需要调整gcc编译链接选项。

2.4. 提取纯二进制文件

objcopy -O binary -j .text -j .rodata mbr.elf mbr.bin

经确认，mbr.bin文件大小为266字节无误。

2.5. 添加MBR启动标记

这一步要做的工作就是把代码扩展到一个扇区大小（512字节）并且在尾部设置0x55aa启动标志。使用dd命令可以定位写入到扇区尾部。

printf '\x55\xaa' | dd of=mbr.bin seek=510 bs=1

记录了2+0 的读入
记录了2+0 的写出
2 bytes copied, 3.0829e-05 s, 64.9 kB/s

2.6. qemu运行

qemu-system-x86_64 -hda mbr.bin

3. 附注

但值得注意的是，由于gcc生来就是为了编写32/64位代码，对16代码生成只是做了一个拓展兼容，所以，其函数调用约定依然采32位代码的约定。比如上述代码中的函数void printChar(uint8_t row, uint8_t column, char ch, uint8_t color);：

一般容易想当然以为，既然是16位模式，是调用者应该依次压入4个2字节的参数入栈，然后call printChar（即16位的call），被调用者执行完成后采用ret返回；

但是就像前面提到的，gcc的原生的支持就是32位的，所以事实上调用者往栈中押入了4个32位的参数，然后calll printChar执行32位的长调用，被调用者返回时候也是对应使用retl，所以说，这里全部使用的是32位调用约定，有很多内存空间是浪费了。

I'm dev

实模式C语言MBR程序