Skip to content

Latest commit

 

History

History
1823 lines (1264 loc) · 78.3 KB

File metadata and controls

1823 lines (1264 loc) · 78.3 KB

第三章 中断

一切的技术都在剧烈动荡,唯有思想永存。

实验要求

  • DDL:2021年4月15号 23:59
  • 提交的内容:将4个assignment的代码实验报告放到压缩包中,命名为“lab4-姓名-学号”,并交到课程网站上[http://course.dds-sysu.tech/course/3/homework]
  • 材料的Example的代码放置在src目录下
  1. 实验不限语言, C/C++/Rust都可以。
  2. 实验不限平台, Windows、Linux和MacOS等都可以。
  3. 实验不限CPU, ARM/Intel/Risc-V都可以。

Assignment 1 混合编程的基本思路

复现Example 1,结合具体的代码说明C代码调用汇编函数的语法和汇编代码调用C函数的语法。例如,结合代码说明globalextern关键字的作用,为什么C++的函数前需要加上extern "C"等, 结果截图并说说你是怎么做的。同时,学习make的使用,并用make来构建Example 1,结果截图并说说你是怎么做的。

Assignment 2 使用C/C++来编写内核

复现Example 2,在进入setup_kernel函数后,将输出 Hello World 改为输出你的学号,结果截图并说说你是怎么做的。

Assignment 3 中断的处理

复现Example 3,你可以更改Example中默认的中断处理函数为你编写的函数,然后触发之,结果截图并说说你是怎么做的。

Assignment 4 时钟中断

复现Example 4,仿照Example中使用C语言来实现时钟中断的例子,利用C/C++、 InterruptManager、STDIO和你自己封装的类来实现你的时钟中断处理过程,结果截图并说说你是怎么做的。注意,不可以使用纯汇编的方式来实现。(例如,通过时钟中断,你可以在屏幕的第一行实 现一个跑马灯。跑马灯显示自己学号和英文名,即类似于LED屏幕显示的效果。)

实验概述

这一章的内容有些多,同学们需要结合材料的内容,仔细阅读源码并体会源码的编写思路才能将其连接成一个整体。

在本章中,同学们会学习如下内容。

  • C代码变成C程序的过程。
  • C/C++项目的组织方法。
  • makefile的使用。
  • C和汇编混合编程。
  • 保护模式中断处理机制。
  • 8259A可编程中断处理部件。
  • 时钟中断的处理。

通过本章的学习,同学们将掌握使用C语言来编写内核的方法,理解保护模式的中断处理机制和处理时钟中断,为后面的二级分页机制和多线程/进程打下基础。

参考资料

从代码到可执行文件

一个简单的例子

代码放置在src/1中。

我们以一个例子来看C/C++从代码到可执行文件的过程。

我们先编写一个print.h的头文件,声明一个名为printSomething()的函数。

#ifndef PRINT_H
#define PRINT_H

void print_something();

#endif

然后,我们在print.c中实现这个函数。

#include <stdio.h>
#include "print.h"

void print_something() {
    printf("SYSU 2021 Spring Operating System Course.\n");
}

最后,我们在main.c中使用这个函数打印并输出。

#include "print.h"

int main() {
    print_something();
}

接下来,我们要开始编译运行,编译命令如下。

gcc -o main.out main.c

这条命令是编译main.c,然后生成可执行文件main.out。其中,-o指定了生成的可执行文件的名称。但是,直接运行上述命令会出现以下错误。

/tmp/cc9qS1IA.o: In function `main':
main.c:(.text+0xa): undefined reference to `print_something'
collect2: error: ld returned 1 exit status

这是因为hello.c不知道函数printSomething的实现。而函数printSomething的实现在文件print.c中,我们需要在编译命令中加上它,如下所示。

gcc -o main.out main.c print.c

上面的命令也可以这样写。

gcc main.c print.c -o main.out 

这样写可能会直观一点,但教程沿用第一种写法,同学们可以根据自己的需要调整。最后使用命令./main.out运行。

为什么单独找上面这个错误来讲呢?这是因为写操作系统内核实际上是在写一个大型的C/C++项目。例如,linux5.10.19版本的内核包含了数万个文件,几千万行代码,如下所示。

linux内核

在编写C/C++(以下将C/C++简称C)项目时,我们常常是在.h文件中编写函数的声明,然后在.c.cpp文件中实现这个函数。注意,我们并不会在.h文件中实现函数,否则当多个文件包含相同的.h文件时,会出现函数重定义问题。而函数的声明和定义分开后,我们在编译时不能只编译main函数所在的文件,而是要将所有的.c.cpp文件加上去编译。这一点常常会被初学者忘记,以至于项目在编译时报了一大堆找不到函数的实现的错误,即undefined reference to XXX,但自己又不找不到原因。

为了系统地学习C/C++项目的编译思路,我们首先来看C/C++是如何从代码走向可执行文件的。

代码编译的四个阶段

中间文件和代码放置在src/2

在上面的例子中,我们是一步从代码main.c print.c print.h到可执行文件main.out的。实际上,编译器在编译代码时包含如下几个步骤。

  • 预处理。处理宏定义,如#include, #define, #ifndef等,生成预处理文件,一般以.i为后缀。
  • 编译。将预处理文件转换成汇编代码文件,一般以.S为后缀。
  • 汇编。将汇编代码文件文件转换成可重定位文件,一般以.o为后缀。
  • 链接。将多个可重定位文件链接生成可执行文件,一般以.o为后缀。

上面的那个找不到函数print_something的实现的错误是在链接阶段出错。我们知道,在C/C++中,函数需要先声明然后才能使用,即给出函数头即可,不需要给出函数实现。在预处理、编译和汇编阶段,我们使用的都是函数的声明,只有到了链接阶段我们才需要函数的定义。

注意,声明和定义是两个不同的概念。

我们下面分别来看这4个阶段。

预处理过程,又称为预编译,主要处理宏定义,如#include, #define, #ifndef等,并删除注释行,还会添加行号和文件名标识。在编译时,编译器会使用上述信息产生调试、警告和编译错误时需要用到的行号信息。

经过预编译生成的.i文件不包含任何宏定义,因为所有的宏已经被展开,并且包含的文件也已经被插入到.i文件中。在上面的例子中,我们对main.c进行预处理,生成main.i预处理文件,命令如下。

gcc -o main.i -E main.c

生成的内容如下。

# 1 "main.c"
# 1 "<built-in>"
# 1 "<command-line>"
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 1 "<command-line>" 2
# 1 "main.c"
# 1 "print.h" 1



void print_something();
# 2 "main.c" 2

int main() {
    print_something();
}

编译则是将预处理文件转换成汇编代码文件(.S文件)的过程,具体的步骤主要有:词法分析 -> 语法分析 -> 语义分析及相关的优化 -> 中间代码生成 -> 目标代码生成。

我们生成main.c代码对应的汇编代码。命令如下,其中,-masm=intel是为了生成intel风格的汇编代码,否则默认AT&T风格的代码。

gcc -o hello.s -S hello.c -masm=intel

生成的hello.s内容如下。

	.file	"main.c"
	.intel_syntax noprefix
	.text
	.globl	main
	.type	main, @function
main:
.LFB0:
	.cfi_startproc
	push	rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	mov	rbp, rsp
	.cfi_def_cfa_register 6
	mov	eax, 0
	call	print_something
	mov	eax, 0
	pop	rbp
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE0:
	.size	main, .-main
	.ident	"GCC: (Ubuntu 5.4.0-6ubuntu1~16.04.12) 5.4.0 20160609"
	.section	.note.GNU-stack,"",@progbits

汇编阶段是将汇编代码转换成可重定位文件(Relocatable file)。汇编器(as)将main.S翻译成机器语言指令,把这些指令和其他附加的信息打包成可重定位文件(.o文件)。可重定位文件是一个二进制文件,它的字节编码是机器语言指令而不是字符。如果我们在文本编译器中打开可重定位文件,看到的将是一堆乱码,生成命令如下。

gcc -o main.o -c main.c

在linux下,可重定位文件的格式是ELF文件格式,其包含了ELF头(ELF header)、程序头表(Program header table)、节(Section)和节头表(Section header table)等信息。

链接阶段就是把若干个可重定位文件(.o文件)整合成一个可执行文件(Executable file)。上面已经提到,正是因为函数的实现可能分布在多个文件中,所以在链接阶段,我们需要提供函数实现的位置,然后最终生成可执行文件。链接阶段是通过链接器(ld)完成的,链接器将输入的可重定位文件加工后合成一个可执行文件。这些目标文件中往往有相互的数据、函数引用,例如我们在main.c的main函数中引用了print.c中print_something函数的实现。使用gcc来链接的命令如下。

gcc -o main.o -c main.c
gcc -o print.o -c print.c
gcc -o main.out main.o print.o

链接完成后,我们使用命令./main.out即可执行。事实上,上面三条语句等价于

gcc -o main.out main.c print.c

生成的两个main.out也是完全一样的。

同学们可能会感到奇怪为什么预处理、编译、汇编和链接都是使用gcc,而不是使用as、ld等,这是因为gcc全名叫GNU Compiler Collection,是一个编译工具的集合,其内部会自动调用as、ld等。在本例中,我们只需简单使用gcc来完成上述过程即可。

使用Makefile编译C/C++项目

代码放置在src/3中。

我们看到,在编译时我们需要加上所有的.c文件,那么在文件数量变多,涉及到多个文件夹时,仅仅使用一条命令来编译显然是非常麻烦的。因此,我们需要新的编译工具——make。实际上,我们可以将make看成一个批处理文件,make并不提供编译工具,我们依旧使用gcc/g++来编译,make只是把这些编译命令合在了一个文件中,称为Makefile

关于Makefile的编写请大家参考网上的教程,例如这篇,然后在实践中加深自己的理解。

我们在编译程序的过程如下。

  • .c.cpp.asm编译成目录文件.o

  • 使用链接器将.o文件合成一个文件。

因此,上面的例子的Makefile如下。

main.out: main.o print.o
	gcc -o main.out main.o print.o

print.o: print.c
	gcc -o print.o -c print.c

main.o: main.c
	gcc -o main.o -c main.c

clean:
	rm *.o *.out

然后编译运行。

make
./main.out

虽然教程推荐同学们使用Makefile编译,但是同学们也可以不使用。

C/C++和汇编混合编程

C/C++和汇编混合编程包含两个方面。

  • 在C/C++代码中使用汇编代码实现的函数。
  • 在汇编代码中使用C/C++中的函数。

混合编程是必要的,例如在bootloader初始化后,我们需要跳转到C/C++编写的函数中执行;又如我们需要在C/C++中调用使用汇编代码读取硬盘的函数。

混合编程的另外一个原因是教程并不打算使用内联汇编。内联汇编使用的是AT&T风格的语法,有自己的一套规则。注意到任何使用到内联汇编的情况都可以用一个汇编函数来代替,为了简便起见,教程会在C/C++中使用汇编函数来代替内联汇编。(汇编函数指的是在我们使用汇编代码实现的函数)

那么这是怎么做到的呢?回顾上面的知识点我们知道,C/C++首先会被编译成汇编代码,然后再汇编形成可重定位文件,最后由多个可重定位文件链接成一个可执行文件。无论是汇编代码还是C/C++代码,它们都有一个相同的终点——可执行文件。因此,当我们需要在汇编代码中使用C/C++函数时,我们只需要在汇编代码中声明这个函数来自于外部。我们并不需要关心函数是否被实现,因为我们是在链接阶段才会用到函数的实现。同理,当我们需要在C/C++使用汇编代码的函数时,我们也只需要在C/C++中声明用到的函数来自于外部即可。

声明的规则如下,我们首先来看如何在汇编代码中调用C/C++的函数。

当我们需要在汇编代码中使用C的函数function_from_C时,我们需要在汇编代码中声明这个函数来自于外部。

extern function_from_C

声明后便可直接使用,例如。

call function_from_C

但是,如果我们需要在汇编代码中使用来自C++的函数function_from_CPP时,我们需要现在C++代码的函数定义前加上extern "C"。因为C++支持函数重载,为了区别同名的重载函数,C++在编译时会进行名字修饰。也就是说,function_from_CPP编译后的标号不再是function_from_CPP,而是要带上额外的信息。而C代码编译后的标号还是原来的函数名。因此,extern "C"目的是告诉编译器按C代码的规则编译,不进行名字修饰。例如,我们首先需要在C++代码中声明如下。

extern "C" void functionFromCpp();

同样地,在汇编代码中声明这个函数即可。

extern function_from_CPP

如果不加extern "C",那么我们在汇编代码中声明的标号就不是function_from_CPP,而是function_from_CPP经过名字修饰后的标号,这将会变得非常麻烦。

我们接下来看如何在C/C++代码中调用汇编代码中的函数。

在C/C++调用汇编函数之前,我们先需要在汇编代码中将函数声明为global。例如我们需要调用汇编函数function_from_asm,那么我们首先需要在汇编代码中将其声明为global

global function_from_asm

否则在链接阶段会找不到函数的实现。然后我们在C/C++中将其声明来自外部即可,如下所示。

extern void function_from_asm();

在C++中需要声明为extern "C",如下所示。

extern "C" void function_from_asm();

在很多情况下,我们调用的函数是带有返回值和参数的。在前面的“改造MBR”的内容中,我们提到了C/C++函数调用规则,这里我们再重温一下,如下所示。

  • 如果函数有参数,那么参数从右向左依次入栈。
  • 如果函数有返回值,返回值放在eax中。
  • 放置于栈的参数一般使用ebp来获取

我们以一个例子来说明。我们有两个函数,一个是汇编函数function_from_asm,一个是C函数function_from_C,并且两个函数在C代码中声明如下。

extern int function_from_asm(int arg1, int arg2);
int function_from_C(int arg1, int arg2);

当我们需要在汇编代码中调用函数function_from_C,调用的形式是function_from_C(1,2),此时的汇编代码如下。

push 2         ; arg2
push 1         ; arg1
call function_from_C 
add esp, 8      ; 清除栈上的参数

call指令返回后,函数的返回值被放在了eax中。

当我们需要在C代码中调用函数function_from_asm时,使用如下语句即可。

int ret = function_from_asm(1, 2);

函数调用后,参数2,1,返回值被依次放在栈上,如下所示。

函数调用规则

此时,我们实现的汇编函数function_from_asm必须要遵循C/C++的函数调用规则才可以被正常调用。一个遵循了C/C++的函数调用规则的汇编函数如下所示。

function_from_asm:
	push ebp
	mov ebp, esp
	
	; 下面通过ebp引用函数参数
	; [ebp + 4 * 0]是之前压入的ebp值
	; [ebp + 4 * 1]是返回地址
	; [ebp + 4 * 2]是arg1
	; [ebp + 4 * 3]是arg2
	; 返回值需要放在eax中
	
	... 
	
	pop ebp
	ret
	

特别注意,汇编函数并没有函数参数和返回值的概念,因此汇编函数也被称为过程,不过是一段指令序列而已。函数参数和返回值的概念是我们在C/C++函数调用规则中人为给出规定的,汇编函数并不知情。这一点同学们需要仔细体会

实际上,C/C++函数被编译成汇编代码后也是按照function_from_asm给出的格式来实现的,同学们可以在gdb中自行反汇编查看。

我们已经学习了混合编程的知识和程序编译的过程,现在通过一个例子来加深我们的印象。

Example 1 混合编程

代码放置在src/4中。

在Example 1中,我们需要做的工作如下。

  • 在文件c_func.c中定义C函数function_from_C
  • 在文件cpp_func.cpp中定义C++函数function_from_CPP
  • 在文件asm_func.asm中定义汇编函数function_from_asm,在function_from_asm中调用function_from_Cfunction_from_CPP
  • 在文件main.cpp中调用汇编函数function_from_asm

我们首先在文件c_func.c中定义C函数function_from_C

#include <stdio.h>

void function_from_C() {
    printf("This is a function from C.\n");
}

然后在文件cpp_func.cpp中定义C++函数function_from_CPP

#include <iostream>

extern "C" void function_from_CPP() {
    std::cout << "This is a function from C++." << std::endl;
}

接着在文件asm_func.asm中定义汇编函数function_from_asm,在function_from_asm中调用function_from_Cfunction_from_CPP

[bits 32]
global function_from_asm
extern function_from_C
extern function_from_CPP

function_from_asm:
    call function_from_C
    call function_from_CPP
    ret

最后在文件main.cpp中调用汇编函数function_from_asm

#include <iostream>

extern "C" void function_from_asm();

int main() {
    std::cout << "Call function from assembly." << std::endl;
    function_from_asm();
    std::cout << "Done." << std::endl;
}

我们首先将这4个文件统一编译成可重定位文件即.o文件,然后将这些.o文件链接成一个可执行文件,编译命令分别如下。

gcc -o c_func.o -m32 -c c_func.c
g++ -o cpp_func.o -m32 -c cpp_func.cpp 
g++ -o main.o -m32 -c main.cpp
nasm -o asm_func.o -f elf32 asm_func.asm
g++ -o main.out main.o c_func.o cpp_func.o asm_func.o -m32

其中,-f elf32指定了nasm编译生成的文件格式是ELF32文件格式,ELF文件格式也就是Linux下的.o文件的文件格式。

最后我们执行main.out,输出如下结果。

函数调用规则

Example 2 内核的加载

Example 2的代码放置在src/5下,因此下面的文件名和文件夹名使用的是相对地址。

我们在bootloader中只负责完成进入保护模式的内容,然后加载操作系统内核到内存中,最后跳转到操作系统内核的起始地址,接下来的工作就由操作系统内核接管了。

从代码层面来看,bootloader我们是使用汇编代码来实现的,可能同学们刚开始还感觉比较陌生。但是接下来的内核部份我们可以使用C/C++来完成绝大部分的内容,汇编代码只是为我们提供汇编指令的封装,目的是不使用内联汇编。

我们需要完成的任务如下。

在Example 2中,我们在bootloader中加载操作系统内核到地址0x20000,然后跳转到0x20000。内核接管控制权后,输出“Hello World”。

在此之前,我们要转变下我们的工作目录环境。我们的操作系统实验就是一个C/C++项目,这和同学们已经司空见惯的什么“学生信息管理系统”项目是一样的。既然是C/C++项目,我们可以使用C/C++项目管理的办法应对,如下所示。

以接下来的操作系统代码为例,假设项目的放置的文件夹是project。那么在project文件夹下会有buildincluderunsrc等,各个子文件夹的含义如下。

  • project/build。存放Makefile,make之后生成的中间文件如.o.bin等会放置在这里,目的是防止这些文件混在代码文件中。
  • project/include。存放.h等函数定义和常量定义的头文件等。
  • project/run。存放gdb配置文件,硬盘映像.img文件等。
  • project/src。存放.c.cpp等函数实现的文件。

例如example-2的文件目录如下。

├── build
│   └── makefile
├── include
│   ├── asm_utils.h
│   ├── boot.inc
│   ├── os_type.h
│   └── setup.h
├── run
│   ├── gdbinit
│   └── hd.img
└── src
    ├── boot
    │   ├── bootloader.asm
    │   ├── entry.asm
    │   └── mbr.asm
    ├── kernel
    │   └── setup.cpp
    └── utils
        └── asm_utils.asm

看到这里,同学们可能会有疑问——.h.cpp并不是放在同一目录下,那么我们是不是要在.cpp文件里写出.h文件的地址呢?其实大可不必,我们只要在编译指令中指定头文件的目录即可,编译器会去自己寻找。考虑如下场景,假设project/src/hello.cpp要引用头文件project/include/hello.h,按照我们学过的知识,我们需要在hello.cpp这样写

#include "../include/hello.h"

但这样写不太美观,而且当我们移动了hello.h后,我们需要修改代码。但是,我们可以只在hello.cpp中按如下写法

#include "hello.h"

然后再编译指令中使用-I参数指明头文件的位置即可,如下所示,假设我们是在文件夹project/build下执行这个命令。

g++ -o hello -I../include ../src/hello.cpp

在我们编译的时候,g++会自动地去../include文件夹下找到hello.cpp中需要的hello.h文件。此后,我们便不需要再代码显式地指出头文件的位置了。

我们接下来基于baseline来实现example-2。假设我们实现的内核很小,因此下面我们约定内核的大小是200个扇区,起始地址是0x20000,内核存放在硬盘的起始位置是第6个扇区。bootloader在进入保护模式后,从硬盘的第6个扇区中加载200个扇区到内存起始地址0x20000处,然后跳转执行。

我们在bootloader的最后加上读取内核的代码,代码放置在src/boot/bootloader.asm下,如下所示。

... ; 进入保护模式并初始化的代码 

mov eax, KERNEL_START_SECTOR
mov ebx, KERNEL_START_ADDRESS
mov ecx, KERNEL_SECTOR_COUNT

load_kernel: 
    push eax
    push ebx
    call asm_read_hard_disk  ; 读取硬盘
    add esp, 8
    inc eax
    add ebx, 512
    loop load_kernel

jmp dword CODE_SELECTOR:KERNEL_START_ADDRESS       ; 跳转到kernel

jmp $ ; 死循环

; asm_read_hard_disk(memory,block)
; 加载逻辑扇区号为block的扇区到内存地址memory

... ;省略

常量的定义放置在5/include/boot.inc下,新增的内容如下。

; __________kernel_________
KERNEL_START_SECTOR equ 6
KERNEL_SECTOR_COUNT equ 200
KERNEL_START_ADDRESS equ 0x20000

回忆以下我们是如何生成内核的二进制文件的。我们是先把.c.cpp.asm文件编译成目标文件.o文件,然后使用ld将其链接起来。由于这里我们指定了内核起始地址是0x20000,因此我们需要在ld-Ttext参数中给出内核起始地址,也就是-Ttext 0x00020000。我们在makefile中会自动寻找所有的.o文件,然后使用ld链接起来。但是,这样自动寻找和链接后,二进制文件的起始地址存放的并不一定是我们希望的内核进入地址。为了保险起见,我们需要将内核进入点的代码放在ld的所有.o文件之首,这样生成的二进制文件中的起始地址必定是内核进入点。

此时,bootloader已经完成了,我们接下来编写我们的内核。这里,我们一直在使用“内核”这样的字眼,同学们一开始可能不太能理解。所谓内核,不过是一段程序换个叫法而已,就是一堆的指令加上一堆的数据。因此,我们编写内核就是在编写各种各样的函数,然后我们将这些函数所在的文件编译成可重定位文件,最后再将这些可重定位文件链接起来就得到我们的内核了。

首先,我们在src/boot/entry.asm下定义内核进入点。

extern setup_kernel
enter_kernel:
    jmp setup_kernel

我们会在链接阶段巧妙地将entry.asm的代码放在内核代码的最开始部份,使得bootloader在执行跳转到0x20000后,即内核代码的起始指令,执行的第一条指令是jmp setup_kernel。在jmp指令执行后,我们便跳转到使用C++编写的函数setup_kernel。此后,我们便可以使用C++来写内核了。

setup_kernel的定义在文件src/kernel/setup.cpp中,内容如下。

#include "asm_utils.h"

extern "C" void setup_kernel()
{
    asm_hello_world();
    while(1) {

    }
}

为了方便汇编代码的管理,我们将汇编函数放置在src/utils/asm_utils.h下,如下所示。

[bits 32]

global asm_hello_world

asm_hello_world:
    push eax
    xor eax, eax

    mov ah, 0x03 ;青色
    mov al, 'H'
    mov [gs:2 * 0], ax

    mov al, 'e'
    mov [gs:2 * 1], ax

    mov al, 'l'
    mov [gs:2 * 2], ax

    mov al, 'l'
    mov [gs:2 * 3], ax

    mov al, 'o'
    mov [gs:2 * 4], ax

    mov al, ' '
    mov [gs:2 * 5], ax

    mov al, 'W'
    mov [gs:2 * 6], ax

    mov al, 'o'
    mov [gs:2 * 7], ax

    mov al, 'r'
    mov [gs:2 * 8], ax

    mov al, 'l'
    mov [gs:2 * 9], ax

    mov al, 'd'
    mov [gs:2 * 10], ax

    pop eax
    ret

然后我们统一在文件include/asm_utils.h中声明所有的汇编函数,这样我们就不用单独地使用extern来声明了,只需要#include "asm_utils.h"即可,如下所示。

#ifndef ASM_UTILS_H
#define ASM_UTILS_H

extern "C" void asm_hello_world();

#endif

重要内容大概是这些,同学们如果还有不明白的可以自行翻阅example-2下的代码。

然后我们在build文件夹下开始编译,我们首先编译MBR、bootloader。

nasm -o mbr.bin -f bin -I../include/ ../src/boot/mbr.asm
nasm -o bootloader.bin -f bin -I../include/ ../src/boot/bootloader.asm

其中,-I参数指定了头文件路径,-f指定了生成的文件格式是二进制的文件。

接着,我们编译内核的代码。我们的方案是将所有的代码(C/C++,汇编代码)都同一编译成可重定位文件,然后再链接成一个可执行文件。

我们首先编译src/boot/entry.asmsrc/utils/asm_utils.asm

nasm -o entry.obj -f elf32 ../src/boot/entry.asm
nasm -o asm_utils.o -f elf32 ../src/utils/asm_utils.asm

回忆以下,在Linux下的可重定位文件的格式是ELF文件格式。加上我们是32位保护模式,-f参数指定的生成文件格式是elf32,而不再是bin

接着,我们编译setup.cpp

g++ -g -Wall -march=i386 -m32 -nostdlib -fno-builtin -ffreestanding -fno-pic -I../include -c ../src/kernel/setup.cpp

上面的参数有点多,我们逐一来看。

  • -O0告诉编译器不开启编译优化。
  • -Wall告诉编译器显示所有编译器警告信息
  • -march=i386告诉编译器生成i386处理器下的.o文件格式。
  • -m32告诉编译器生成32位的二进制文件。
  • -nostdlib -fno-builtin -ffreestanding -fno-pic是告诉编译器不要包含C的任何标准库。
  • -g表示向生成的文件中加入debug信息供gdb使用。
  • -I指定了代码需要的头文件的目录。
  • -c表示生成可重定位文件。

最后我们链接生成的可重定位文件为两个文件:只包含代码的文件kernel.bin,可执行文件kernel.o

ld -o kernel.o -melf_i386 -N entry.obj setup.o asm_utils.o -e enter_kernel -Ttext 0x00020000
ld -o kernel.bin -melf_i386 -N entry.obj setup.o asm_utils.o -e enter_kernel -Ttext 0x00020000 --oformat binary

这里面同样涉及很多参数,我们逐一来看。

  • -m参数指定模拟器为i386。
  • -N参数告诉链接器不要进行页对齐。
  • -Ttext指定标号的起始地址。
  • -e参数指定程序进入点。
  • --oformat指定输出文件格式。

为什么要生成两个文件呢?注意到上面两条指令差别仅在于是否有-oformat binary。实际上,kernel.o也是ELF32格式的,其不仅包含代码和数据,还包含debug信息和elf文件信息等。特别地,kernel.o开头并不是内核进入点,而是ELF的文件头,因此我们需要解析ELF文件才能找到真正的内核进入点。

为了简便起见,我们希望链接生成的文件只有内核的代码,不会包含其他的信息,即一开头就是可执行的指令。此时,我们加上了-oformat binary生成这样的文件。也就是说,kernel.bin从头到尾都是我们编写的代码对应的机器指令,不再是ELF格式的。此时,我们将其加载到内存后,跳转执行即可。

kernel.o仅用在gdb的debug过程中,通过kernel.o,gdb就能知道每一个地址对应的C/C++代码或汇编代码是什么,这样为我们的debug过程带来了极大的方便。

特别注意,输出的二进制文件的机器指令顺序和链接时给出的文件顺序相同。也就是说,如果我们按如下命令链接

ld -o kernel.bin -melf_i386 -N setup.o entry.obj asm_utils.o -e enter_kernel -Ttext 0x0 --oformat binary

那么bootloader.bin的第一条指令是setup.o的第一条指令,这样就会导致错误。

链接后我们使用dd命令将mbr.bin bootloader.bin kernel.bin写入硬盘即可,如下所示。

dd if=mbr.bin of=../run/hd.img bs=512 count=1 seek=0 conv=notrunc
dd if=bootloader.bin of=../run/hd.img bs=512 count=5 seek=1 conv=notrunc
dd if=kernel.bin of=../run/hd.img bs=512 count=200 seek=6 conv=notrunc

run目录下,启动后的效果如下。

qemu-system-i386 -hda ../run/hd.img -serial null -parallel stdio -no-reboot

assignment-1

在上面的过程中,即便是这样简单的代码,我们的编译命令也变得非常长了。那么有没有一种方法能够简化我们的编译过程呢?此时,makefile的巨大作用便体现出来了。我们可以使用makefile的命令自动帮我们找到.c.cpp文件,然后编译生成.o文件。然后我们又可以使用makefile找到所有生成的.o文件,使用ld链接生成二进制文件。这样做的好处是当我们新增一个.c.cpp文件后,我们几乎不需要修改makefile,大大简化了编译过程。example-2的makefile如下。

ASM_COMPILER = nasm
C_COMPLIER = gcc
CXX_COMPLIER = g++
CXX_COMPLIER_FLAGS = -g -Wall -march=i386 -m32 -nostdlib -fno-builtin -ffreestanding -fno-pic
LINKER = ld

SRCDIR = ../src
RUNDIR = ../run
BUILDDIR = build
INCLUDE_PATH = ../include

CXX_SOURCE += $(wildcard $(SRCDIR)/kernel/*.cpp)
CXX_OBJ += $(CXX_SOURCE:$(SRCDIR)/kernel/%.cpp=%.o)

ASM_SOURCE += $(wildcard $(SRCDIR)/utils/*.asm)
ASM_OBJ += $(ASM_SOURCE:$(SRCDIR)/utils/%.asm=%.o)

OBJ += $(CXX_OBJ)
OBJ += $(ASM_OBJ)

build : mbr.bin bootloader.bin kernel.bin kernel.o
	dd if=mbr.bin of=$(RUNDIR)/hd.img bs=512 count=1 seek=0 conv=notrunc
	dd if=bootloader.bin of=$(RUNDIR)/hd.img bs=512 count=5 seek=1 conv=notrunc
	dd if=kernel.bin of=$(RUNDIR)/hd.img bs=512 count=145 seek=6 conv=notrunc
# nasm的include path有一个尾随/

mbr.bin : $(SRCDIR)/boot/mbr.asm
	$(ASM_COMPILER) -o mbr.bin -f bin -I$(INCLUDE_PATH)/ $(SRCDIR)/boot/mbr.asm
	
bootloader.bin : $(SRCDIR)/boot/bootloader.asm 
	$(ASM_COMPILER) -o bootloader.bin -f bin -I$(INCLUDE_PATH)/ $(SRCDIR)/boot/bootloader.asm
	
entry.obj : $(SRCDIR)/boot/entry.asm
	$(ASM_COMPILER) -o entry.obj -f elf32 $(SRCDIR)/boot/entry.asm
	
kernel.bin : entry.obj $(OBJ)
	$(LINKER) -o kernel.bin -melf_i386 -N entry.obj $(OBJ) -e enter_kernel -Ttext 0x00020000 --oformat binary
	
kernel.o : entry.obj $(OBJ)
	$(LINKER) -o kernel.o -melf_i386 -N entry.obj $(OBJ) -e enter_kernel -Ttext 0x00020000
	
$(CXX_OBJ):
	$(CXX_COMPLIER) $(CXX_COMPLIER_FLAGS) -I$(INCLUDE_PATH) -c $(CXX_SOURCE)
	
asm_utils.o : $(SRCDIR)/utils/asm_utils.asm
	$(ASM_COMPILER) -o asm_utils.o -f elf32 $(SRCDIR)/utils/asm_utils.asm
clean:
	rm -f *.o* *.bin 
	
run:
	qemu-system-i386 -hda $(RUNDIR)/hd.img -serial null -parallel stdio -no-reboot

debug: 
	qemu-system-i386 -S -s -parallel stdio -hda $(RUNDIR)/hd.img -serial null&
	@sleep 1
	gnome-terminal -e "gdb -q -tui -x $(RUNDIR)/gdbinit"

然后使用如下命令即可编译、运行。

make
make run

如果想debug,使用如下命令即可。

make debug

效果如下,同学们可以方便地对照C/C++和汇编源码来debug。

debug

上面讲的工程方法初次理解起来比较抽象,某助教在写操作系统时并没有学会,而是在为同学们编写教程时逐渐学会的,也就是大三上结束才学会的。特别是makefile中的内容,限于作者们的水平,同学们需要自学后理解其中的内容。但我们后面的项目目录结构皆是如此,同学们后面会变得熟能生巧。

当然,同学们如果不是用makefile和上面的项目管理方法,而是把全部的文件堆在一起,使用g++/gcc编译也是可以的。​

至此,我们已经学习完如何使用C/C++和汇编来编写操作系统了。

保护模式下的中断

保护模式中断概述

在操作系统学习过程中,我们会遇到中断、异常和陷阱三个概念。由于在实现过程中,三者的实现方式几乎一致,因此教程统一将上述三者归结到中断中,但希望同学们在理论学习过程中不要将这三者混淆。

计算机除了CPU之外还有许多外围设备,如键盘、鼠标和硬盘等。但是,相比于CPU 的运行速度来说,这些外围设备的运行速度要慢得多。如果CPU时刻需要关注这些外围设备的运行或者轮询等待这些设备的请求到来,就会大大增加计算机整体的运行延迟。所以,计算机的做法是,CPU无需关注外围设备的运行,当外围设备产生请求时,外设通过一种信号告诉CPU应该暂停当前状态,转向处理外围设备的请求,请求处理完成后再恢复到原先暂停的状态继续运行。这种处理方法便称为中断。因此,我们才有“操作系统是中断驱动的”这种说法。

中断有两种类型,外部中断和内部中断。外部中断由硬件产生,因此又被称为硬中断。内部中断通过在程序中使用int指令调用,因此又被称为软中断。为了处理中断,OS需要预先建立中断和中断向量号的对应关系。这里,中断向量号是用来标识不同中断程序的序号。例如,我们可以使用int 10h来调用10h中断,10h就是中断向量号。

外部中断有屏蔽中断和不可屏蔽中断两种类型,屏蔽中断由INTR引脚产生,通过8259A芯片建立。不可屏蔽中断通过NMI引脚产生,例如除零错误。

内部中断就是程序中手动调用的中断,如int 10h,此处调用的10h中断就被称为内部中断。在实模式下,BIOS中集成了一些中断程序,在BIOS加电启动后这些中断程序便被放置在内存中。当我们需要调用某个中断时,我们直接在int指令中给出中断向量号即可。但是,BIOS内置的中断程序是16位的。所以,在保护模式下这些代码便不再适用。不仅如此,保护模式重新对中断向量号进行编号,也就是说,即使是相同的中断向量号,其在实模式和保护模式中的意义不再相同。保护模式下的中断向量号约定如下所示。

向量号 助记符 说明 类型 错误号 产生源
0 #DE 除出错 故障 DIV或IDIV指令
1 #DB 调试 故障/陷阱 任何代码或数据引用,或是INT 1指令
2 -- NMI中断 中断 非屏蔽外部中断
3 #BP 断点 陷阱 INT 3指令
4 #OF 溢出 陷阱 INTO指令
5 #BR 边界范围超出 故障 BOUND指令
6 #UD 无效操作码(未定义操作码) 故障 UD2指令或保留的操作码。(Pentium Pro中加入的新指令)
7 #NM 设备不存在(无数学协处理器) 故障 浮点或WAIT/FWAIT指令
8 #DF 双重错误 异常终止 有(0) 任何可产生异常、NMI或INTR的指令
9 -- 协处理器段超越(保留) 故障 浮点指令(386以后的CPU不产生该异常)
10 #TS 无效的任务状态段TSS 故障 任务交换或访问TSS
11 #NP 段不存在 故障 加载段寄存器或访问系统段
12 #SS 堆栈段错误 故障 堆栈操作和SS寄存器加载
13 #GP 一般保护错误 故障 任何内存引用和其他保护检查
14 #PF 页面错误 故障 任何内存引用
15 -- (Intel保留,请勿使用)
16 #MF x87 FPU浮点错误(数学错误) 故障 x87 FPU浮点或WAIT/FWAIT指令
17 #AC 对起检查 故障 有(0) 对内存中任何数据的引用
18 #MC 机器检查 异常终止 错误码(若有)和产生源与CPU类型有关(奔腾处理器引进)
19 #XF SIMD浮点异常 故障 SSE和SSE2浮点指令(PIII处理器引进)
20-31 -- (Intel保留,请勿使用)
32-255 -- 用户定义(非保留)中断 中断 外部中断或者INT n指令

因此,在保护模式下,我们需要自己去实现中断程序。

万丈高楼平地起,在本章中,我们先通过实现硬中断的处理来了解保护模式下的中断处理机制,然后我们再实现软中断并主动调用之。

中断处理机制

为了实现在保护模式下的中断程序,我们首先需要了解在保护模式下计算机是如何处理中断程序的。下面是保护模式下中断程序处理过程。

  • 中断前的准备。
  • CPU 检查是否有中断信号。
  • CPU根据中断向量号到IDT中取得处理这个向量的中断描述符。
  • CPU根据中断描述符中的段选择符到 GDT 中找到相应的段描述符。
  • CPU 根据特权级的判断设定即将运行程序的栈地址。
  • CPU保护现场。
  • CPU跳转到中断服务程序的第一条指令开始处执行。
  • 中断服务程序运行。
  • 中断服务程序处理完成,使用iret返回。

我们下面分别来看。

中断前的准备。为了标识中断处理程序的位置,保护模式使用了中断描述符。一个中断描述符由 64 位构成,其详细结构如下所示。

中断描述符

  • 段选择子:中断程序所在段的选择子。
  • 偏移量:中断程序的代码在中断程序所在段的偏移位置。
  • P位:段存在位。 0表示不存在,1表示存在。
  • DPL:特权级描述。 0-3 共4级特权,特权级从0到3依次降低。
  • D位: D=1表示32位代码,D=0表示16位代码。
  • 保留位:保留不使用。

和段描述符一样,这些中断描述符也需要一个地方集中放置,这些中断描述符的集合被称为中断描述符表 IDT(Interrupt Descriptor Table)。和GDT一样,IDT的位置可以任意放置。但是,为了让CPU能够找到IDT的位置,我们需要将IDT的位置信息等放在一个特殊的寄存器内,这个寄存器是IDTR。CPU则通过IDTR的内容找到中断描述符表的位置,IDTR的结构如下所示。

IDTR

从16位的表界限可以看到,中断描述符最多有$\frac{2^{16}}{2^3}=2^{13}=8192$个。注意,CPU只能处理前256个中断。因此,我们只会在IDT中放入256个中断描述符。当我们确定了IDT的位置后就使用lidt指令对IDTR赋值。通过上述步骤,我们便完成了中断的事先准备。

CPU检查是否有中断信号。除了我们主动调用中断或硬件产生中断外,CPU每执行完一条指令后,CPU就会去中断控制器8259A中检查是否有中断请求。若有中断请求,在相应的时钟脉冲到来时,CPU就会从总线上读取中断向量号。

**CPU根据中断向量号到IDT中取得处理这个向量的中断描述符。**注意,中断描述符没有选择子的说法。也就是说,中断向量号直接就是中断描述符在IDT的序号。

**CPU根据中断描述符中的段选择符到GDT中找到相应的段描述符。**CPU会解析在上一步取得的中断描述符,找到其中的目标代码段选择子,然后根据选择子到GDT(中断描述符表)中找到相应的段描述符。

**CPU 根据特权级的判断设定即将运行程序的栈地址。**由于我们后面会实现用户进程,用户进程运行在用户态下,而每一个用户进程都会有自己的栈。因此当中断发生,我们从用户态陷入内核态后,CPU会自动将栈从用户栈切换到内核栈。但在这里,我们只会在内核态编写我们的代码,因此我们的栈地址不会被切换,此步可以暂时忽略。

CPU保护现场。 CPU依次将EFLAGS、CS、EIP中的内容压栈。其实,这是在特权级不变时候的情况,如果特权级发生变换,如从用户态切换到内核态后,CPU会依次将SS,ESP,EFLAGS、CS、EIP压栈。不过这里我们暂时只运行在特权级0下。读者在学习操作系统时还会提到CPU会压入错误码,但只有部份中断才会压入错误码,详情见前面的保护模式中断的表格。

**CPU跳转到中断服务程序的第一条指令开始处执行。**保护完现场后,CPU会将中断描述符中的段选择子送入CS段寄存器,然后将中断描述符中的目标代码段偏移送入EIP。同时,CPU更新EFLAGS寄存器,若涉及特权级的变换,SS和ESP还会发生变化。当CS和EIP更新后,CPU实际上就跳转到中断服务程序的第一条指令处。

**中断服务程序运行。**此后,中断服务程序开始执行。

中断服务程序处理完成,使用iret返回。 在特权级不发生变化的情况下,iret会将之前压入栈的EFLAGS,CS,EIP的值送入对应的寄存器,然后便实现了中断返回。若特权级发生变化,CPU还会更新SS和ESP。

关于保护模式下的中断处理过程已经讲完,下面我们通过初始化IDT来理解保护模式下的中断程序编写过程。

Example 3 初始化IDT

  • Example 2的代码放置在src/6下,因此下面的文件名和文件夹名使用的是相对地址。
  • 从Example 3开始,我们则尽量在C/C++环境下实现操作系统。
  • Example 3的代码在Example 2的基础上修改。

在Example 3中,我们将会初始化IDT的256个中断,这256个中断的中断处理程序均是向栈中压入0xdeadbeef后做死循环。

在前面的例子中,我们通过bootloader跳转到初始化内核的函数setup_kernel,接下来我们就要开始初始化内核的第一步——初始化中断描述符表IDT。

我们要做的事情只有三件。

  • 确定IDT的地址。
  • 定义中断默认处理函数。
  • 初始化256个中断描述符。

下面我们分别来实现。

为了能够抽象地描述中断处理模块,我们不妨定义一个类,称为中断管理器InterruptManager,其定义放置在include/interrupt.h中,如下所示。

#ifndef INTERRUPT_H
#define INTERRUPT_H

#include "os_type.h"

class InterruptManager
{
private:
    // IDT起始地址
    uint32 *IDT;
    
public:
    InterruptManager();
    // 初始化
    void initialize();
    // 设置中断描述符
    // index   第index个描述符,index=0, 1, ..., 255
    // address 中断处理程序的起始地址
    // DPL     中断描述符的特权级
    void setInterruptDescriptor(uint32 index, uint32 address, byte DPL);
};

#endif

使用C++的一个好处是我们可以把对操作系统内核的模块划分显式地用一个个的class表现出来。

我们在include/os_type.h定义了基本的数据类型的别名,如下所示。

#ifndef OS_TYPE_H
#define OS_TYPE_H

// 类型定义
typedef unsigned char byte;
typedef unsigned char uint8;

typedef unsigned short uint16;
typedef unsigned short word;

typedef unsigned int uint32;
typedef unsigned int uint;
typedef unsigned int dword;

#endif

在使用中断之前,我们首先需要初始化IDT,承担起这项工作的函数是InterruptManager::initialize,如下所示。

void InterruptManager::initialize()
{
    // 初始化IDT
    IDT = (uint32 *)IDT_START_ADDRESS;
    asm_lidt(IDT_START_ADDRESS, 256 * 8 - 1);

    for (uint i = 0; i < 256; ++i)
    {
        setInterruptDescriptor(i, (uint32)asm_interrupt_empty_handler, 0);
    }
}

InterruptManager::initialize先设置IDTR,然后再初始化256个中断描述符,下面我们分别来看。

我们不妨将IDT设定在地址0x8880处,即IDT_START_ADDRESS=0x8880

为了使CPU能够找到IDT中的中断处理函数,我们需要将IDT的信息放置到寄存器IDTR中。当中断发生时,CPU会自动到IDTR中找到IDT的地址,然后根据中断向量号在IDT找到对应的中断描述符,最后跳转到中断描述符对应的函数中进行处理,IDTR的结构如下。

IDTR

由于我们只有256个中断描述符,每个中断描述符的大小均为8字节,因此我们有 $$ 表界限=8*256-1=2047 $$ 此时,IDTR的32位基地址是0x8880,表界限是2047

确定了IDT的基地址和表界限后,我们就可以初始化IDTR了。IDTR的初始化需要用到指令lidt,其用法如下。

lidt [tag]

lidt实际上是将以tag为起始地址的48字节放入到寄存器IDTR中。由于我们打算在C代码中初始化IDT,而C语言的语法并未提供lidt语句。因此我们需要在汇编代码中实现能够将IDT的信息放入到IDTR的函数asm_lidt,代码放置在src/utils/asm_utils.asm中,如下所示。

; void asm_lidt(uint32 start, uint16 limit)
asm_lidt:
    push ebp
    mov ebp, esp
    push eax

    mov eax, [ebp + 4 * 3]
    mov [ASM_IDTR], ax
    mov eax, [ebp + 4 * 2]
    mov [ASM_IDTR + 2], eax
    lidt [ASM_IDTR]

    pop eax
    pop ebp
    ret
    
ASM_IDTR dw 0
      dd 0

将IDT的信息放入到IDTR后,我们就可以插入256个默认的中断处理描述符到IDT中。

为什么要插入默认的中断描述符呢?因为如果不插入中断描述符,那么在后续的实验过程中,如果发生一些没有中断处理程序的中断,那么内核出现故障,终止运行(abort)。此时,我们很难定位错误发生的具体位置。这一点在debug过程中是非常令人沮丧的。

实际上在我们的实验中,对于中断描述符,有几个值是定值。

  • P=1表示存在。
  • D=1表示32位代码。
  • DPL=0表示特权级0.
  • 代码段选择子等于bootloader中的代码段选择子,也就是寻址4GB空间的代码段选择子。

因此,从目前来看,不同的中断描述符间变化的只是中断处理程序在目标代码段中的偏移。由于我们的程序运行在平坦模式下,也就是段起始地址从内存地址0开始,长度为4GB。此时,函数名就是中断处理程序在目标代码段中的偏移。

我们将段描述符的设置定义在函数InterruptManager::setInterruptDescriptor中,如下所示。

// 设置中断描述符
// index   第index个描述符,index=0, 1, ..., 255
// address 中断处理程序的起始地址
// DPL     中断描述符的特权级
void InterruptManager::setInterruptDescriptor(uint32 index, uint32 address, byte DPL)
{
    IDT[index * 2] = (CODE_SELECTOR << 16) | (address & 0xffff);
    IDT[index * 2 + 1] = (address & 0xffff0000) | (0x1 << 15) | (DPL << 13) | (0xe << 8);
}

其中,IDT是中断描述符表的起始地址指针,实际上我们可以认为中断描述符表就是一个数组。在InterruptManager中,我们将变量IDT视作是一个uint32类型的数组。由于每个中断描述符的大小是两个uint32,第index个中断描述符是IDT[2 * index],IDT[2 * index + 1]

注意,这里同学们需要对C语言中的指针运算非常熟悉,为了帮助同学们回忆起在大一时已经熟练掌握的指针,我们下面简单回忆一下。

  1. 指针和数字变量的加减法并不是在指针的值上加上或减去一个数值,而是要将指针指向的数据类型考虑进来。
  2. 任何指针都可以赋值为void *类型的指针,void *类型的指针可以转化为任何类型的指针。
  3. 指针的值本质就是地址。

对于第一点,我们考虑下面这个例子。

int *ptr1;
int *ptr2;
char *ptr3;
char *ptr4;

int x;
char y;

ptr1 = &x;
ptr2 = ptr1 + 2;

ptr3 = &y;
ptr4 = ptr3 + 2;

为了不引起歧义,我们做如下约定。

  • sizeof(int)=4,sizeof(char)=1
  • &x = 200, &y = 2000(200是x的起始地址,2000是y的起始地址,200和2000是十进制表示)。

因此,我们有ptr1 = 200, ptr2 = 208, ptr3 = 2000, ptr4 = 2002

此时,同学们应该明白第一点的具体含义——当指针加上或减去一个数值时,加上或减去的是这个数值乘以指针指向的数据类型的大小。对于[]运算符和指针ptr1ptr1[2]实际上表示的是*(ptr1 + 2),也就是*ptr2——位于地址0x208处的int类型变量。

对于第三点,我们考虑语句IDT = (uint32 *)IDT_START_ADDRESS;。正是因为指针的本质就是地址,我们才可以把一个地址转换成指针类型uint32 *。而这个地址的具体含义,取决于我们看待这个地址的方式,即指针指向的数据类型。对于地址0x200,如果我们令int *ptr = (int *)0x200,那么0x200就是一个int类型变量的起始地址;如果我们以ptr[3],ptr[8]的方式来使用,那么ptr就是一个数组。注意到数组名实际上是指针常量(注意指针常量和常量指针的区别);如果我们令char *ptr = (char *)0x200,那么0x200就是一个char类型变量的起始地址;但是,如果我们令void *ptr = (void *)0x200,此时*ptr是不被允许的,因为我们不知道以何种方式来看待地址0x200

如果读者明白了第三点,读者也就能明白第二点。

接下来,我们定义一个默认的中断处理函数是asm_interrupt_empty_handler,放置在src/utils/asm_utils.asm中,如下所示。

ASM_UNHANDLED_INTERRUPT_INFO db 'Unhandled interrupt happened, halt...'
                             db 0

; void asm_unhandled_interrupt()
asm_unhandled_interrupt:
    cli
    mov esi, ASM_UNHANDLED_INTERRUPT_INFO
    xor ebx, ebx
    mov ah, 0x03
.output_information:
    cmp byte[esi], 0
    je .end
    mov al, byte[esi]
    mov word[gs:bx], ax
    inc esi
    add ebx, 2
    jmp .output_information
.end:
    jmp $

asm_interrupt_empty_handler首先关中断,然后输出提示字符串,最后做死循环。

InterruptManager::initialize最后,我们调用setInterruptDescriptor放入256个默认的中断描述符即可,这256个默认的中断描述符对应的中断处理函数是asm_unhandled_interrupt

for (uint i = 0; i < 256; ++i)
{
	setInterruptDescriptor(i, (uint32)asm_unhandled_interrupt, 0);
}

最后,我们在函数src/kernel/setup_kernel.cpp中定义并初始化中断处理器。注意,我们只会定义一个InterruptManager的实例,因为中断管理器有且只有一个。

... // 头文件的包含
    
// 中断管理器
InterruptManager interruptManager;

extern "C" void setup_kernel()
{
    // 中断处理部件
    interruptManager.initialize();
    // 死循环
    asm_halt();
}

然后我们在include/os_modules.h中声明这个实例,以便在其他cpp文件中使用。

#ifndef OS_MODULES_H
#define OS_MODULES_H

#include "interrupt.h"

extern InterruptManager interruptManager;

#endif

为什么要在InterruptManager中定义initialize函数呢?因为我们将这些模块定义为一个全局变量,而在操作系统运行后,这些全局变量的构造函数不会被自动调用,而我们又需要初始化这些模块,因此我们需要定义一个显式的初始化函数。事实上,对于后面的每一个可能用作全局变量的类,我们都需要显式地提供这样一个初始化函数。

最后,我们将一些常量统一定义在文件include/os_constant.h下。

#ifndef OS_CONSTANT_H
#define OS_CONSTANT_H

#define IDT_START_ADDRESS 0x8880
#define CODE_SELECTOR 0x20

#endif

由于我们之前在makefile中写了可以自动找到项目文件夹下的所有.cpp文件的语句,因此在example 3中,我们虽然增加了src/kernel/interrupt.cpp文件,我们也不需要修改makefile也可以编译。从这一点上来说,使用makefile编译的便利性便能很好地体现出来了。然后我们使用如下语句编译。

make

在qemu的debug模式下加载运行。

make debug

我们在gdb下使用x/256gx 0x8880命令可以查看我们是否已经放入默认的中断描述符,如下所示。

example-3

可以验证,上面的输出结果符合我们的预期。

初始化IDT后,我们尝试触发除0异常来验证asm_unhandled_interrupt是否可以正常工作。我们修改setup.cpp即可。

#include "asm_utils.h"
#include "interrupt.h"

// 中断管理器
InterruptManager interruptManager;

extern "C" void setup_kernel()
{
    // 中断处理部件
    interruptManager.initialize();

    // 尝试触发除0错误
    int a = 1 / 0;

    // 死循环
    asm_halt();
}

然后使用如下语句编译运行。

make && make run

我们可以看到中断被正常调用。

example-3-1

至此,我们已经完成了IDT的初始化。

8259A芯片

介绍

我们已经知道,现代操作系统是中断驱动的,操作系统需要时刻准备处理来自磁盘、鼠标和键盘等外设的中断请求。

来自硬件的中断被称为硬中断,我们在代码中使用int指令调用的中断被称为软中断。但是二者只是调用方式不同,而中断的初始化和中断描述符的设置方式等是完全相同的。

但是,计算机需要知道这些中断请求的中断向量号和以何种优先级来处理同时到来的中断请求。刚刚提到的问题是通过8259A芯片来解决的,8259A芯片又被称为可编程中断控制器(PIC: Programmable Interrupt Controller)。可编程的意思是说,我们可以通过代码来修改8259A的处理优先级、屏蔽某个中断等。在PC中,8259A芯片有两片,f分别被称为主片和从片。其结构如下。

8259A

每个8259A都有8根中断请求信号线,IRQ0-IRQ7,默认优先级从高到低。这些信号线与外设相连,外设通过IRQ向8259A芯片发送中断请求。由于历史原因,从片默认是连接到主片的IRQ2的位置。为了使8259A芯片可以正常工作,我们必须先要对8259A芯片初始化。注意到,主片的IRQ1的位置是键盘中断的位置。此时,熟悉实模式的读者可能会产生疑问:在实模式下即使不进行8259A芯片的相关操作,也可以使用int指令来调用中断。实际上,实模式也是需要操作8259A芯片的,只不过BIOS帮我们做了这个工作。同学们需要特别注意,在保护模式下原先的实模式中断不可以被使用。此时,我们不得不去编程8259A芯片来实现保护模式下的中断程序。

下面我就来学习如何对8259A芯片进行编程。

8259A的初始化

在使用8259A芯片之前我们需要对8259A的两块芯片进行初始化。初始化过程是依次通过向8259A的特定端口发送4个ICW,ICW1~ICW4(初始化命令字,Initialization Command Words)来完成的。四个ICW必须严格按照顺序依次发送。

下面是四个ICW的结构。

  • ICW1。发送到0x20端口(主片)和0xA0端口(从片端口)。

    ICW1
    • I位:若置1,表示ICW4会被发送。置0表示ICW4不会被发送。我们会发送ICW4,所以I位置1。

    • C位:若置0,表示8259A工作在级联环境下。8259A的主片和从片我们都会使用到,所以C位置0。

    • M位:指出中断请求的电平触发模式,在PC机中,M位应当被置0,表示采用“边沿触发模式”。

  • ICW2。发送到0x21(主片)和0xA1(从片)端口。

    ICW2

    对于主片和从片,ICW2都是用来表示当IRQ0的中断发生时,8259A会向CPU提供的中断向量号。此后,IRQ0,IRQ1,...,IRQ7的中断号为ICW2,ICW2+1,ICW2+2,...,ICW+7。其中,ICW2的低3位必须是0。这里,我们置主片的ICW2为0x20,从片的ICW2为0x28。

  • ICW3。发送到0x21(主片)和0xA1(从片)端口。

    ICW3只有在级联工作时才会被发送,它主要用来建立两处PIC之间的连接,对于主片和从片,其结构是不一样的,主片的结构如下所示。

    ICW3从片

    上面的相应位被置1,则相应的IRQ线就被用作于与从片相连,若置0则表示被连接到外围设备。前面已经提到,由于历史原因,从片被连接到主片的IRQ2位,所以,主片的ICW3=0x04,即只有第2位被置1。

    从片的结构如下。

    ICW3从片

    IRQ指出是主片的哪一个IRQ连接到了从片,这里,从片的ICW3=0x02,即IRQ=0x02,其他位置均为0。

  • ICW4。发送到0x21(主片)和0xA1(从片)端口。

    ICW4
    • EOI位:若置1表示自动结束,在PC位上这位需要被清零,详细原因在后面再提到。

    • 80x86位:置1表示PC工作在80x86架构下,因此我们置1。

到这里,读者已经发现,其实ICW1,ICW3,ICW4的值已经固定,可变的只有ICW2。

8259A的工作流程

此部分内容不需要掌握,只需要记住“对于8259A芯片产生的中断,我们需要手动在中断返回前向8259A发送EOI消息。如果没有发送EOI消息,那么此后的中断便不会被响应。”这句话即可。

首先,一个外部中断请求信号通过中断请求线IRQ传输到IMR(中断屏蔽器),IMR根据所设定的中断屏蔽字来决定是保留还是丢弃。如果被保留,8259A将IRR(请求暂存器)中代表此IRQ的相应位置位,表示此IRQ有中断请求信号。然后向CPU的INTR(中断请求)管脚发送一个信号。但是,CPU不会立即响应该中断,而是执行完当前指令后检查INTR管脚是否有信号。如果有信号,CPU就会转到中断服务。此时,CPU会向8259A的INTA(中断应答)管脚发送一个信号。8259A收到信号后,通过判优部件在IRR中挑选出优先级最高的中断,并将ISR(中断服务寄存器)中代表该中断的相应位置位和将IRR中的相应位清零,表明此中断正在接受CPU的处理请求。同时,将它的编号写入IVR(中断向量寄存器)的低3位,高位内容和ICW2的对应位内容一致。这就是为什么ICW2的低3位必须为0。这时,CPU还会送来第2个INTA信号。当8259A收到信号后就将IVR的内容发往CPU的数据线。当中断号被发送后,8259A就会检测ICW4的EOI位是否被置位。如果EOI位被置位,表示自动结束,则芯片就会自动将ISR的相应位清0。如果EOI没有被置位,则需要中断处理程序向芯片发送EOI消息,芯片收到EOI消息后才会将ISR中的相应位清0。我们之前在设置ICW4时,EOI位被置0。因为EOI被设置为自动结束后,只要8259A向CPU发送了中断向量号,ISR的相应位就会被清0。ISR的相应位被清0后,如果有新的中断请求,8259A又可以向CPU发送新的中断向量号。而CPU很有可能正在处理之前的中断,此时,CPU并不知道哪个中断的优先级高。所以,CPU会暂停当前中断转向处理新的中断,导致了优先级低的中断会打断优先级高的中断执行,也就是说,优先级并未发挥作用。所以,我们前面才要将ICW4的EOI位置0。此时,值得注意的是,

对于8259A芯片产生的中断,我们需要手动在中断返回前向8259A发送EOI消息。如果没有发送EOI消息,那么此后的中断便不会被响应。

一个发送EOI消息的示例代码如下,OCW2在后面会介绍。

;发送OCW2字
mov al, 0x20
out 0x20, al
out 0xa0, al

8259A的中断处理函数末尾必须加上面这段代码,否则中断不会被响应。

优先级、中断屏蔽字和EOI消息的动态改变

初始化8259A后,我们便可以在任何时候8259A发送OCW字(Operation Command Words)来实现优先级、中断屏蔽字和EOI消息的动态改变。

OCW有3个,分别是OCW1,OCW2,OCW3,其详细结构如下。

  • OCW1。中断屏蔽,发送到0x21(主片)或0xA1(从片)端口。

    OCW1

    相应位置1表示屏蔽相应的IRQ请求。同学们很快可以看到,在初始化8259A的代码末尾,我们将0xFF发送到0x21和0xA1端口。这是因为我们还没建立起处理8259A芯片的中断处理函数,所以暂时屏蔽主片和从片的所有中断。

  • OCW2。一般用于发送EOI消息,发送到0x20(主片)或0xA0(从片)端口。

    OCW2

    EOI消息是发送0x20,即只有EOI位是1,其他位置为0。

  • OCW3。用于设置下一个读端口动作将要读取的IRR或ISR,我们不需要使用。

中断程序的编写思路

中断处理程序的编写思路如下。

  • 保护现场。现场指的是寄存器的内容,因此在处理中断之前,我们需要手动将寄存器的内容放置到栈上面。待中断返回前,我们会将这部分保护在栈中的寄存器内容放回到相应的寄存器中。
  • 中断处理。执行中断处理程序。
  • 恢复现场。中断处理完毕后恢复之前放在栈中的寄存器内容,然后执行iret返回。在执行iret前,如果有错误码,则需要将错误码弹出栈;如果是8259A芯片产生的中断,则需要在中断返回前发送EOI消息。注意,8259A芯片产生的中断不会错误码。事实上,只有中断向量号1-19的部分中断才会产生错误码。

其代码描述如下。

interrupt_handler_example:
	pushad
	... ; 中断处理程序
	popad
	
	; 非必须
	
	; 1 弹出错误码,没有则不可以加入
	add esp, 4
	
	; 2 对于8259A芯片产生的中断,最后需要发送EOI消息,若不是则不可以加入
	mov al, 0x20
	out 0x20, al
	out 0xa0, al

	iret

注意,中断返回使用的是iret指令。

我们已经学习了8259A芯片的基础知识,我们下面来处理8259A芯片产生的实时钟中断。

Example 4 8259A编程

  • Example 3的代码放置在src/7下,因此下面的文件名和文件夹名使用的是相对地址。
  • Example 4的代码在Example 3的基础上修改。

在Example 4中,我们会对8529A芯片进行编程,添加处理实时钟中断的函数,函数在第一行显示目前中断发生的次数。

我们为中断控制器InterruptManager加入如下成员变量和函数。

class InterruptManager
{
private:
    uint32 *IDT;              // IDT起始地址
    
    uint32 IRQ0_8259A_MASTER; // 主片中断起始向量号
    uint32 IRQ0_8259A_SLAVE;  // 从片中断起始向量号

public:
    InterruptManager();
    void initialize();
    // 设置中断描述符
    // index   第index个描述符,index=0, 1, ..., 255
    // address 中断处理程序的起始地址
    // DPL     中断描述符的特权级
    void setInterruptDescriptor(uint32 index, uint32 address, byte DPL);
    
    // 开启时钟中断
    void enableTimeInterrupt();
    // 禁止时钟中断
    void disableTimeInterrupt();
    // 设置时钟中断处理函数
    void setTimeInterrupt(void *handler);

private:
    // 初始化8259A芯片
    void initialize8259A();
};

在使用8259A芯片之前,我们首先要对其初始化,初始化的代码放置在成员函数initialize8259A中,如下所示。

void InterruptManager::initialize8259A()
{
    // ICW 1
    asm_out_port(0x20, 0x11);
    asm_out_port(0xa0, 0x11);
    // ICW 2
    IRQ0_8259A_MASTER = 0x20;
    IRQ0_8259A_SLAVE = 0x28;
    asm_out_port(0x21, IRQ0_8259A_MASTER);
    asm_out_port(0xa1, IRQ0_8259A_SLAVE);
    // ICW 3
    asm_out_port(0x21, 4);
    asm_out_port(0xa1, 2);
    // ICW 4
    asm_out_port(0x21, 1);
    asm_out_port(0xa1, 1);

    // OCW 1 屏蔽主片所有中断,但主片的IRQ2需要开启
    asm_out_port(0x21, 0xfb);
    // OCW 1 屏蔽从片所有中断
    asm_out_port(0xa1, 0xff);
}

初始化8259A芯片的过程是通过设置一系列的ICW字来完成的。由于我们并未建立处理8259A中断的任何函数,因此在初始化的最后,我们需要屏蔽主片和从片的所有中断。

其中,asm_out_port是对out指令的封装,放在asm_utils.asm中,如下所示。

; void asm_out_port(uint16 port, uint8 value)
asm_out_port:
    push ebp
    mov ebp, esp

    push edx
    push eax

    mov edx, [ebp + 4 * 2] ; port
    mov eax, [ebp + 4 * 3] ; value
    out dx, al
    
    pop eax
    pop edx
    pop ebp
    ret

接下来我们来处理时钟中断,我们处理的时钟中断是主片的IRQ0中断。在计算机中,有一个称为8253的芯片,其能够以一定的频率来产生时钟中断。当其产生了时钟中断后,信号会被8259A截获,从而产生IRQ0中断。处理时钟中断并不需要了解8253芯片,只需要对8259A芯片产生的时钟中断进行处理即可,步骤如下。

  • 编写中断处理函数。
  • 设置主片IRQ0中断对应的中断描述符。
  • 开启时钟中断。
  • 开中断。

我们首先编写中断处理的函数。

此时,我们需要对屏幕进行输出,之前我们只是单纯地往显存地址上赋值来显示字符。但是这样做并不太方便,我们希望能够像printf和putchar这样的函数来调用。因此,我们下面简单封装一个能够处理屏幕输出的类STDIO,声明放置在文件include/stdio.h中,如下所示。

#ifndef STDIO_H
#define STDIO_H

#include "os_type.h"

class STDIO
{
private:
    uint8 *screen;

public:
    STDIO();
    // 初始化函数
    void initialize();
    // 打印字符c,颜色color到位置(x,y)
    void print(uint x, uint y, uint8 c, uint8 color);
    // 打印字符c,颜色color到光标位置
    void print(uint8 c, uint8 color);
    // 打印字符c,颜色默认到光标位置
    void print(uint8 c);
    // 移动光标到一维位置
    void moveCursor(uint position);
    // 移动光标到二维位置
    void moveCursor(uint x, uint y);
    // 获取光标位置
    uint getCursor();

public:
    // 滚屏
    void rollUp();
};

#endif

代码实现放置在src/kernel/stdio.cpp

三个重载的print是直接向显存写入字符和颜色,比较简单,因此不再赘述。

下面我们看看如何处理光标,光标就是屏幕上一直在闪烁的横杠。屏幕的像素为25*80,所以光标的位置从上到下,从左到右依次编号为0-1999,用16位表示。与光标读写相关的端口为0x3d40x3d5,在对光标读写之前,我们需要向端口0x3d4写入数据,表明我们操作的是光标的低8位还是高8位。写入0x0e,表示操作的是高8位,写入0x0f表示操作的是低8位。如果我们需要需要读取光标,那么我们从0x3d5从读取数据;如果我们需要更改光标的位置,那么我们将光标的位置写入0x3d5。如下所示。

void STDIO::moveCursor(uint position)
{
    if (position >= 80 * 25)
    {
        return;
    }

    uint8 temp;

    // 处理高8位
    temp = (position >> 8) & 0xff;
    asm_out_port(0x3d4, 0x0e);
    asm_out_port(0x3d5, temp);

    // 处理低8位
    temp = position & 0xff;
    asm_out_port(0x3d4, 0x0f);
    asm_out_port(0x3d5, temp);
}

uint STDIO::getCursor()
{
    uint pos;
    uint8 temp;

    pos = 0;
    temp = 0;
    // 处理高8位
    asm_out_port(0x3d4, 0x0e);
    asm_in_port(0x3d5, &temp);
    pos = ((uint)temp) << 8;

    // 处理低8位
    asm_out_port(0x3d4, 0x0f);
    asm_in_port(0x3d5, &temp);
    pos = pos | ((uint)temp);

    return pos;
}

其中,asm_in_port是对in指令的封装,代码放置在asm_utils.asm中,如下所示。

; void asm_in_port(uint16 port, uint8 *value)
asm_in_port:
    push ebp
    mov ebp, esp

    push edx
    push eax
    push ebx

    xor eax, eax
    mov edx, [ebp + 4 * 2] ; port
    mov ebx, [ebp + 4 * 3] ; *value

    in al, dx
    mov [ebx], al

    pop ebx
    pop eax
    pop edx
    pop ebp
    ret

STDIO::print的实现中,我们向光标处写入了字符并移动光标到下一个位置。特别地,如果过光标超出了屏幕的范围,即字符占满了整个屏幕,我们需要向上滚屏,然后将光标放在(24,0)处。滚屏实际上就是将第2行的字符放到第1行,第3行的字符放到第2行,以此类推,最后第24行的字符放到了第23行,然后第24行清空,光标放在第24行的起始位置。

实现滚屏的函数是STDIO::rollUp,如下所示。

void STDIO::rollUp()
{
    uint length;
    length = 25 * 80;
    for (uint i = 80; i < length; ++i)
    {
        screen[2 * (i - 80)] = screen[2 * i];
        screen[2 * (i - 80) + 1] = screen[2 * i + 1];
    }

    for (uint i = 24 * 80; i < length; ++i)
    {
        screen[2 * i] = ' ';
        screen[2 * i + 1] = 0x07;
    }
}

接下来,我们定义中断处理函数c_time_interrupt_handler。由于我们需要显示中断发生的次数,我们需要在src/kernel/interrupt.cpp中定义一个全局变量来充当计数变量,如下所示。

int times = 0;

中断处理函数c_time_interrupt_handler如下所示。

// 中断处理函数
extern "C" void c_time_interrupt_handler()
{
    // 清空屏幕
    for (int i = 0; i < 80; ++i)
    {
        stdio.print(0, i, ' ', 0x07);
    }

    // 输出中断发生的次数
    ++times;
    char str[] = "interrupt happend: ";
    char number[10];
    int temp = times;

    // 将数字转换为字符串表示
    for(int i = 0; i < 10; ++i ) {
        if(temp) {
            number[i] = temp % 10 + '0';
        } else {
            number[i] = '0';
        }
        temp /= 10;
    }

    // 移动光标到(0,0)输出字符
    stdio.moveCursor(0);
    for(int i = 0; str[i]; ++i ) {
        stdio.print(str[i]);
    }

    // 输出中断发生的次数
    for( int i = 9; i > 0; --i ) {
        stdio.print(number[i]);
    }
}

c_time_interrupt_handler首先清空第一行的字符,然后对计数变量times递增1,并将其转换成字符串。我相信,同学们在大一上时已经熟练掌握如何将一个任意进制的数字转换成字符串表示的方法,这里不再赘述。最后再将要显示的字符串打印出来即可。

上面这个函数还不完全是一个中断处理函数,因为我们进入中断后需要保护现场,离开中断需要恢复现场。这里,现场指的是寄存器的内容。但是,C语言并未提供相关指令。最重要的是,中断的返回需要使用iret指令,而C语言的任何函数编译出来的返回语句都是ret。因此,我们只能在汇编代码中完成保护现场、恢复现场和中断返回。

整理下我们的思路,从而得到一个中断处理函数的实现思路。

由于C语言缺少可以编写一个完整的中断处理函数的语法,因此当中断发生后,CPU首先跳转到汇编实现的代码,然后使用汇编代码保存寄存器的内容。保存现场后,汇编代码调用call指令来跳转到C语言编写的中断处理函数主体。C语言编写的函数返回后,指令的执行流程会返回到call指令的下一条汇编代码。此时,我们使用汇编代码恢复保存的寄存器的内容,最后使用iret返回。

一个完整的时钟中断处理函数如下所示,代码保存在asm_utils.asm中。

asm_time_interrupt_handler:
    pushad
    
    nop ; 否则断点打不上去
    ; 发送EOI消息,否则下一次中断不发生
    mov al, 0x20
    out 0x20, al
    out 0xa0, al
    
    call c_time_interrupt_handler

    popad
    iret

其中,pushad指令是将EAX,ECX,EDX,EBX,ESP,EBP,ESI,EDI依次入栈,popad则相反。注意,对于8259A芯片产生的中断,我们需要在中断返回前发送EOI消息。否则,8259A不会产生下一次中断。

编写好了中断处理函数后,我们就可以设置时钟中断的中断描述符,也就是主片IRQ0中断对应的描述符,如下所示。

void InterruptManager::setTimeInterrupt(void *handler)
{
    setInterruptDescriptor(IRQ0_8259A_MASTER, (uint32)handler, 0);
}

然后我们封装一下开启和关闭时钟中断的函数。关于8259A上的中断开启情况,我们可以通过读取OCW1来得知;如果要修改8259A上的中断开启情况,我们就需要先读取再写入对应的OCW1。

void InterruptManager::enableTimeInterrupt()
{
    uint8 value;
    // 读入主片OCW
    asm_in_port(0x21, &value);
    // 开启主片时钟中断,置0开启
    value = value & 0xfe;
    asm_out_port(0x21, value);
}

void InterruptManager::disableTimeInterrupt()
{
    uint8 value;
    asm_in_port(0x21, &value);
    // 关闭时钟中断,置1关闭
    value = value | 0x01;
    asm_out_port(0x21, value);
}

最后,我们在setup_kernel中定义STDIO的实例stdio,最后初始化内核的组件,然后开启时钟中断和开中断。

extern "C" void setup_kernel()
{
    // 中断处理部件
    interruptManager.initialize();
    // 屏幕IO处理部件
    stdio.initialize();
    interruptManager.enableTimeInterrupt();
    interruptManager.setTimeInterrupt((void *)asm_time_interrupt_handler);
    asm_enable_interrupt();
    asm_halt();
}

我们在include/os_modules.h声明这个实例。

#ifndef OS_MODULES_H
#define OS_MODULES_H

#include "interrupt.h"

extern InterruptManager interruptManager;
extern STDIO stdio;

#endif

开中断需要使用sti指令,如果不开中断,那么CPU不会响应可屏蔽中断。也就是说,即使8259A芯片发生了时钟中断,CPU也不会处理。开中断指令被封装在函数asm_enable_interrupt中,如下所示。

; void asm_enable_interrupt()
asm_enable_interrupt:
    sti
    ret

现在我们编译和运行代码。

make && make run

最后加载qemu运行,效果如下,第一行显示了中断发生的次数。

example-4

课后思考题(不需要完成)

  1. 请用自己的话描述C代码到C程序的过程。

  2. 请根据一个C语言的函数编译成汇编代码后的结构来说明C/C++的函数调用规则。

  3. 请说说C和汇编是如何结合起来的,它们能够结合的依据又是什么。

  4. 在assignment-2中,我们为什么要单独将entry.obj单独分离出来。

  5. 我们在操作系统学习中已经知道,CPU按如下步骤处理中断。

    • 关中断。CPU关闭中断,即不再接受其他外部中断请求。

    • 保存断点。将发生中断处的指令地址压入堆栈,以使中断处理完后能正确的返回

    • 识别中断源。CPU识别中断的来源,确定中断类型号,从而找到相应的中断处理程序的入口地址

    • 保存现场。将发生中断处的有关寄存器以及标志寄存器的内容压入堆栈。

    • 执行中断服务程序。转到中断服务程序入口开始执行,可在适时时刻重新开放中断,以便允许响应较高优先级的外部中断。

    • 恢复现场并返回。把“保护现场”时压入堆栈的信息弹回寄存器,然后执行中断返回指令,从而返回主程序继续运行。

    请问事实是否确实如此?请将上述过程分别对应到assignment-3的代码实现来说明。

  6. 请谈谈你对“指针的本质就是地址”这种观点的看法。

  7. 请复现assignment-3。

  8. 实际上,在保护模式中,除了中断门(interrupt gate)之外还有陷阱门(trap gate),请问这两者有什么区别。

  9. 请复现assignment-4。

  10. 请用自己的话复述时钟中断处理的代码实现过程。

  11. 请谈谈你对本教程的看法。

  12. 请使用时钟中断来在屏幕的第一行实现一个跑马灯显示自己学号和英文名的效果,类似于LED屏幕显示的效果。