

# 组成原理

East China University of Science and Technology

# 目录

## Chapter 1

# 指令

### 1.1 引言

指令集 一个给定的计算机体系结构所包含的指令集合

汇编语言和机器语言 前者是编程的书写形式,后者是计算机所能识别的形式

存储程序 多种类型的指令和数据均以数字形式存储在存储器 (内存) 中

MIPS 是一种汇编语言,属于精简指令集

### 1.2 硬件操作

### 1.2.1 MIPS 汇编指令

- 每条 MIPS 算数运算指令只执行一个操作
- 一行写一条命令
- # 后是注释

### 1.2.2 高级语言与编译语言之间的关系

高级语言经过编译器编译, 形成汇编语言.

### 1.3 MIPS 寄存器及常用指令

高级语言的变量数量不受限制,而汇编语言逻辑运算指令的变量对应寄存器,而寄存器数量有限,故变量数量受限.

### 1.3.1 寄存器

- 共有32个寄存器, 编号为0-31
- 32bit数据称为一个"字", 32位为字长, 每个字4字节
- 按字节编址
- 寄存器分类型:
  - \$ZERO: 恒为0
  - \$v0-\$v1: 返回值
  - \$a0-\$a3: 参数
  - \$t0-\$t9: 临时变量, 其中\$t0-\$t7对应编号8-15, \$t8-\$t9对应编号24-25, 无需压栈
  - \$s0-\$s7: 保留变量, 对应编号16-23, 必须压栈
  - \$gp: 静态数据的全局指针
  - \$sp: 栈指针
  - \$fp: 帧指针
  - \$ra: 返回地址

### 1.3.2 常见指令

复杂的数据结构(数组等)存储于存储器中,需要用数据传输指令交换数据:

- lw rt, shamt(rs): 取数
- sw rs, shamt(rt): 存数

数据被存储到寄存器后,可以进行相加减:

- add rd, rs, rt: 加法
- sub rd, rs, rt: 减法

我们经常要在加减运算的时候用到常数,这样就会导致计算机会去内存中取出这个常数存储到寄存器这一多余的步骤,可以通过立即数以除去这一过程:

- addi rt, rs, constant: 加立即数
- -addi rt, rs, constant: 没有减立即数, 用这个替代

特殊的,如果我们要进行寄存器间的赋值,可以通过add或者addi实现:

- add rd, rs, \$ZERO: 将rs赋值给rd
- addi rt, rs, 0: 将rs赋值给rt

### 1.4 MIPS 指令格式

指令包含操作码和地址码.

### 1.4.1 R 型指令

| op rs rt rd shamt funct |
|-------------------------|
|-------------------------|

### 他们的作用:

• op: 操作码

• rs: 第一个源寄存器号

• rt: 第二个源寄存器号

• rd: 目标寄存器号

• shamt: 位移量

• funct: 功能码 (与op一起起作用)

他们的位数:

• op: 6位, 因为有64种指令

• rs,rt,rd: 5位,因为有32个寄存器

• shamt: 5位, 因为 MIPS 是32位指令

• funct: 6位, 因为32-6-5-5-5=6

上述操作码可以查询表格, 寄存器号需要记忆, 下面也一样.

### 1.4.2 I 型指令

| op rs | rt | constant or address |
|-------|----|---------------------|
|-------|----|---------------------|

#### 他们的作用:

• op: 操作码

• rs: 源寄存器号

• rt: 目标寄存器号

• constant or address: 偏移量

他们的位数:

• op: 6位, 因为有64种指令

• rs,rt: 5位, 因为有32个寄存器

• constant or address: 16位, 因为32-6-5-5=16

### 1.4.3 J 型指令

op address

他们的作用:

• op: 操作码

• address: 地址

他们的位数:

• op: 6位, 因为有64种指令

• address: 26位, 因为32-6=26

### 1.5 MIPS 逻辑操作

### 1.5.1 指令

逻辑移动指令:

- sll rd, rt, shamt: 逻辑左移指令, rt中的数左移shamt位, 空出的位补0, 结果存rd
- srl rd, rt, shamt: 逻辑右移指令, rt中的数右移shamt位, 空出的位补0, 结果存rd 上述指令为 R 型指令, 其中op都为0, func分别为0和6, shamt为位移量, rs不使用为 0. 逻辑运算指令:
- add rd, rs, rt: 逻辑与指令, rs和rt按位与, 结果存rd
- or rd, rs, rt: 逻辑或指令, rs和rt按位或, 结果存rd
- nor rd, rs, rt: 逻辑或非指令, rs和rt按位或非, 结果存rd 上述指令为 R 型指令, op都为0, func分别为20,25,27, shamt全为0.

### 1.6 MIPS 决策指令

### 1.6.1 指令

bne和beq指令:

- beq rs, rt, L1: 如果rs=rt跳转到标签为L1的指令
- bne rs, rt, L1: 如果rs!=rt跳转到标签为L1的指令
- j L1: 无条件转移到标签为L1的指令

前两条为 I 型指令, op分别为4,5,2. 最后一条指令为 J 型指令. slt和slti指令:

- slt \$rd, \$rs, \$rt: 若rs<rt, 则rd=1, 否则rd=0
- slti \$rt, \$rs, constant: 若rs<constant, 则rd=1, 否则rd=0

### 1.6.2 条件分支代码转 MIPS

将以下代码:

```
1 # f,g,h,i,j存储于$s0,$s1,$s2,$s3,$s4
2 if (i == j) f = g + h;
3 else f = g - h;
```

#### 转换为 MIPS:

```
bne $s3, $s4 ELSE
add $s0, $s1, $s2

j EXIT
ELSE: $s0, $s1, $s2

EXIT: ...
```

### 1.6.3 循环代码转 MIPS

将以下代码:

```
while (save[i] == k) i += 1; # i存于$s3, k存于$s5, save的基址存于$s6
```

转为 MIPS:

```
1 LOOP: sll $t0, $s3, 2 # $t0 = i * 4, 找到地址
2 add $t0, $s6, $t0 # $t0 = 基址 + 偏移量
3 lw $t1, 0($t0) # 从内存中取出数存到$t1
bne $t1, $s5, EXIT # 若和k不相等退出
```

```
5 addi $s3, $s3, 1 # 循环体
6 j LOOP # 实现循环
7 EXIT: ...
```

### 1.7 MIPS 函数

### 1.7.1 指令

• jal Address: 跳转到函数地址, 并将PC+4存储于\$ra以便返回断点处

• jr \$ra: 返回断点处

### 1.7.2 栈

我们使用任何寄存器需要保存它原来的值 (类似于中断保存现场), 用完了再把原来的值放回去, 因为寄存器的数量是有限的.

一般来说, \$s开头的寄存器必须压栈, \$t/\$a开头的寄存器不必压栈.

#### 压栈和出栈

由于栈的增长是按地址从高到低的顺序进行的, 所以出栈和入栈的操作分别为:

1. 入栈 (push): \$sp=\$sp-4

2. 出栈 (pop): \$sp=\$sp+4

### 1.7.3 函数代码转 MIPS

将以下代码:

```
int leaf_example (int g, h, i, j)

int f;

int f;

f = (g + h) - (i + j);

return f;

}
```

转换为 MIPS:

```
1 # 入栈
2 addi $sp, $sp, -12
3 sw $t1, 8($sp)
4 sw $t0, 4($sp)
5 sw $s0, 0($sp)
```

```
6 # 运算
7 add $t0, $a0, $a1
8 add $t1, $a2, $a3
9 add $s0, $t0, $t1
10 addi $v0, $s0, $ZERO # 将结果$s0放到函数返回值寄存器$v0
11 # 出栈
12 lw $s0, 0($sp)
13 lw $t0, 4($sp)
14 lw $t1, 8($sp)
15 addi $sp, $sp, 12
16 # 返回
17 jr $ra
```

### 1.8 MIPS 嵌套

不调用其他过程的过程称为**叶过程**, 嵌套调用就是过程体中调用其他的过程 (甚至包括自己) 首先要知道, 递归分为两个阶段: 递归阶段和返回阶段.

假设主程序将参数3传入寄存器\$a0, 然后使用jal A调用过程A. 再假设过程A通过jal B调用过程B, 参数为7, 同样存入\$a0. 由于A尚未完成任务, 所以寄存器\$a0的使用上存在冲突. 同样, 在寄存器\$ra保存的返回地址上也存在冲突, 因为它现在保存的是B的返回地址. 所以我们必须采用压栈的方式对数据进行保存:

Caller 把所有在返回阶段需要用到的参数寄存器 (\$a0-\$a3) 或临时寄存器\$t0-\$t9压栈. Callee 把将所有在返回阶段要用到的返回地址寄存器\$ra和保存寄存器\$s0-\$s7都压栈. 栈指针\$sp会随诊栈中寄存器的个数调整. 到返回的时候, 寄存器就会从存储器中恢复, 栈指针也会重新调整.

### 1.8.1 递归代码转 MIPS

将以下代码:

```
int fact(int n)
{
    if (n < 1) return (1);
    else return (n * fact(n - 1));
}</pre>
```

转换为 MIPS:

```
fact:
    addi $sp, $sp, -8

sw $ra, 4($sp)

sw $a0, 0($sp)
```

```
5
      slti $t0, $a0, 1
      beq $t0, $ZERO, L1
6
7
      addi $v0, $ZERO, 1
      addi $sp, $sp, 8
      jr $ra
      # 申请一块大小为8的空间
10
      # 将返回阶段要用到的Caller的返回地址存储到栈
11
      # 将返回阶段要用到的Callee的参数存储到栈
12
      # 如果$a0也就是n大于等于1,则跳到L1
13
      # 如果$a0也就是n小于1,则递归阶段到达最底层,计算0!=1并保存结果
14
      # 由于是最底层函数, 其$ra和$a0不会被下一层调用, 所以可以直接释放栈
15
      # 最底层函数返回
16
  L1:
17
18
      addi $a0, $a0, -1
      jal fact
19
      lw $a0, 0($sp)
20
      lw $ra, 4($sp)
21
      addi $sp, $sp, 8
22
      mul $v0, $a0, $v0
23
      jr $ra
24
      # 设置下一层调用函数的参数为n-1
25
      # 返回fact, 执行fact(n-1)
26
      # 开始返回阶段,将递归阶段存储的$a0取出
27
      # 开始返回阶段,将递归阶段存储的$ra取出
28
      # 释放栈
29
      # 根据刚取出的$a0和$v0相乘
30
      # 函数返回
31
```

过程示意图:



### 1.9 寻址方式

寻址方式就是根据地址找到指令或者操作数的方法. 假设有数据存储在地址为EA的内存中,用()表示内存的内容:

1. 直接寻址: 指令中的形式地址A就是真实地址EA, 即A=EA



2. 间接寻址: 指令中的形式地址A是真实地址的地址,即(A)=EA



3. 寄存器寻址: 指令中的地址是寄存器号Ri, 寄存器中存储了操作数, 即Ri=EA



4. 寄存器间接寻址: 指令中的地址是寄存器号Ri, 寄存器中存储了真实地址EA, 即(Ri)=EA



5. 相对寻址:将程序计数器PC的内容和指令中的形式地址A相加得到真实地址EA,即(PC)+A=EA



6. 基址寻址:将基址寄存器BR的内容和指令中的形式地址A相加得到真实地址EA,即(BR)+A=EA



## Chapter 2

# 运算

### 2.1 进位计数制

### 2.1.1 进位计数法

r进制数,每个数码位可能出现r种字符,逢r进1.

### 2.1.2 不同进制数之间的转换

### r 进制数 → 十进制

各数码位与位权的乘积之和,全为1的二进制转十进制: 2<sup>n-1</sup>

#### 十进制 → r 进制

- 整数部分: 除基取余法, 先取得的"余"是整数的低位 (除r)
- 小数部分: 乘基取整法, 先取得的"整"是消暑的高位 (乘r)

### 二进制 ↔ 八进制

每三个二进制位对应一个八进制位

### 二进制 ↔ 十六进制

每四个二进制位对应一个十六进制位

### 2.2 定点数的表示

### 2.2.1 数的分类

• 有符号数

- 定点数: 小数点位置固定的数
  - \* 定点整数: 纯整数
  - \* 定点小数: 纯小数
- 浮点数: 小数点位置不定的数 (既有整数又有小数)
- 无符号数(如地址)

### 2.2.2 真值和机器数

- 真值: 实际带正负号的数值 (人类习惯的样子)
- 机器数: 把正负号数字化的数 (存到机器里的样子), 包括原码, 反码, 补码, 移码, 他们都是有符号数

### 2.2.3 原码

1. 含义

用尾数表示真值的绝对值, 符号位 "0/1" 对应 "正/负". 若机器字长为n+1位, 则尾数就占n位.

2. 范围

0表示不唯一,([+0]原=0,0000000,[-0]原=1,000000),范围为-2^n-1~2^n-1,n为尾数长度

3. 示例

机器字长为8位,将真值x=-14转换为原码: [x]原=1,0001110(注意:不足的机器字长要补0)

#### 2.2.4 反码

- 1. 含义
  - 正数: 与原码相同
  - 负数: 符号位不变, 数值位取反
- 2. 范围

0表示方法不唯一、([+0] 反=0,0000000, [-0] 反=1,1111111), 范围为-2^n-1~2^n-1,n为尾数长度

3. 示例

机器字长为8位,将真值x=-14转换为反码: [x] 反=1,1110001

#### 2.2.5 补码

1. 含义

先将原码转化为反码, 再将数值位+1.

或者,将原码直接转为补码:从后往前,遇到的第一个1之前不变,后面取反 (符号位不变),反过来补码转原码也是如此.

2. 范围

0的表示方法唯一,([0]=0,0000000,1,0000000用于表示-128),范围为-2<sup>n</sup>-2<sup>n</sup>-1,n为尾数长度

3. 示例

机器字长为8位,将真值x=-14转换为补码:原码为[x]原=1,0001110,从右往左第一个1不变,左边取反,得到补码[x]补=1,1110010

比较这两个数字的大小: 1,11111111和1,0000000,前者大,因为前者转换为真值是1,而后者转化为真值为-128

### 2.2.6 移码

移码与原码, 反码, 补码不同, 他是一种无符号数.

移码 = 真值 + 偏置值, 若机器字长为n+1位, 则偏置值为 $+2^n$ , 当偏置值为+128的时候: 补码 = 补码的符号位取反.

偏置值可以取其他值, 如在IEEE 754中, 单精度浮点数的偏移量为+127, 即+01111111.

### 2.3 定点数的运算

### 2.3.1 移位运算

左移相当于\*2, 右移相当于/2

- 逻辑移位: 无符号数, 当成正数, 补0
- 算术移位: 有符号数, 有正有负
  - 正数: 符号位不参与移位, 原码, 反码, 补码数值位均补0
  - 负数: 符号位不参与移位, 原码补0, 反码补1, 补码如果是左移, 补0; 如果是右移, 补1

左移: 若舍弃的位为1, 将产生严重误差;

右移: 若舍弃的位为1, 将丢失精度.

#### 2.3.2 加减运算

- 原码的加减运算
  - 加法运算
    - \* 正 + 正: 绝对值做加法, 符号位为0
    - \* 负 + 负: 绝对值做加法, 符号位为1
    - \* 正 + 负: 绝对值大的减绝对值小的, 符号位同绝对值大的数
    - \* 负 + 正: 绝对值大的减绝对值小的, 符号位同绝对值大的数

- 减法运算: 减数的符号位取反, 转变为加法
- 补码的加减运算
  - 加法运算: [A+B] 补=[A] 补+[B] 补
  - 减法运算: [A-B] 补=[A] 补+[-B] 补

### 2.4 浮点数的表示和运算

### 2.4.1 浮点数的表示格式

浮点数N=M\*r^E, 其中N为浮点数, M为尾数, E为阶码, r为基数, 二进制的话为2, 上述数字均为十进制.

| 阶符 |
|----|
|----|

### 2.4.2 浮点数的规格化

规格化浮点数: 规定原码尾数的最高位一定要是个 1⇔ |M| 属于[0.5,1], 所以衍生出以下两种规范化的方法:

- 左规: 说明 M<1/2, 太小, 需要扩大, 左移1位将尾数的数值位扩大到原来的2倍, 同时阶码减1
- 右规: 说明 M>1, 太大, 需要缩小, 右移1位将尾数的数值位缩小到原来的1/2倍, 同时阶码加1 尾数可以用原码或者是补码表示, 所以上述左规和右规可以分别用于原码或者补码的规格化:
- 原码: 尾数最高位为1
  - 尾数为正数: 通过左规和右规得到的标准形式应该是0.1XXXXXXXX
  - 尾数为负数: 通过左规和右规得到的标准形式应该是1.1XXXXXXXX

注意,上面尾数可以等于0.5或者是-0.5,只要是0.1000000...和1.1000000...即可. 但是做不到等于1或者-1.此外,他们的数值位第一位都是1,所以在IEEE 754中,数值位的第一位可以默认省略.

- 补码: 尾数最高位与符号位相反
  - 尾数为正数: 通过左规和右规得到的标准形式应该是0.1XXXXXXXXX
  - 尾数为负数: 通过左规和右规得到的标准形式应该是1.0XXXXXXXXX

#### 2.4.3 IEEE 754 标准

| 数符 | 阶码的数值部分-移码 | 尾数的数值部分-原码 |
|----|------------|------------|
|----|------------|------------|

#### 阶码

阶码用移码表示,单精度浮点数下长度为8位.

移码是一种无符号数,由于移码 = 真值 + 偏置值,加完之后大于等于0,所以阶码没有符号位.偏置值和数的类型有关,单精度浮点数的偏置值为+127,双精度浮点数的偏置值为+1023.

#### 尾数

尾数用原码表示, 单精度浮点数下长度为23位.

尾数是一种有符号数,他的符号放在开头,数值部分放在末尾.通过规格化后,数值部分默认隐藏首位1, 所以单精度浮点数下实际能表示的数值位有24位.

### 举例

以-1.75\*2^(-3)为例:

- 数符: 由于是负数, 所以是1.
- 尾数的数值部分: 十进制下是1.75>1, 故需要右归, 尾数的数值部分右移1位, 阶码需要加1, 得到尾数的数值位为0.875即1110000...(共24位), 阶码为-2. 由于尾数的数值位的首位1可以省略, 所以最终尾数的数值位为110000...(共23位).
- 阶码: 经过上述规格化后, 阶码为-2, 加上偏置值+127, 得到移码十进制下为+125, 转换为二进制为01111101.

综上所述, 我们得到的IEEE 754下的表示为: 1,01111101,110000...(共23位).

### 2.4.4 浮点数的加减运算

我们通常在十进制下做浮点数的加减运算.

#### 步骤

- 1. 对阶: 保持阶数一致, 小阶数向大阶数对齐
- 2. 尾数相加/减
- 3. 规格化, 保证尾数M属于[0.5,1]

### 举例

实现0.75\*2^4+1.5\*2^3:

1. 对阶: 小阶 → 大阶, 1.5\*2~3→0.75\*2~4

2. 加减: 0.75\*2^4+0.75\*2^4=1.5\*2^4

3. 规格化: 1.5\*2^4→0.75\*2^5

# Chapter 3

# 存储器

### 3.1 存储器的层次



多级存储器结构

这就是存储器的层次结构. 在pyramid的越上层, 价格越高, 速度越快, 容量越小. 要注意的是, Cache和主存之间的数据交换是由硬件完成的, 对所有程序员透明. 主存和辅存之间的数据交换是由硬件和操作系统共同完成的. 对应用程序员透明.

### 3.2 存储器的分类

- 按层次分类
  - 主存储器: 简称主存, 或者内存. 可以直接和Cache交互
  - 辅助存储器: 简称辅存, 或者外存. 是主存的后援存储器
  - 高速缓冲存储器: 简称Cache. 放在CPU中
- 按存取分类

- 随机存储器: RAM, 可读可写, 存取时间和物理位置无关, 断电丢失数据
  - \* 静态随机存储器: SRAM, 双稳态触发器, 用于Cache
  - \* 动态最急存储器: DRAM, 栅极电容, 用于内存
- 只读存储器: ROM, 只读, 存取时间和物理位置无关, 断电不丢失数据
- 串行访问存储器:存储时间和物理位置有关,如顺序存取存储器(磁带)与直接存取存储器(磁盘, 光盘)
- 按介质分类分为: 磁表面存储器 (磁盘, 磁带), 磁芯存储器, 半导体存储器 (MOS 型存储器, 双极型存储器) 和光存储器 (光盘)
- 按可保存性分类
  - 易失存储器: 断电后, 存储信息消失. 如: RAM
  - 非易失存储器: 断电后, 存储信息依然保持, 如: ROM
  - 破坏性读出: 某个存储单元被读出时, 原存储器信息被破坏
  - 非破坏性读出: 某个存储单元被读出时, 原存储器信息不会被破坏

### 3.3 Cache

Cache是由SRAM构成的,在CPU中的一种存储器.

#### 3.3.1 基本原理

操作系统为了缓和CPU和主存之间的速度矛盾,将某些主存块放到了Cache中,而这个步骤是基于局部性原理:

- 时间局部性: 现在访问的地址, 不久之后也很可能再次被访问
- 空间局部性: 现在访问的地址, 其附近的地址也很可能即将被访问

### 3.3.2 性能分析

CPU访问数据有两种方式: 先访问Cache, 若未命中再访问主存或者是同时访问Cache和主存, 若命中Cache则停止访问主存, 这就引出了Cache的性能衡量标准:

• 命中率

设Cache的总命中次数为a,访问主存的次数为b,则命中率=a/(a+b)

• 缺失率

1-命中率

### 3.3.3 主存到 Cache 的映射

Cache被分成与主存的页框大小一致的Cache块 (或称 Cache 行),两者之间以块为单位进行数据交换. 下面解释了内存中的块应该放在Cache中的哪个位置:

#### 全相联映射

主存的块可以装入Cache的任何块,没有公式.相应的地址结构为:

| 标记 | 块内地址 |
|----|------|
|    |      |

#### 直接映射

主存中的块必须放入下面公式的指定Cache块:

j = i mod 2<sup>c</sup>, 其中j为Cache块号, i为主存块号, 2<sup>c</sup>为Cache的总块数

从上面的映射关系可以看出, 主存块号的低c位正是它要装入的Cache行号. 若主存中用m位表示块号, 则标记 (有效位 + 内存地址高位) 共m-c位, Cache块号共c位, 相应的地址结构为:

| 标记 | Cache块号 | 块内地址 |
|----|---------|------|
|----|---------|------|

### 组相联映射

将Cache分成大小相等的组,主存的一个数据块可以装入一组内的任意位置,即组间采取直接映射,组内采取全相联映射,内存块可以放在下面公式指定的Cache组中:

j = i mod Q, 其中j为Cache块号, i为主存块号, Q为组数

与直接映射相似, 主存块号的低位用来表示组号, 内存块号的高位和有效位用来表示标记, 相应的地址结构为:

| 标记 | 组号 | 块内地址 |
|----|----|------|
|----|----|------|

根据上述的地址结构, 我们应该可以推断出CPU的访存过程:



直接映射

上图为直接映射方式,全相联映射中没有组,行号,内存地址高位低位的概念,他的标记就是有效位 + 内存块号. 组相联映射是一种介于全相联映射和直接映射之间的一种映射.

### 3.3.4 替换算法

由于Cache的空间通常很小, 所以用不到的Cache块就要及时换出, 下面说明上述三种映射中替换算法要解决的问题:

- 全相联映射 Cache满了才需要替换,需要在全局选择替换哪一块
- 直接映射 如果对应位置非空,则毫无选择地直接替换,无需考虑替换算法
- 组相联映射 分组内满了才需要替换,需要在分组内选择替换哪一块

#### 随机算法 (RAND)

若Cache已满,则随机选择一块替换. 实现简单,但是完全没有考虑局部性原理.命中率低,实际效果很不稳定.

### 先进先出算法 (FIFO)

若Cache已满,则替换最先被调入Cache的块。

实现简单, 也是完全没有考虑局部性原理, 会出现抖动现象: 频繁的换入换出现象

### 近期最少使用算法 (LRU)

为每个Cache设置一个"计数器",用于记录每个Cache块已经多久没有被访问了,当Cache满后替换"计数器"最大的.

$$y = |x| = \begin{cases} x, & x \ge 0 \\ -x, & x < 0 \end{cases}$$