







- ❖CPU的功能:控制指令执行
- ❖指令执行过程
  - ▶取指:从指令存储器中读出指令并分析指令
  - ▶取数: 从数据存储器读出操作数
  - ▶执行:完成指令所规定的动作(运算)
- ❖指令执行周期(一般性概念): CPU从指令存储器中读出指令并执行指令功能的全部时间称为指令周期。包括:
  - >取指周期:完成取指令操作和分析指令操作所需时间;
  - ▶取数周期:从数据存储器读出操作数所需时间(包括计算操作数有效地址);
  - ▶执行周期:完成指令所规定的动作(运算)所需时间,因指令 不同而不同。

**3.** 北京航空航天大學

5

### 1.1 CPU的功能与组成

- ❖ CPU所需的功能部件
  - >取指令: 从存储器中读出指令和分析指令(译码)
    - 指令地址部件: 指明当前要读取的指令在存储器中的地址
    - **指令寄存部件**:保存从存储器中取来的指令
    - 译码部件: 对指令进行译码
  - ▶执行指令:实现指令所规定的功能(包括取数和执行)
    - 执行部件: ALU、寄存器等
    - 控制信号逻辑部件: 根据指令的操作性质和操作对象的地址 (译码结果),在时序信号配合下,产生一系列的微操作控 制信号,从而控制计算机的运算器、存储器或输入输出接口 等部件工作,实现指令所表示的功能。



## **▶CPU内部结构**

(内部单总线结构)

- □ 数据通路 (datapath)
  - ◆ 运算单元
  - ◆ 寄存器单元
- □ 控制器 (CU)
  - ♦ 指令译码器ID
  - ◆ 控制信号生成器
- □ 内部总线



gg 北京航空航天大學

7

### 1.1 CPU的功能与组成

## ❖ CPU的组成—小结

- ▶ 执行单元(数据通路,datapath)
  - 运算单元: 算术逻辑运算单元(ALU)
  - 寄存器: 通用寄存器组(GPRs),标志寄存器(FR,又称程序状态字PSW),临时寄存器(TR)
- ▶控制单元(控制器, control):
  - 指令地址部件:程序计数器 (PC Program Counter)
  - 指令寄存部件: 指令寄存器 (IR Instruction Register)
  - 译码部件: 指令译码器 (ID Instruction Decoder)
  - 控制信号生成部件:产生计算机其他部件所需要的所有微操作 控制信号,有组合逻辑和微程序等实现方式。
  - 时序部件:产生时序信号



## ❖ 数据通路

- ▶指令执行过程中,指令数据流所经过的部件和路径总称,用以实现数据的传送、处理和存储等功能,是指令的执行部件。
- ▶构成
  - 组合逻辑元件(操作元件): ALU、多路选择器等
  - 存储元件(状态元件): 存储器、寄存器等
- >部件间连接方式
  - 总线连接方式(CPU内部总线)
  - 分散连接方式

## ❖ 控制器

▶对指令进行译码并生成指令执行所需的控制信号,以实现对数据 通路中各部件的功能控制,以及相应路径的开关控制等,是<mark>指令的</mark> 控制部件。

**60** 北京航空航天大學

9

### 1.1 CPU的功能与组成

- ❖简单的数据通路示例
  - ▶取指令路径
    - N1H A PH IT
    - PC→MARRead Mem.
    - M→MBR→IBR→IR
  - ▶取操作数的路径
    - 操作数地址→MAR
    - Read Mem.
    - M→MBR→ALU
  - >运算结果保存路径
    - ALU结果→MBR
    - 结果地址→MAR
    - Write Mem.



早期累加器型数据通路



# ❖单总线数据通路示例

- >取指令路径
- ▶取操作数的路径
- >运算结果保存路径

- PC→IB→MAR
- 地址→IB→MAR
- ALU结果→IB→MDR • 结果地址→IB→MAR

- MemR
- MemR

- M→MER→IB→IR
- M→MER→IB→ALU
- MemW



单总线 数据通路

**6** 北京航空航天大學

## 1.1 CPU的功能与组成

## \*指令的四种基本操作

▶取数:读取某主存单元的数据,并传送至某个寄存器;

▶ 存数:将某个寄存器中的数据,存入主存某个单元之中;

▶传送:将某个寄存器中的数据,传送至ALU或另一个寄存器:

>运算:进行某种算术或逻辑运算,结果保存到某个寄存器中。

**《** 北京航空航天大學

12

### ❖指令功能的形式化描述:

RTL(Register Transfer Language,寄存器传送语言)

▶ ← :数据传送方向;

▶ R[a]: 寄存器 a;

▶ M[a]: 主存中地址为a的单元;

▶ PC : 程序计数器

> f(data):表示对数据data进行f操作

### ❖示例

- ▶R[c] ← R[a] + R[b] // 寄存器a加寄存器b的结果送寄存器c
- ▶R[c] ← R[a] op R[b] // 寄存器a与寄存器b进行op运算结果送寄存器c
- ▶ Signext(imm16) // 对数imm16进行Signext(符号扩展)运算
- ▶R[a] ← M[b] // 取数操作,读取主存单元b的数据传送至寄存器a
- ▶M[a] ← R[b] // 存数操作,将寄存器b中的数据写入主存单元a中

**《此京航空航天大学** 

13

## 1.2 CPU设计的一般方法

### ❖ 设计步骤

- 1. 分析指令系统需求
  - 包括: 指令格式、指令类型、每种指令的功能、寻址方式等
- 2. 数据通路构建
  - ① 根据指令需求选择数据通路部件,如PC、ALU、寄存器堆、 指令/数据存储器、多路开关等等:
  - ② 根据指令执行流程,构建每种类型指令的数据通路;
  - ③ 对所有类型指令执行数据通路综合,形成综合数据通路。
- 3. 控制器设计
  - ① 确定控制器时序控制方式(单周期、或多周期、或其他)
  - ② 根据每种类型指令执行流程,确定该指令执行时,各个数据 通路部件所需要的控制信号及相应状态、条件;
  - ③ 对控制信号进行综合,以得到每个控制信号的逻辑方程;
  - ④ 逻辑电路实现各个控制信号。





- 一. 处理器设计概述
  - 1. 处理器的功能与组成
  - 2. 处理器设计的一般方法

## 二.MIPS模型机

- 1. MIPS模型机指令集
- 2. MIPS模型机数据通路部件
- 3. 时钟同步方法
- 三. MIPS单周期处理器设计
- 四. MIPS多周期处理器设计

gg 北京航空航天大学

15

# 2.1 MIPS模型机指令集

# ❖MIPS 寄存器结构

- > 32位虚拟地址空间
- ▶ 32个32位GPRs (通用寄存器)
- > 32个32 位FPRs (浮点数寄存器)
- > HI, LO, PC

### 通用寄存器

**3** 北京航空航天大学



乘/除寄存器

31 0 HI

程序计数器

PC



# 2.1 MIPS模型机指令集

## MIPS 模型机寄存器使用约定

| 寄存器编号   | 寄存器名称       | 用途        |
|---------|-------------|-----------|
| 0       | \$zero      | 常数0       |
| 1       | \$at        | 保留给汇编器使用  |
| 2 ~ 3   | \$v0 ~ \$v1 | 结果值和表达式求值 |
| 4 ~ 7   | \$a0 ~ \$a3 | 参数        |
| 8 ~ 15  | \$t0 ~ \$t7 | 临时变量      |
| 16 ~ 23 | \$s0 ~ \$s7 | 数据寄存器     |
| 24 ~ 25 | \$t8 ~ \$t9 | 其他临时变量    |
| 26 ~ 27 | \$k0 ~ \$k1 | 保留给操作系统使用 |
| 28      | \$gp        | 全局指针      |
| 29      | \$sp        | 栈指针       |
| 30      | \$fp        | 帧指针       |
| 31      | \$ra        | 返回地址      |

gg 北京航空航天大学

17

# 2.1 MIPS模型机指令集

# ❖MIPS 指令格式

- ➤Op: 6 bits, Opcdoe
- >Rs: 5 bits, The first register source operand
- >Rt: 5 bits, The second register source operand
- >Rd: 5 bits, The register destination operand
- ➤ Shamt: 5 bits, Shift amount ( shift instruction)
- > Func: 6 bits, function code ( another Opcode)

| R | 米 | 刑 |  |
|---|---|---|--|

| 6       | 5       | 5       | 5       | 5      | 6     |
|---------|---------|---------|---------|--------|-------|
| Op      | Rs      | Rt      | Rd      | Shamt  | Func  |
| (31-26) | (25-21) | (20-16) | (15-11) | (10-6) | (5-0) |

I类型

| Op      | Rs      | Rt      | 16 bit Address or Immediate |
|---------|---------|---------|-----------------------------|
| (31-26) | (25-21) | (20-16) | (15-0)                      |

J类型

| Op      | 26 bit Address ( for Jump Instruction) |
|---------|----------------------------------------|
| (31-26) | (25-0)                                 |

gg 北京航空航天大學



# 2.1 MIPS模型机指令集

### 模型机指令集(8条指令)

| 指令<br>格式 | 指令                                  | 功能                                                         | 说明                                                                    |
|----------|-------------------------------------|------------------------------------------------------------|-----------------------------------------------------------------------|
|          | add rd, rs, rt                      | $R[rd] \leftarrow R[rs] + R[rt]$                           | 加运算: 寄存器 rs 和寄存器 rt 相加,结果送寄存器 rd                                      |
| R        | sub rd, rs, rt                      | R[rd]← R[rs] - R[rt]                                       | 减运算: 寄存器 rs 和寄存器 rt 相减,结果送寄存器 rd                                      |
| 类型<br>   | and rd, rs, rt R[rd]← R[rs] & R[rt] |                                                            | <b>与运算</b> :寄存器 rs 和寄存器 rt 按位与,结果送寄存器 rd                              |
|          | or rd, rs, rt                       | R[rd]← R[rs]   R[rt]                                       | 或运算:寄存器 rs 和寄存器 rt 按位或,结果送寄存器 rd                                      |
|          | lw rt, rs, imm16                    | Add = R[rs] +Signext( imm16)<br>R[rt] ← M[Add]             | 取字:寄存器 rs 和立即数 imm16(符号扩展至 32 位)<br>相加得到内存地址,从内存该地址单元读取数据<br>送 rt     |
| I<br>类型  | sw rt, rs, imm16                    | Add = R[rs] +Signext( imm16)<br>M[Add] ← R[rt]             | 存字:寄存器 rs 和立即数 imm16(符号扩展至 32 位)相加得到内存地址,寄存器 rt 数据写入内存该地址单元           |
|          | beq rs, rt, imm16                   | If ( R[rs] – R[rt] =0) then<br>PC ← PC + Signext(imm16)<<2 | 分支: 如果寄存器 rs 与 rt 相等,则转移(imm16 符号扩展至 32 位),否则顺序执行。(取指令后,PC+4)         |
| J<br>类型  | j target                            | PC(31:2)←PC(31:28)    target(25:0)                         | 跳转: 当前 PC 的高 4 位与 target(26 位)拼接成 30 位<br>目标地址送 PC(31:2)。(取指令后,PC+4)。 |

gg 北京航空航天大學

# 2.1 MIPS模型机指令集

### 模型机指令编码

| es alc not be as | OP        | Rs        | Rt        | Rd        | Shamt         | Funct      |
|------------------|-----------|-----------|-----------|-----------|---------------|------------|
| R类型格式            | (31 ~ 26) | (25 ~ 21) | (20 ~ 16) | (15 ~ 11) | (10 ~ 6)      | (5 ~ 0)    |
| add rd, rs, rt   | 000000    | rs        | rt        | rd        | XXXXX         | 100000     |
| sub rd, rs, rt   | 000000    | rs        | rt        | rd        | XXXXX         | 100010     |
| and rd, rs, rt   | 000000    | rs        | rt        | rd        | XXXXX         | 100100     |
| or rd, rs, rt    | 000000    | rs        | rt        | rd        | XXXXX         | 100101     |
|                  |           |           |           |           |               |            |
|                  | OP        | De        | Dt        | 16 h      | ite immediate | or addrose |

| I类型格式             | OP<br>(31 ~ 26) | Rs<br>(25 ~ 21) | Rt<br>(20 ~ 16) | 16 bits immediate or address (15 ~ 0) |
|-------------------|-----------------|-----------------|-----------------|---------------------------------------|
| lw rt, rs, imm16  | 100011          | rs              | rt              | imm16                                 |
| sw rt, rs, imm16  | 101011          | rs              | rt              | imm16                                 |
| beq rs, rt, imm16 | 000100          | rs              | rt              | imm16                                 |

| J类型格式    | OP<br>(31 ~ 26) | 26 bits address |
|----------|-----------------|-----------------|
| j target | 000010          | target          |

gg 北京航空航天大學

g. 北京航空航天大学

21

# 2.2 数据通路部件

# ❖ 组合部件

▶加法器(Adder)、算术逻辑运算单元(ALU)



| Α    | В      | Sum=A+B |
|------|--------|---------|
|      |        |         |
|      |        |         |
| 数据输入 | 控制输入OF | 給山      |

输出(32位)

输入(32位)

|    | OP     |              |
|----|--------|--------------|
| 32 | A Zero | <b>□</b>     |
|    | ALU    | 32<br>Result |
| 32 | В      | Result       |

| 数据输入<br>(32位) |   | 控制输入OP<br>(4位) | 输出                     |
|---------------|---|----------------|------------------------|
| Α             | В | 0000           | Result = A&B           |
| Α             | В | 0001           | Result = A B           |
| Α             | В | 0010           | Result = A+B           |
| Α             | В | 0110           | Result = A-B           |
| Α             | В | 0111           | If A=B then<br>Zero =1 |

## 2.2 数据通路部件

# ❖ 组合部件

- ▶ 多路选择器 (Mux)、符号扩展器 (Signext)
- >多路选择器有二选一,三选一,四选一等。



|   | 入<br>!位) | Select输入    | 输出<br>( <b>32</b> 位) |
|---|----------|-------------|----------------------|
| А | В        | 无效<br>(低电平) | Y=A                  |
| А | В        | 有效<br>(高电平) | Y=B                  |



16位二进制数按符号位扩展至32位

如: Signext(8000H) = FFFF8000H Signext(7800H) = 00007800H

**企** 北京航空航天大學

23

## 2.2 数据通路部件

- ❖ 寄存器堆(32个寄存器)
  - ▶两个32位输出端口(读)
  - ▶一个32位输入端口(写)



### 寄存器堆读操作(输出)

| 地址输入           | (5位)           | 数据输出                                                       |
|----------------|----------------|------------------------------------------------------------|
| Read register1 | Read register2 | Read data1=R[Readregister1]<br>Read data2=R[Readregister2] |

### 寄存器堆写操作(输入)

| 地址输入<br>(5位)      | 数据输入<br>(32位) | 控制输入<br>RegWrite  | 操作                            |
|-------------------|---------------|-------------------|-------------------------------|
| Write<br>register | Write data    | 无效                | 无                             |
| Write<br>register | Write data    | 有效<br>(Clk 时钟下跳沿) | R[Writeregister] ← Write data |

ga 北京航空航天大學

### 2.2 数据通路部件 ❖ 寄存器堆内部结构 Rreg1 С Q Reg0 5~32 м Wreg Decode С Reg1 D Rdata1 30 Clk C Reg30 Q RegWrite С Reg31 D Wdata U Rreg2 Rdata2 32个寄存器 每个寄存器都是32位 读操作:组合部件操作 写操作: 状态部件操作

# 2.2 数据通路部件

**6** 北京航空航天大學

## ❖ 数据存储器DM (理想存储器)

- ▶单输入总线: Write data
- ▶单输出总线: Read data
- ▶读: MemRead控制信号有效时,地址 线(Address)选择的存储字被放在Read data输出总线上(组合元件操作)
- ▶写: MemWrite控制信号有效且时钟信号 CIk下跳沿时,Write data总线上的数据 被写入地址选择的存储单元中(状态元 件操作)

# ❖ 指令存储器IM

▶指令地址(Read address)选择的指令被 放在Instruction输出线上(组合元件操 作)



**3.** 北京航空航天大学

# 2.3 时钟同步方法

### ❖状态单元的时序



- ▶ 建立时间 (Setup Time): 触发时钟边沿之前输入必须稳定的时间;
- ▶ 保持时间(Hold Time): 触发时钟边沿之后输入仍需稳定的时间;
- ➤ Clock-to-Q: 从触发时钟边沿到输出有效的时间。

45. 北京航空航天大学

# 2.3 时钟同步方法

## ❖时钟周期



- ▶ 数据通路由 " ... + 状态元件+ 操作元件(组合电路) + 状态元件+ ..."组成
- 状态元件存储信息,所有操作元件从状态单元接收输入,并将输出写入状态单元中。 其输入为前一时钟生成的数据,输出为当前时钟所用的数据
- Cycle Time = Clock-to-Q + Longest Delay Path + Setup + Clock Skew

**3.** 北京航空航天大学

28

# 2.3 时钟同步方法

## ❖ 时钟同步方法

- >以时钟周期信号为基准,确定数据读出和写入的时刻。
- ▶采用边沿触发的时钟同步方法,如上跳沿触发,意味着所有状态元件 (寄存器、存储器)的数据写入都发生在时钟周期的上跳沿时刻。



- ▶ 组合逻辑操作时钟周期内完成;
- ▶ 在时钟周期内,所有信号从状态单元1经组合逻辑,传送到状态单元2
- > 时钟信号上跳沿同步
- ▶ 组合逻辑操作时钟周期内完成:
- 在时钟周期内,所有信号从状态单 元输出,经组合逻辑处理再回到状态单元输入。
- ▶ 时钟信号上跳沿同步

29

# 第六讲 MIPS处理器设计

- 一. 处理器设计概述
- 二. MIPS模型机

# 三.MIPS单周期处理器设计

- 1. 单周期数据通路设计
- 2. 单周期控制器设计
- 3. 单周期性能分析
- 四. MIPS流水线处理器设计

**企** 北京航空航天大学

## 3.1 单周期数据通路设计

## ❖单周期

▶所有指令执行周期固定为单一时钟周期, CPI=1。

## ❖数据通路设计考虑

- ▶<mark>哈佛体系结构:</mark> 使用指令存储区(IM)和数据存储区(DM)分别 保存指令和数据
- ▶先为每类指令设计独立的数据通路,然后再考虑数据通路合并
- ❖指令执行的共性
  - ▶根据PC,从指令存储器读取指令;取指令后,PC ← PC+4;
  - ▶模型机7条指令在读取寄存器后,都要使用ALU
    - LW/SW(存储访问)指令: 用ALU计算数据地址
    - ADD/SUB/AND/OR(算术逻辑)指令: 用ALU完成算术逻辑运算
    - BEQ(分支)指令: 用ALU进行比较(减法运算)

**公** 北京航空航天大學

31

## 3.1 单周期数据通路设计

# \*单周期

- ▶所有指令执行周期固定为单一时钟周期, CPI=1。
- ❖数据通路设计考虑
  - ▶哈佛体系结构:使用指令存储区(IM)和数据存储区(DM)分别保存指令和数据
  - > 先为每类指令设计独立的数据通路, 然后再考虑数据通路合并。
  - ▶模型机指令执行过程一般会分为如下几个步骤:
    - 取指令: 根据PC,访问指令存储器获得指令,然后PC+4;
    - 读寄存器: 根据指令格式, 读取相应寄存器操作数
    - ALU运算: 通过ALU完成相应的算术逻辑运算
    - 数据存取: LW/SW指令访问数据存储器
    - 写寄存器: 运算类指令和LW指令要把数据写入寄存器
  - ▶根据每个步骤,确定数据通路所需的部件和部件之间的连接关系

**公** 北京航空航天大学

### 3.1 单周期数据通路设计

- ❖分析指令执行步骤,确定数据通路所需部件和部件间连接
  - ▶模型机指令执行过程一般会分为如下几个步骤:
    - 取指令: 根据PC访问指令存储器获得指令, 然后PC+4;
    - 读寄存器: 根据指令格式读取相应寄存器操作数
    - ALU运算: 在ALU完成相应的算术逻辑运算
    - 数据存取: LW/SW指令的数据存储器访问
    - 写寄存器: 运算类指令和LW指令要把数据写入寄存器
- ❖使用数据通路设计表格
  - ▶表格记录数据通路部件输入端的输入来源
  - ▶暂不考虑控制信号

| 指令  | Ad | der | PC | IM   |      | Regi | sters |       | Al | .U | DM   |       |  |
|-----|----|-----|----|------|------|------|-------|-------|----|----|------|-------|--|
| 頂マ  | Α  | В   |    | Add. | Reg1 | Reg2 | Wreg  | Wdata | Α  | В  | Add. | Wdata |  |
| Add |    |     |    |      |      |      |       |       |    |    |      |       |  |
| Lw  |    |     |    |      |      |      |       |       |    |    |      |       |  |

gg 北京航空航天大學

33

# 3.1 单周期数据通路设计 —— 取指与PC自增

- 1. 取指和PC自增数据通路(所有指令)
  - >功能描述
    - 取指: IM Address ←PC, instruction=IM[PC]
    - PC自增: PC← PC + 4
  - ▶所需部件: PC, Adder (实现PC加4), 指令存储器IM

| 指令       | Adder |   | PC    | IM   |      | Regi | sters |       | Al | LU | DM   |       |
|----------|-------|---|-------|------|------|------|-------|-------|----|----|------|-------|
| 111 4    | Α     | В |       | Add. | Reg1 | Reg2 | Wreg  | Wdata | Α  | В  | Add. | Wdata |
| R型<br>指令 | PC    | 4 | Adder | PC   |      |      |       |       |    |    |      |       |
| Lw       | PC    | 4 | Adder | PC   |      |      |       |       |    |    |      |       |
| Sw       | PC    | 4 | Adder | PC   |      |      |       |       |    |    |      |       |
| Beq      | РС    | 4 | Adder | PC   |      |      |       |       |    |    |      |       |
|          |       |   |       |      |      |      |       |       |    |    |      |       |

# 3.1 单周期数据通路设计 —— 取指与PC自增

- 1. 取指和PC自增数据通路图
  - ▶功能描述
    - 取指: instruction = IM[PC]
    - PC自增: PC← PC + 4
  - ▶所需部件: PC, Adder(实现PC加4), IM



3.1 单周期数据通路设计——R型指令数据通路

- 2. R型指令数据通路(add,sub,and,or指令,以add为例)
  - ≽add rd, rs, rt

 
 Op (31-26)
 Rs (25-21)
 Rt (20-16)
 Rd (15-11)
 Shamt (10-6)
 Func (5-0)

- ▶功能描述
  - $R[rd] \leftarrow R[rs] + R[rt]$
- ▶通路部件:寄存器堆、ALU

| 指令       | Ad | Adder |       | IM   |      | Regi | sters |       | Al     | LU     | D    | М     |
|----------|----|-------|-------|------|------|------|-------|-------|--------|--------|------|-------|
| 1H 4     | Α  | В     | PC    | Add. | Reg1 | Reg2 | Wreg  | Wdata | A      | В      | Add. | Wdata |
| R型<br>指令 | PC | 4     | Adder | PC   | Rs   | Rt   | Rd    | ALU   | Rdata1 | Rdata2 |      |       |
| Lw       | PC | 4     | Adder | PC   |      |      |       |       |        |        |      |       |
| Sw       | PC | 4     | Adder | PC   |      |      |       |       |        |        |      |       |
| Beq      | PC | 4     | Adder | PC   |      |      |       |       |        |        |      |       |

**(4)** 北京航空航天大學

36



2. R型指令数据通路(add,sub,and,or指令,以add为例)

Rs (25-21)

Rt (20-16)

Rd (15-11) Shamt (10-6)

Func (5-0)

- >add rd, rs, rt
- >功能描述
  - 」 ■ R[rd] ← R[rs] + R[rt]

Op (31-26)

▶通路部件:寄存器堆、ALU



| 输 | Д | ALU operation | 输出    |
|---|---|---------------|-------|
| Α | В | 0000          | A & B |
| Α | В | 0001          | A B   |
| Α | В | 0010          | A + B |
| Α | В | 0110          | A – B |

37

# 3.1 单周期数据通路设计——LW指令数据通路

- 3. 取数指令(lw)数据通路
  - ➤lw rt, rs, imm16

Op Rs Rt (31-26) (25-21) (20-16)

16 bit Address or Immediate (15-0)

▶功能描述:

- R[rt] ← DM[ R[rs] + Signext(imm16)]
- ▶通路部件:寄存器堆,ALU,符号扩展单元Signext,数据存储器DM

| 指令       | Adder |           | PC    | IM   |      | Regi | sters |        | Al           | LU  | D    | Sign- |     |
|----------|-------|-----------|-------|------|------|------|-------|--------|--------------|-----|------|-------|-----|
| 1H 4     | Α     | В         |       | Add. | Reg1 | Reg2 | Wreg  | Wdata  | Α            | В   | Add. | Wdata | ext |
| R型<br>指令 | РС    | C 4 Adder |       | PC   | Rs   | Rt   | Rd    | ALU    | Rdata1       | 1   |      |       |     |
| Lw       |       |           | PC    | Rs   |      | Rt   | DM    | Rdata1 | Sign-<br>ext | ALU |      | imm16 |     |
| Sw       | PC    | 4         | Adder | PC   |      |      |       |        |              |     |      |       |     |
| Beq      | PC    | 4         | Adder | PC   |      |      |       |        |              |     |      |       |     |

**企** 北京航空航天大學

**3.** 北京航空航天大學



## 3. 取数指令(lw)数据通路

- ≥lw rt, rs, imm16
- ▶功能描述:
- Op Rs Rt 16 bit Address or Immediate (31-26) (25-21) (20-16) (15-0)
- R[rt] DM[ R[rs] + Signext(imm16) ]
- ▶通路部件:寄存器堆,ALU,符号扩展单元Signext,数据存储器DM



# 3.1 单周期数据通路设计——SW指令数据通路

## 4. 存数指令(sw)数据通路

- >sw rt, rs, imm16
  - 16
- Rs (25-21)
- Rt (20-16)
- 16 bit Address or Immediate (15-0)

- ▶功能描述:
  - DM[ R[rs] + Signext(imm16) ] ← R[rt]
- ▶通路部件:寄存器堆,ALU,符号扩展单元Signext,数据存储器DM

| 指令       |    |   | PC    | IM   |      | Regi | sters |       | ALU    |              | D    | Sign-  |       |
|----------|----|---|-------|------|------|------|-------|-------|--------|--------------|------|--------|-------|
| 1日 マ     | Α  | В |       | Add. | Reg1 | Reg2 | Wreg  | wdata | Α      | В            | Add. | wdata  | ext   |
| R型<br>指令 | РС | 4 | Adder | PC   | Rs   | Rt   | Rd    | ALU   | Rdata1 | Rdata2       |      |        |       |
| Lw       | PC | 4 | Adder | PC   | Rs   |      | Rt    | DM    | Rdata1 | Signext      | ALU  |        | imm16 |
| Sw       | PC | 4 | Adder | PC   | Rs   | Rt   |       |       | Rdata1 | Sign-<br>ext | ALU  | Rdata2 | imm16 |
| Beq      | PC | 4 | Adder | PC   |      |      |       |       |        |              |      |        |       |



# 3.1 单周期数据通路设计——R型指令与访存指令通路合并

# 5. R型指令与访存指令数据通路合并:增加多路选择Mux

| Op<br>(31-26) | Rs<br>(25-21) | Rt<br>(20-16) | Rd<br>(15-11) | Shamt<br>(10-6)         | Func<br>(5-0) | R型指令格式    |
|---------------|---------------|---------------|---------------|-------------------------|---------------|-----------|
| Op<br>(31-26) | Rs<br>(25-21) | Rt<br>(20-16) | 16 bit .      | Address or In<br>(15-0) | nmediate      | LW/SW指令格式 |

| 指令       | Ad | der | PC    | IM   |      | Regi | sters   |             | Al     | LU                       | D    | M      | Sign- |
|----------|----|-----|-------|------|------|------|---------|-------------|--------|--------------------------|------|--------|-------|
| 油マ       | Α  | В   | 10    | Add. | Reg1 | Reg2 | Wreg    | wdata       | Α      | В                        | Add. | wdata  | ext   |
| R型<br>指令 | РС | 4   | Adder | PC   | Rs   | Rt   | Rd      | ALU         | Rdata1 | Rdata2                   |      |        |       |
| Lw       | РС | 4   | Adder | PC   | Rs   |      | Rt      | DM          | Rdata1 | Sign<br>ext              | ALU  |        | imm16 |
| Sw       | РС | 4   | Adder | PC   | Rs   | Rt   |         |             | Rdata1 | Sign ext                 | ALU  | Rdata2 | imm16 |
| 合并       | PC | 4   | Adder | PC   | Rs   | Rt   | Rd   Rt | ALU J<br>DM | Rdata  | Rdata2<br>  Sign-<br>ext | ALU  | Rdata2 | imm16 |

输入端数据源出现多个选择, 需要加入多路选择器MUX

**公** 北京航空航天大学

# 3.1 单周期数据通路设计——R型指令与访存指令通路合并

- 5. R型指令与访存指令数据通路合并
  - ▶ 增加3个二选一多路选择器MUX
    - 寄存器堆写入端地址选择MUX,选择控制信号 RegDst
    - 寄存器堆写入端数据源选择MUX,选择控制信号 MemtoReg
    - ALU输入端B数据源选择MUX,选择控制信号 ALUSrc



## 3.1 MIPS的数据通路设计——Beq指令数据通路

## 6. 分支指令数据通路

> beq rs, rt, imm16

Op Rs Rt 16 bit Address or Immediate (31-26) (25-21) (20-16) (15-0)

- ▶功能描述:
  - If (R[rs] R[rt] = 0) then  $PC \leftarrow (PC + 4) + Signext(imm16) << 2$  else  $PC \leftarrow PC + 4$
- ▶通路部件:寄存器堆,ALU,增加一加法器Nadd,符号扩展 Signext,移位器

|           | Add | der |               | IM   |      |          | isters  |             | Al     | LU                      | D    | М         | Sign- |          | Na    | dd    |
|-----------|-----|-----|---------------|------|------|----------|---------|-------------|--------|-------------------------|------|-----------|-------|----------|-------|-------|
| 指令        | Α   | В   | PC            | Add. | Reg1 | Reg<br>2 | Wreg    | Wdat<br>a   | Α      | В                       | Add. | Wdat<br>a | ext   | Shift    |       |       |
| R型/<br>访存 | РС  | 4   | Adder         | PC   | Rs   | Rt       | Rd   Rt | ALU  <br>DM | Rdata1 | Rdata2<br> Sign-<br>ext | ALU  | Rdata2    | imm16 |          |       |       |
| Beq       | РС  | 4(  | Adder<br>Nadd | PC   | Rs   | Rt       |         |             | Rdata1 | Rdata2                  |      |           | imm16 | Sign ext | Adder | Shift |
|           |     |     |               |      |      |          |         |             |        |                         |      |           |       |          |       |       |

\*需要一个MUX,ALU的判零输出端Zero 可直接作为该MUX的选择控制

**公** 北京航空航天大学

# 3.1 MIPS的数据通路设计——Beq指令数据通路

- 6. 分支指令数据通路
  - ≥ beq rs, rt, imm16
  - ▶通路部件:寄存器堆,ALU,增加一Adder,符号扩展Signext,移位器



## 3.1 单周期数据通路设计

- 7. MIPS数据通路再合并
  - ▶支持: R类型指令、内存访问指令(lw/sw)、beq指令

|               | Add | ler |                 | IM       |      | Reg      | isters  |             | Α      | LU                       |      | OM .       | Sign- |             | Nac   | dd    |
|---------------|-----|-----|-----------------|----------|------|----------|---------|-------------|--------|--------------------------|------|------------|-------|-------------|-------|-------|
| 指令            | A   | В   | PC              | Ad<br>d. | Reg1 | Reg<br>2 | Wreg    | Wdat<br>a   | Α      | В                        | Add. | Wdat<br>a  | ext   | Shift       |       |       |
| R型<br>与<br>访存 | PC  | 4   | Adder           | PC       | Rs   | Rt       | Rd   Rt | ALU  <br>DM | Rdata1 | Rdata2<br>  Sign-<br>ext | ALU  | Rdata<br>2 | imm16 |             |       |       |
| Beq           | PC  | 4   | Adder<br>Nadd   | PC       | Rs   | Rt       |         |             | Rdata1 | Rdata2                   |      |            | imm16 | Sign ext    | Adder | Shift |
| 合并            | PC  | 4   | Adder<br>  Nadd | PC       | Rs   | Rt       | Rd   Rt | ALU J<br>DM | Rdata1 | Rdata2<br>  Sign-<br>ext | ALU  | Rdata<br>2 | imm16 | Sign<br>ext | Adder | Shift |

### 需要4个二选一多路选择器MUX

- —PC输入端数据源选择MUX,选择控制信号 PCSrc
- 一寄存器堆写入端地址选择MUX,选择控制信号 RegDst
- 一寄存器堆写入端数据源选择MUX,选择控制信号 MemtoReg
- —ALU输入端B数据源选择MUX,选择控制信号 ALUSrc

gg 北京航空航天大學

46

### 3.1 单周期数据通路设计 7. MIPS数据通路合并 ▶支持: R类型指令、内存访问指令(lw/sw)、beq指令 0 M U X Add PCSrc RegWrite Read Read PC register 1 Read data 1 MemRead | MemWrite Read register 2 ALUSrc Zero Instruction 0 M U X Write register Read data 2 Read data Result Address U X Instruction memory Write ALU operation Write 47 g. 北京航空航天大学

# 第十四讲

# 第六讲 MIPS处理器设计 一. 处理器设计概述 1. 处理器的功能与组成 2. 处理器设计的一般方法 二. MIPS模型机 三. MIPS单周期处理器设计 1. 单周期数据通路设计 2. 单周期控制器设计 3. 单周期性能分析 四. MIPS多周期处理器设计 1. MIPS多周期处理器设计 3. 49



# 3.2 单周期控制器设计

- ❖单周期通路所需控制信号
  - ▶ALU控制(ALU Operation): 4位
  - ▶其他控制信号:7个

### ALU 控制

| 输入 |   | ALU operation | ALU运算 |  |  |
|----|---|---------------|-------|--|--|
| Α  | В | 0000          | A&B   |  |  |
| Α  | В | 0001          | A B   |  |  |
| Α  | В | 0010          | A + B |  |  |
| Α  | В | 0110          | A – B |  |  |

### 7个控制信号

| 控制信号     | 失效时作用                | 有效时作用              |  |  |  |
|----------|----------------------|--------------------|--|--|--|
| RegDst   | 寄存器堆写入端地址来选择Rt字段     | 寄存器堆写入端地址选择 Rd字段   |  |  |  |
| RegWrite | 无                    | 把数据写入寄存器堆中对应寄存器    |  |  |  |
| ALUSrc   | ALU输入端B选择寄存器堆输出R[rt] | ALU输入端B选择Signext输出 |  |  |  |
| PCSrc    | PC输入源选择 PC+4         | PC输入选择beq指令的目的地址   |  |  |  |
| MemRead  | 无                    | 数据存储器DM读数据(输出)     |  |  |  |
| MemWrite | 无                    | 数据存储器DM写数据(输入)     |  |  |  |
| MemtoReg | 寄存器堆写入端数据来自ALU输出     | 寄存器堆写入端数据来自DM输出    |  |  |  |

**分** 北京航空<del>机入入字</del>

51

## 3.2 单周期控制器设计

- ❖控制器分成两部分: 主控单元和ALU控制单元
  - ▶主控单元
    - 输入: 指令操作码字段 Op (指令31:26位)
    - 输出:
      - 7个控制信号
      - ALU控制单元所需的2位输入ALUop

## **▶ALU控制单元**

- 输入:
  - 主控单元生成的ALUop(2位)
  - 功能码字段Func(指令5:0位)
- 输出: ALU运算控制信号 ALU operation (4位)

| Op<br>(31-26) | Rs<br>(25-21) | Rt<br>(20-16) | Rd<br>(15-11) | Shamt (10-6) | Func (5-0) |
|---------------|---------------|---------------|---------------|--------------|------------|

**3** 北京航空航天大学

ALU0p指明ALU的运算类型

- 00: 访存指令所需加法
- 01: beq指令所需减法
- 10: R型指令功能码决定

# 3.2 单周期控制器设计——模型机数据通路(带控制单元)



### 3.2 单周期控制器设计

## ❖主控单元控制信号分析

### > RegDst

- R型指令: RegDst=1,选择Rd
- Lw指令: RegDst=0,选择Rt
- 其他指令: 不关心

### > ALUSrc

- R型指令: ALUSrc=0,选择寄存器堆的 Read data2 输出
- Beq指令(减法运算): ALUSrc=0,选择 Read data2 输出
- Lw指令: ALUSrc=1,选择Signext的输出
- Sw指令: ALUSrc=1,选择Signext的输出

### ➤ MemtoReq

- R型指令: MemtoReg=0, 选择 ALU 输出
- Lw指令: MemtoReg=1,选择数据存储器DM输出
- 其他指令: 不关心

### > Branch

■ Beq指令: Branch=1,此时若Zero=1,PC输入选择加法器Nadd输出(分支指令目的地址),否则选择加法器Add输出(PC+4)

■ 其他指令: Branch=0, PC输入选择加法器Add输出(PC+4)

# 3.2 单周期控制器设计

### 主控单元真值表

| Input or output | Signal name | R-format | 1w | SW | beq |
|-----------------|-------------|----------|----|----|-----|
| Inputs          | Op5         | 0        | 1  | 1  | 0   |
|                 | Op4         | 0        | 0  | 0  | 0   |
|                 | 0p3         | 0        | 0  | 1  | 0   |
|                 | Op2         | 0        | 0  | 0  | 1   |
|                 | Op1         | 0        | 1  | 1  | 0   |
|                 | Op0         | 0        | 1  | 1  | 0   |
| Outputs         | RegDst      | 1        | 0  | Χ  | Χ   |
|                 | ALUSrc      | 0        | 1  | 1  | 0   |
|                 | MemtoReg    | 0        | 1  | Χ  | χ   |
|                 | RegWrite    | 1        | 1  | 0  | 0   |
|                 | MemRead     | 0        | 1  | 0  | 0   |
|                 | MemWrite    | 0        | 0  | 1  | 0   |
|                 | Branch      | 0        | 0  | 0  | 1   |
|                 | ALUOp1      | 1        | 0  | 0  | 0   |
|                 | ALUOp0      | 0        | 0  | 0  | 1   |

O 北京航空航天大学

提供给ALU控制单元

55

### 3.2 单周期控制器设计 Inputs Op5 Op4 Op3 \_ Op2 Op1\_ Op0\_ 主控单元 逻辑实现 Outputs R-format lw beq RegDst ALUSrc MemtoReg RegWrite MemRead MemWrite Branch ALUOp1 - ALUOp0 gg 北京航空航天大学 56

# 3.2 单周期控制器设计

# ❖ALU控制单元

- ▶输入:
  - 指令的Func字段(指令5:0位)
  - 由主控单元生成的 ALUOp
- **▶ALUOp**指明ALU的运算类型
  - 00: 访存指令所需的加法
  - 01: beq指令所需的减法
  - 10: R型指令功能码字段决定



| 指令  | Func字段  | ALUop | ALU运算类型 | ALU operation |
|-----|---------|-------|---------|---------------|
| Lw  | XXXXXX  | 00    | 加       | 0010          |
| Sw  | XXXXXX  | 00    | 加       | 0010          |
| Beq | XXXXXX  | 01    | 减       | 0110          |
| Add | 100 000 | 10    | 加       | 0010          |
| Sub | 100 010 | 10    | 减       | 0110          |
| And | 100 100 | 10    | 与       | 0000          |
| Or  | 100 101 | 10    | 或       | 0001          |

ga 北京航空航天大学

ALU控制单元真值表













# 部件描述示例 —— PC

### 4.1.1. 基本描述

PC 模块的主要功能是将 NPC[31:0]的值保存并输出。PC 的各种取值将根据 所执行的指令、外部状态(中断)及处理器控制器的当前状态的不同,由数据通路 其他部件生成。

### 4.1.2. 模块接口

表 4-1 PC 接口信号定义

| 信号名          | 方向 | 描述           |
|--------------|----|--------------|
| Clk          | I  | MIPS-C 处理器时钟 |
| Reset        | I  | 复位信号         |
| NextPC[31:0] | I  | 下一个 PC 值     |
| PCWr         | I  | PC 写使能       |
| PC[31:0]     | 0  | PC 输出        |

### 4.1.3. 功能定义

PC 模块的核心是一个寄存器。该寄存器在 PCWr 有效时将 NextPC[31:0]锁存并输出。

表 4-2 PC 功能需求定义

|    |       | 秋 421 0 奶能商 5 定人                              |
|----|-------|-----------------------------------------------|
| 编号 | 功能名称  | 功能描述                                          |
| 1  | 初始化   | 当 Reset 信号有效后,PC 输出 0xBFC00000。               |
| 2  | PC 更新 | 当时钟上升沿到来时,PCWr 有效则将 NPC 写入 PC 内部,并且从 PC 端口输出。 |

ga 北京航空航天大学

# 部件HDL建模示例 —— PC

```
16 `timescale 1ns/1ns
       17
       18 module PC( CLK_I, Reset_I, Addr_I, PCWrite_I, PC_O ) ;
               input CLK_I; // system clock input Reset_I; // reset signal input [31:0] Addr_I; // next PC input PCWrite_I; // write enable output [31:0] PC O: // PC output
       19
       20
       21
       22
       23
                output[31:0]
                                     PC O;
                                                          // PC output
       24
       25
       26
               /* internal reg and wire */
                                                         // latch the address
       27
               reg [31:0] addr ;
       28
       29
                /* read register */
                assign PC O = addr;
       30
       31
                always@ [ posedge CLK I or posedge Reset I )
       32
       33
                begin
                    if(Reset_I)
       34
                        addr <= 'hBFC00000;
       35
                    else if( PCWrite I )
       36
       37
                        addr <= Addr I;
       38
                end
       40 endmodule
gg 北京航空航天大學
```

# 第六讲 MIPS处理器设计

- 一. 处理器设计概述
  - 1. 处理器的功能与组成
  - 2. 处理器设计的一般方法
- 二. MIPS模型机

# 三.MIPS单周期处理器设计

- 1. 单周期数据通路设计
- 2. 单周期控制器设计
- 3. 单周期性能分析
- 四. MIPS流水线处理器设计

**企** 北京航空航天大學

66





## 3.3 单周期数据通路性能分析

## ❖指令周期(指令执行时间)

- ▶R指令周期
  - 取指令 (IM Access Time)
  - 读寄存器 (Register File Access Time)
  - ALU运算(ALU Operation)
  - 写寄存器 (Register File Access Time)
- >LW指令周期
  - 取指令 (IM Access Time)
  - 读寄存器 (Register Access Time)
  - ALU运算(ALU Operation)
  - 读数据 (DM Access Time)
  - 写寄存器 (Register File Access Time)

实际上,不同类型的指令可能具有不同的指令周期

G 北京航空航天大学

69

## 3.3 单周期数据通路性能分析

### MIPS不同类型指令的指令周期

| Instruction class | Functional units used by the instruction class |                 |     |                 |                 |  |  |  |  |
|-------------------|------------------------------------------------|-----------------|-----|-----------------|-----------------|--|--|--|--|
| R-type            | Instruction fetch                              | Register access | ALU | Register access |                 |  |  |  |  |
| Load word         | Instruction fetch                              | Register access | ALU | Memory access   | Register access |  |  |  |  |
| Store word        | Instruction fetch                              | Register access | ALU | Memory access   |                 |  |  |  |  |
| Branch            | Instruction fetch                              | Register access | ALU |                 |                 |  |  |  |  |
| Jump              | Instruction fetch                              |                 |     |                 |                 |  |  |  |  |

## 数据通路各部分以及各类指令的执行时间

| Instruction<br>class | Instruction<br>memory | Register<br>read | ALU<br>operation | Data<br>memory | Register<br>write | Total  |
|----------------------|-----------------------|------------------|------------------|----------------|-------------------|--------|
| R-type               | 200                   | 50               | 100              | 0              | 50                | 400 ps |
| Load word            | 200                   | 50               | 100              | 200            | 50                | 600 ps |
| Store word           | 200                   | 50               | 100              | 200            |                   | 550 ps |
| Branch               | 200                   | 50               | 100              | 0              |                   | 350 ps |
| Jump                 | 200                   |                  |                  |                |                   | 200 ps |

on 北京航空航天大学

## 3.3 单周期数据通路性能分析

- ❖指令执行时间计算
  - 1. 方式一: 采用单周期,即所有指令周期固定为单一时钟周期
    - 时钟周期有最长的指令决定(LW指令),为 600ps
    - 指令平均周期 = 600ps
  - 2. 方式二: 不同类型指令采用不同指令周期(可变时钟周期)
    - 假设指令在程序中出现的频率
      - lw指令 : 25%
      - sw指令 : 10%
      - R型指令 : 45%
      - beq指令 : 15%
      - j指令 : 5%
    - 平均指令执行时间

600\*25% + 550\*10% + 400\*45% + 350\*15% + 200\*5% = 447.5ps

- —若采用可变时钟周期,时间性能比单周期更高;
- 但控制比单周期要复杂、困难,得不偿失。
- 一改进方法:改变每种指令类型所用的时钟数,即采用多周期实现

71

# 第六讲 MIPS处理器设计

- 一. 处理器设计概述
- 二. MIPS模型机
- 三. MIPS单周期处理器设计
  - 1. 单周期数据通路设计
  - 2. 单周期控制器设计
  - 3. 单周期性能分析

## 四. MIPS多周期处理器设计

- 1. 多周期数据通路设计
- 2. 多周期控制器设计
- 3. 多周期性能分析

## 4.1 MIPS 多周期数据通路设计

## ❖为什么不使用单周期实现方式?

- > 单周期设计中,时钟周期对所有指令等长
- ▶ 而时钟周期由计算机中可能的最长路径决定,如: 取数指令
- ▶ 但某些指令类型本来可以在更短时间内完成,如:跳转指令

## **❖**多周期方案

- ▶将指令执行分解为多个步骤,每一步骤一个时钟周期,则指令执行 周期为多个时钟周期,不同指令的指令周期包含时钟周期数不一样
- ▶优点:
  - 提高性能:不同指令的执行占用不同的时钟周期数
  - 降低成本: 一个功能单元可以在一条指令执行过程中使用多次, 只要是在不同时钟周期中(这种共享可减少所需的硬件数量)

**3.** 北京航空航天大學

73

### 4.1 MIPS多周期数据通路设计

### ❖多周期数据通路设计总体考虑

- ▶普林斯顿结构: 指令和数据使用同一个存储器
- ▶共享一个ALU:
  - R型指令算术逻辑运算、取指令后形成PC+4新值、及Beq指令转向地址计算(PC+Signext(imm16)<<2),都在ALU中完成</li>
- ▶时钟同步方法:
  - 一个时钟周期内,信号总是从一个状态单元,经过组合逻辑处理后, 传送到另一个状态单元
  - 指令每一步的执行,总是从前一个状态单元接收输入,经过功能单元 处理,在下一个时钟周期触发沿将结果写入下一个状态单元
  - 因此,数据通路中需要增加一个或多个寄存器,以保存指令各执行步骤形成的结果(输出值),以便在指令的后续时钟周期内继续使用







# 4.3 多周期性能分析

❖ 假设主要功能单元的操作时间

> 存储器 : 200ps> ALU : 100ps> 寄存器堆: 50ps

▶ 多路复用器、控制单元、PC、符号扩展单元、线路没有延迟

### 各类指令执行时间

| 步骤            | R型指令                     | Lw指令                                                                                                      | Sw指令                  | Beq指令                        | J指令                              | 执行<br>时间 |  |  |  |  |
|---------------|--------------------------|-----------------------------------------------------------------------------------------------------------|-----------------------|------------------------------|----------------------------------|----------|--|--|--|--|
| 取指令           |                          | IR ← M[PC], PC ← PC + 4                                                                                   |                       |                              |                                  |          |  |  |  |  |
| 读寄存器/<br>译码   |                          | $A \leftarrow R[IR[25:21]], B \leftarrow R[IR[20:16]]$<br>$ALUOut \leftarrow PC + Signext[IR[15:0]] << 2$ |                       |                              |                                  |          |  |  |  |  |
| 计算            | ALUOut<br>← A op B       | ALUOut ←<br>Signe                                                                                         | - A +<br>xt(IR[15:0]) | If (A-B==0) then PC ← ALUout | PC ← PC[31:28]<br>   IR[25:0]<<2 | 100ps    |  |  |  |  |
| R型完成/<br>访问内存 | R[IR[15:11]]<br>← ALUOut | DR ← M[ALUOut] M[ALUOut] ← B                                                                              |                       | _                            | _                                | 200ps    |  |  |  |  |
| 写寄<br>存器      |                          | R[IR[20:16]]<br>← DR                                                                                      |                       |                              |                                  | 50ps     |  |  |  |  |

☎ 北京航空航天大学

77

# 4.3 多周期性能分析

# ❖时钟周期

▶ 时钟周期取各步骤中最长的时间: 200ps

### 各类指令执行时间

| 时钟<br>周期 | R型指令                     | Lw指令                                                                                                  | Sw指令                   | Beq指令                        | J指令                              | 周期<br>时间 |  |  |  |  |
|----------|--------------------------|-------------------------------------------------------------------------------------------------------|------------------------|------------------------------|----------------------------------|----------|--|--|--|--|
| TC1      |                          | IR ← M[PC], PC ← PC + 4                                                                               |                        |                              |                                  |          |  |  |  |  |
| TC2      |                          | $A \leftarrow R[IR[25:21]], B \leftarrow R[IR[20:16]]$ $ALUOut \leftarrow PC + Signext[IR[15:0]] < 2$ |                        |                              |                                  |          |  |  |  |  |
| тсз      | ALUOut<br>← A op B       | ALUOut ←<br>Signe                                                                                     | - A +<br>ext(IR[15:0]) | If (A-B==0) then PC ← ALUout | PC ← PC[31:28]<br>   IR[25:0]<<2 | 200ps    |  |  |  |  |
| TC4      | R[IR[15:11]]<br>← ALUOut | DR ← M[ALUOut] M[ALUOut] ← B                                                                          |                        |                              |                                  | 200ps    |  |  |  |  |
| TC5      |                          | R[IR[20:16<br>]] ← DR                                                                                 |                        |                              |                                  | 200ps    |  |  |  |  |

## 4.3 多周期性能分析

- ❖各型指令所需的时钟周期数和时间
  - ➤ R型指令: 800ps
  - ▶ lw指令 : 1000ps
  - ➤ sw指令 : 800ps
  - ➤ beq指令 : 600ps
  - ▶ i指令 : 600ps
- ❖假设指令在程序中出现的频率
  - ➤ lw指令 : 25%
  - ➤ sw指令 : 10%
  - ▶ R型指令: 45%
  - ➤ beg指令: 15%
  - ▶ i指令 : 5%
- ❖则一条指令的平均CPI
  - > 5\*25%+4\*10%+4\*45%+3\*15%+3\*5% = 4.05
- ❖一条指令的平均执行时间:
  - >1000\*25%+800\*10%+800\*45%+600\*15%+600\*5% = 810ps

**66. 北京航空航天大學** 

79

## 4.4 计算机性能评价

- ❖响应时间与吞吐量
  - ▶响应时间:从提交作业到完成作业所花费的时间
    - 响应时间是完成一个任务所花的时间总和,包括:运算时间、内存访问时间、执行10操作的时间、以及运行必要的操作系统代码所需的时间等
  - ▶吞吐量:一定时间间隔内完成的作业数
    - 多任务操作系统更侧重于优化系统的整体吞吐量,而不会 特别最小化某个特定程序的响应时间
  - ▶ 个人用户更关心响应时间,企业级计算机的管理人员更关心 吞吐量
  - ▶对于企业级计算机以外的应用,响应时间是评价计算机性能的主要依据

**为**北京航空航天大学

## 4.4 计算机性能评价

## ❖响应时间与CPU执行时间

- ▶对于多任务系统,应该从<mark>响应时间</mark>中去除因为等待I/O操作而花去的时间和CPU执行其他程序所花费的时间,为此引入CPU执行时间的概念。
- **▶CPU执行时间是CPU真正花在运行一个程序上的时间。**

## 程序的CPU执行时间

- =程序的CPU时钟周期数 × 时钟周期长度
- \_ 程序的CPU时钟周期数

时钟频率

## 程序的CPU时钟周期数

=程序的指令数×每条指令的平均时钟周期数

**企** 北京航空航天大學

81

## 4.4 计算机性能评价

- ❖CPI: 指令平均执行时钟周期数
  - ➤ CPI: Clock cycles Per Instruction。
  - ▶不同指令功能不同,所需时间也不同,CPI只是某一机器中一个程序或程序片段每条指令所用时钟周期的平均值。
  - ▶不同指令集的CPI比较没有实际意义。

CPU 的时钟周期数 =  $\sum_{i=1}^{n} (CPI_i \times I_i)$ 

平均时钟周期数 CPI=CPU 时钟周期数/IC (指令的条数)

$$CPI = \frac{\sum_{i=1}^{n} (CPI_i \times I_i)}{IC} = \sum_{i=1}^{n} (CPI_i \times \frac{I_i}{IC})$$

CPU 时间=CPU 时钟周期数\*时钟周期长=CPU 时钟周期数/频率CPU 时间=(IC\*CPI)/频率 f



## 4.4 计算机性能评价

# ❖MIPS: 百万指令每秒

- >MIPS: Million Instruction Per Second
- ▶不同指令集的MIPS比较没有实际意义
- ▶即使同一台机器,用不同的测试程序测出来的MIPS值也可能不一样。

MIPS = 
$$\frac{$$
指令条数}{执行时间\*10<sup>6</sup>} =  $\frac{IC}{(IC*CPI)/$ 频率 f\*10<sup>6</sup> =  $\frac{f}{CPI*10^6}$ 

## ❖MFLOPS: 百万浮点数操作每秒

- >MFLOPS: Million Floating point Operations Per Second
- >可以比较不同机器的浮点运算能力,但有局限性
- ▶MFLOPS不仅和机器有关,也和所用测试程序有关
- **▶MFLOPS与整数、浮点操作的比例有关**

**加 北京航空航天大學** 

83

## 4.4 计算机性能评价

## ❖影响计算机性能的因素

- ▶指令数: 取决于指令集体系结构(ISA),与指令集的具体实现 无关:编译器对指令数具有很大的影响:
- **▶CPI**: 机器的实现细节(存储系统结构、处理器结构);测试程序包含的各类指令的组成等;
- ▶时钟周期:与机器的实现细节密切相关

| 影响因素   | 影响           |  |
|--------|--------------|--|
| 算法     | 指令数、CPI      |  |
| 程序设计语言 | 指令数、CPI      |  |
| 编译器    | 指令数、CPI      |  |
| ISA    | 指令数、CPI、时钟周期 |  |
| 硬件实现   | CPI、时钟周期     |  |

# 4.4 计算机性能评价

## ❖示例一

假设在一台 40MHZ 处理机上运行 200,000 条指令的目标代码,程序主要由四种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的指令数如下。计算在单处理机上用跟踪数据运行程序的平均 CPI,并根据所得的 CPI,计算相应的MIPS 速率。

| 指令类型                  | CPI           | 指令混合比  |
|-----------------------|---------------|--------|
| 算术和逻辑                 | 1             | 60%    |
| 高速缓存命中的加载/存储          | 2             | 18%    |
| 转移                    | 4             | 12%    |
| 高速存储缺失的存储器访问          | 8             | 10%    |
| [解]                   |               |        |
| CPI = 1*60% + 2*18% + | 4*12% + 8*10% | = 2.24 |

$$CPI = 1*60\% + 2*18\% + 4*12\% + 8*10\% = 2.24$$

$$MIPS = f/(CPI*10^6) = (40*10^6)/(2.24*10^6) = 17.86$$

**60** 北京航空航天大學

85

# 4.4 计算机性能评价

# ❖示例二

对于一台 400MHz 计算机执行标准测试程序,程序中指令类型,执行数量和 平均时钟周期数如下:

| 指令类型 | 指令执行数量 | 平均时钟周期数 |
|------|--------|---------|
| 整数   | 45000  | 1       |
| 数据传送 | 75000  | 2       |
| 浮点   | 8000   | 4       |
| 分支   | 1500   | 2       |

求该计算机的有效 CPI、MIPS 和程序执行时间。

解: 
$$CPI = \sum (IC_i \times CPI_i)/IC$$

$$CPI = \frac{45000 \times 1 + 75000 \times 2 + 8000 \times 4 + 1500 \times 2}{45000 + 75000 + 8000 + 1500} = 1.776$$

$$MIPS$$
速率 =  $\frac{f}{CPI}$  =  $\frac{400 \times 10^6}{1.776}$  = 225.225 $MIPS$ 

程序执行时间=

 $(45000\times1+75000\times2+8000\times4+1500\times2)/(400\times10^6)=5.75\times10^{-4} \text{ s}$ <sub>86</sub>

**公**北京航\_\_\_