## 计算机系统结构实验报告 实验 5

类 MIPS 单周期处理器的设计与实现

#### 2022年4月12日

#### 摘要

本实验实现了类 MIPS 单周期处理器的几个重要部件,该类 MIPS 单周期处理器的 CPU 支持 16 条 MIPS 指令 (包括 R 型指令中的 add、sub、and、or、slt、sll、srl、jr; I 型指令中的 lw、sw、addi、ori、beq; J 型指令中的 j、jal)。本实验以实验三、四实现的模块为基础,对部分功能进行了修改,同时添加了部分控制信号。本实验通过软件仿真的形式进行实验结果的验证。

## 目录

| 目 | 录   |                                                                 | 1   |
|---|-----|-----------------------------------------------------------------|-----|
| 1 | 实验  | 目的                                                              | 3   |
| 2 | 原理  | <b>!分析</b>                                                      | 3   |
|   | 2.1 | 主控制单元 (Ctr) 原理分析                                                | 3   |
|   | 2.2 | ALU 控制单元 (ALUCtr) 原理分析                                          | 4   |
|   | 2.3 | 算术逻辑单元 (ALU) 原理分析                                               | 5   |
|   | 2.4 | 寄存器 (Register)、存储器 (Data Memory) 及有符号扩展单元 (Sign Extension) 原理分析 | 5   |
|   | 2.5 | 指令存储器 (Instruction Memory) 原理分析                                 | 5   |
|   | 2.6 | 程序计数器模块 (PC) 原理分析                                               | 5   |
|   | 2.7 | 数据选择器 (Mux) 原理分析                                                | 5   |
|   | 2.8 | 顶层模块 (Top) 原理分析                                                 | 6   |
| 3 | 功能  | 实现                                                              | 6   |
|   | 3.1 | 主控制单元 (Ctr) 功能实现                                                | 6   |
|   | 3.2 | 运算单元控制器 (ALUCtr) 功能实现                                           | 10  |
|   | 3.3 | 算术逻辑运算单元 (ALU) 功能实现                                             | 11  |
|   | 3.4 | 寄存器 (Register)、存储器 (Data Memory) 和有符号扩展单元 (Sign Extension) 功能实现 | 12  |
|   | 3.5 | 指令存储器 (Instruction Memory) 功能实现                                 | 12  |
|   | 3.6 | 程序计数器模块 (PC) 功能实现                                               | 13  |
|   | 3.7 | 数据选择器 (Mux) 功能实现                                                | 13  |
|   | 3.8 | 而巨構块 (Top) 功能分和                                                 | 1/1 |

| 4  | 结果  | 验证                                                             | 17 |
|----|-----|----------------------------------------------------------------|----|
| 5  | 总结  | 与反思                                                            | 19 |
| 附. | 录A  | 设计文件代码实现                                                       | 20 |
|    | A.1 | 主控制器 (Ctr) 的代码实现                                               | 20 |
|    | A.2 | 运算单元控制器 (ALUCtr) 的代码实现                                         | 20 |
|    | A.3 | 算术逻辑运算单元 (ALU) 的代码实现                                           | 20 |
|    | A.4 | 寄存器 (Register)、存储器 (Data Memory) 和有符号扩展单元 (Sign Extension) 的代码 |    |
|    |     | 实现                                                             | 20 |
|    | A.5 | 指令存储器 (Instruction Memory) 的代码实现                               | 20 |
|    | A.6 | 程序计数器模块 (PC) 的代码实现                                             | 20 |
|    | A.7 | 数据选择器 (Mux) 的代码实现                                              | 20 |
|    | A.8 | 顶层模块 (Top) 的代码实现                                               | 20 |
| 附: | 录 B | 激励文件代码实现                                                       | 20 |

### 1 实验目的

本次实验有如下两个实验目的:

- 1. 理解简单的类 MIPS 单周期处理器的工作原理 (即几类基本指令执行时所需的数据通路和与之对应的控制线路及其各功能部件间的互联定义、逻辑选择关系);
- 2. 完成简单的类 MIPS 单周期处理器:
  - (a) 9条 MIPS 指令 (lw, sw, beq, add, sub, and, or, slt, j) CPU 的实现与调试;
  - (b) 拓展至 16 条指令 (增加 addi, andi, ori, sll, srl, jal, jr) CPU 的设计与实现;

## 2 原理分析

#### 2.1 主控制单元 (Ctr) 原理分析

主控制单元 (Ctr) 的输入为指令的操作码 (opCode) 字段,操作码经过 Ctr 的译码,给 ALUCtr, DataMemory, Registers, Muxs 等功能单元输出正确的控制信号。

本实验中, 主控制单元 (Ctr) 可以识别 R 型指令 (add, sub, and, or, slt, sll, srl, jr)、I 型指令 (addi, andi, ori, lw, sw, beq)、J 型指令 (j, jar) 并输出对应的控制信号。

本次实验用到的控制信号与实验三类似, 其中标注 (\*) 为与实验三不同之处, 比如增添了 ExtSign和 JalSign 信号, ALUOp 信号的位数也调整为三位, 具体说明如表1所示。

| 信号       | 具体说明                                         |  |  |  |  |
|----------|----------------------------------------------|--|--|--|--|
| *ALUOp   | 3 位信号,发送给 ALU 控制单元 (ALUCtr) 用来进一步解析运算类型的控制信号 |  |  |  |  |
| ALUSrc   | ALU 第二个操作数来源选择信号;低电平:选择 rt 寄存器值,高电平:选择立即数    |  |  |  |  |
| Branch   | 条件跳转信号,高电平说明当前指令是条件跳转指令                      |  |  |  |  |
| Jump     | 无条件跳转信号,高电平说明当前指令是无条件跳转指令                    |  |  |  |  |
| MemToReg | 写寄存器的数据来源选择信号;低电平:选择 ALU 运算结果,高电平:选择内存读取数据   |  |  |  |  |
| MemRead  | 内存读使能信号,高电平有效                                |  |  |  |  |
| MemWrite | 内存写使能信号,高电平有效                                |  |  |  |  |
| RegDst   | 目标寄存器的选择信号; 低电平: 写入 rt 寄存器; 高电平: 写入 rd 寄存器   |  |  |  |  |
| RegWrite | 寄存器写使能信号,高电平说明当前指令需要进行寄存器写人                  |  |  |  |  |
| *ExtSign | 带符号扩展信号,高电平对立即数进行带符号扩展                       |  |  |  |  |
| *JalSign | 跳转并链接指令信号,高电平说明当前指令是 jal 指令                  |  |  |  |  |

表 1: 主控制单元 (Ctr) 产生的控制信号

由于 ALUOp 信号包含三个二进制位以支持 16 条指令,与实验三有所不同,调整后如表 2 所示。

| ALUOp 的信号内容 | 指令           | 具体说明                      |
|-------------|--------------|---------------------------|
| 000         | lw, sw, addi | ALU 执行加法运算                |
| 001         | beq          | ALU 执行减法运算                |
| 010         | slti         | ALU 执行带符号大小比较             |
| 011         | andi         | ALU 执行逻辑与运算               |
| 100         | ori          | ALU 执行逻辑或运算               |
| 101         | R-format     | ALUCtr 结合指令 Funct 段决定最终操作 |
| 110         | j, jal       | ALU 不需要进行操作               |

表 2: ALUOp 信号的具体含义以及解析方式

因篇幅原因,这里不再列出主控制单元 (Ctr) 产生的各种控制信号与指令 OpCode 段的对应方式。

#### 2.2 ALU 控制单元 (ALUCtr) 原理分析

算数逻辑单元 ALU 的控制单元 (ALUCtr) 是根据主控制器的 ALUOp 控制信号来判断指令类型,并依据指令的后 6 位区分 R 型指令。综合这两种输入,以控制 ALU 做正确操作。

由于 ALUOp 信号的改动,ALU 控制单元 (ALUCtr) 也需要做出相应的更改,其解析方式如表 3 所示。

| 指令     | ALUOp | Funct  | ALUCtrOut | 具体说明    |
|--------|-------|--------|-----------|---------|
| lw, sw | 000   | xxxxxx | 0010      | 加法运算    |
| beq    | 001   | xxxxxx | 0110      | 减法运算    |
| addi   | 010   | xxxxxx | 0010      | 加法运算    |
| andi   | 011   | xxxxxx | 0000      | 逻辑与运算   |
| ori    | 100   | xxxxxx | 0001      | 逻辑或运算   |
| sll    | 101   | 000000 | 0011      | 逻辑左移运算  |
| srl    | 101   | 000010 | 0100      | 逻辑右移运算  |
| jr     | 101   | 001000 | 0101      | 不用进行运算  |
| add    | 101   | 100000 | 0010      | 加法运算    |
| sub    | 101   | 100010 | 0110      | 减法运算    |
| and    | 101   | 100100 | 0000      | 逻辑与运算   |
| or     | 101   | 100101 | 0001      | 逻辑或运算   |
| slt    | 101   | 101010 | 0111      | 小于时置位运算 |
| j, jal | 110   | xxxxxx | 0101      | 不用进行运算  |

表 3: ALU 控制单元 (ALUCtr) 的解析方式

为了支持 jr 指令以及带有 shamt 操作数的 sll 与 srl 指令, 我们新增了两个信号 jrSign 与 shamt-Sign, 分别用来表示该指令是否为 jr、该指令操作数是否在 shamt 中。

#### 2.3 算术逻辑单元 (ALU) 原理分析

算术逻辑单元 ALU 根据 ALUCtr 的控制信号将两个输入执行与之对应的操作。ALURes 为输出结果。若减法操作 ALURes 的结果为 0 时,则 Zero 输出置为 1。该信号用于与 branch 指令结合判断是否满足转移条件。

(\*) 为与实验三不一样的控制信号, ALU 执行的算术逻辑运算类型与运算单元控制信号 ALUCtrOut 的对应方式如表 4 所示。

| ALUCtrOut | ALU 执行算术逻辑运算类型 |
|-----------|----------------|
| 0000      | 逻辑与 and        |
| 0001      | 逻辑或 or         |
| 0010      | 加法 add         |
| *0011     | 左移 left-shift  |
| *0100     | 右移 right-shift |
| *0101     | 无运算 nop        |
| 0110      | 减法 sub         |
| 0111      | 小于时置位 slt      |
| 1100      | 逻辑或非 nor       |

表 4: ALUCtrOut 与 ALU 操作的对应关系

## 2.4 寄存器 (Register)、存储器 (Data Memory) 及有符号扩展单元 (Sign Extension) 原理分析

本部分和实验四的原理类似,但需要注意的是模块一些部分的修改。

在寄存器 (Register) 中可以响应 reset 信号, 当 reset 为高电平时, 所有寄存器清零。

在有符号扩展单元 (Sign Extension) 中增添了带符号扩展信号 signExt, 高电平代表进行带符号扩展, 低电平代表无符号扩展。

#### 2.5 指令存储器 (Instruction Memory) 原理分析

本部分和存储器 (Data Memory) 几乎相同,而且不需要支持修改操作。指令存储器接受一个 32 位地址输入, 输出一条 32 位指令。

#### 2.6 程序计数器模块 (PC) 原理分析

PC 寄存器模块用于管理 PC 地址。接受输入 pcIn, 在时钟上升沿将 pcIn 保存进 PC 寄存器。输出 pcOut 为当前 PC 地址, pcOut 与 PC 寄存器内容即时同步。当 reset 信号处于高电平时, 将 PC 值重置为 0。

#### 2.7 数据选择器 (Mux) 原理分析

数据选择器模块接受两个输入信号和一个选择信号,产生一个输出信号。本实验中,我们使用了两种数据选择器,包括 Mux5 和 Mux32。Mux32 的输入与输出信号均为 32 位,用于对进行数据进行选择。Mux5 的输出和输出信号为 5 位,用于寄存器选取信号的选择。

#### 2.8 顶层模块 (Top) 原理分析

顶层模块将以上所有模块连接在一起, 完成单周期 CPU 的功能。顶层模块中的连线包括数据通路和控制通路。数据通路用于传输中间数据, 一般为 32 位或 16 位; 控制通路用于传输控制信号。这里给出整体组装后的单周期 MIPS 处理器的电路设计图, 如图 1 所示。



图 1: 单周期 MIPS 处理器电路设计图

## 3 功能实现

#### 3.1 主控制单元 (Ctr) 功能实现

在第 2.1 节中我们详细介绍了主控制单元 (Ctr) 的设计,我们只需要按照设计的信号进行相应的实现即可。完整代码详见附录 A.1。

```
always @(opCode)
 2
       begin
           case(opCode)
 3
               6'b000000:
                            // R Type
 4
 5
               begin
                  regDst = 1;
 6
                  aluSrc = 0;
 7
                  memToReg = 0;
 8
                  regWrite = 1;
 9
10
                  memRead = 0;
                  memWrite = 0;
11
                  branch = 0;
12
                  aluOp = 3'b101;
13
                  jump = 0;
14
                  extSign = 0;
15
```

```
16
                  jalSign = 0;
17
               end
               6'b000010:
18
                             // jump
               begin
19
                  regDst = 0;
20
                  aluSrc = 0;
21
                  memToReg = 0;
22
                  regWrite = 0;
23
                  memRead = 0;
24
                  memWrite = 0;
25
                  branch = 0;
26
                  aluOp = 3'b110;
27
28
                  jump = 1;
29
                  extSign = 0;
30
                  jalSign = 0;
               end
31
               6'b000011:
                            // jal
32
33
               begin
                  regDst = 0;
34
                  aluSrc = 0;
35
                  memToReg = 0;
36
                  regWrite = 1;
37
                  memRead = 0;
38
                  memWrite = 0;
39
                  branch = 0;
40
                  aluOp = 3'b110;
41
42
                  jump = 1;
                  extSign = 0;
43
                  jalSign = 1;
44
45
               end
               6'b000100:
                             // beq
46
47
               begin
                  regDst = 0;
48
                  aluSrc = 0;
49
                  memToReg = 0;
50
51
                  regWrite = 0;
                  memRead = 0;
52
                  memWrite = 0;
53
                  branch = 1;
54
                  aluOp = 3'b001;
55
                  jump = 0;
56
```

```
57
                  extSign = 1;
                  jalSign = 0;
58
59
              end
              6'b001000:
                           // addi
60
              begin
61
                  regDst = 0;
62
                  aluSrc = 1;
63
                  memToReg = 0;
64
                  regWrite = 1;
65
                  memRead = 0;
66
                  memWrite = 0;
67
                  branch = 0;
68
69
                  aluOp = 3'bO10;
70
                  jump = 0;
71
                  extSign = 1;
                  jalSign = 0;
72
              end
73
              6'b001100: // andi
74
              begin
75
                  regDst = 0;
76
                  aluSrc = 1;
77
                  memToReg = 0;
78
                  regWrite = 1;
79
                  memRead = 0;
80
                  memWrite = 0;
81
                  branch = 0;
82
                  aluOp = 3'bO11;
83
                  jump = 0;
84
                  extSign = 0;
85
                  jalSign = 0;
86
87
              end
              6'b001101:
                          // ori
88
89
              begin
                  regDst = 0;
90
                  aluSrc = 1;
91
92
                  memToReg = 0;
                  regWrite = 1;
93
                  memRead = 0;
94
                  memWrite = 0;
95
                  branch = 0;
96
                  aluOp = 3'b100;
97
```

```
98
                   jump = 0;
                   extSign = 0;
99
100
                   jalSign = 0;
               end
101
102
               6'b100011:
                           // lw
103
104
               begin
105
                   regDst = 0;
                   aluSrc = 1;
106
                   memToReg = 1;
107
                   regWrite = 1;
108
                   memRead = 1;
109
110
                   memWrite = 0;
                   branch = 0;
111
                   aluOp = 3'b000;
112
                   jump = 0;
113
                   extSign = 1;
114
115
                   jalSign = 0;
               end
116
               6'b101011: // sw
117
118
               begin
                   regDst = 0;
119
                   aluSrc = 1;
120
                   memToReg = 0;
121
                   regWrite = 0;
122
123
                   memRead = 0;
                   memWrite = 1;
124
                   branch = 0;
125
                   aluOp = 3'bOOO;
126
                   jump = 0;
127
128
                   extSign = 1;
                   jalSign = 0;
129
               end
130
               default:
                             // default
131
               begin
132
133
                   regDst = 0;
                   aluSrc = 0;
134
                   memToReg = 0;
135
                   regWrite = 0;
136
                   memRead = 0;
137
                   memWrite = 0;
138
```

```
139
                    branch = 0;
                    aluOp = 3'b111;
140
141
                    jump = 0;
                    extSign = 0;
142
                    jalSign = 0;
143
144
                end
            endcase
145
146
        end
```

当出现不支持的指令时, 我们将 ALUOp 信号设为 111, 表示未定义的操作, 同时将其他的所有控制信号置零。

#### 3.2 运算单元控制器 (ALUCtr) 功能实现

在第 2.2 节中我们详细介绍了运算单元控制器 (ALUCtr) 的设计,我们只需要按照第 2.2 节中的表 3 进行相应信号的实现即可。完整代码详见附录 A.2。

```
always @ (aluOp or funct)
 1
 2
       begin
           shamtSign = 0;
 3
           jrSign = 0;
 4
           casex ({aluOp, funct})
 5
              9'b000xxxxxx: aluCtrOut = 4'b0010; // lw, sw
 6
              9'b001xxxxxx: aluCtrOut = 4'b0110; // beq
 7
 8
              9'b010xxxxxx: aluCtrOut = 4'b0010; // addi
9
              9'b011xxxxxx: aluCtrOut = 4'b0000; // andi
              9'b100xxxxxx: aluCtrOut = 4'b0001; // ori
10
              9'b101000000: // sll
11
12
              begin
                  aluCtrOut = 4'b0011;
1.3
                  shamtSign = 1;
14
15
              end
16
              9'b101000010: // srl
17
              begin
18
                  aluCtrOut = 4'b0100;
19
                  shamtSign = 0;
2.0
21
              end
22
              9'b101001000: // jr
23
              begin
                  aluCtrOut = 4'b0101;
24
                  jrSign = 1;
25
26
              end
```

```
9'b101100000: aluCtrOut = 4'b0010; // add
27
              9'b101100010: aluCtrOut = 4'b0110; // sub
28
              9'b101100100: aluCtrOut = 4'b0000; // and
29
              9'b101100101: aluCtrOut = 4'b0001; // or
30
              9'b101101010: aluCtrOut = 4'b0111; // slt
31
              9'b110xxxxxx: aluCtrOut = 4'b0101; // j, jal
32
          endcase
33
34
       end
```

注: 两个控制信号,用于控制操作数是否从 shamt 中选取的 shamtSign 信号以及指令是否为 jr 的 jrSign 信号。

#### 3.3 算术逻辑运算单元 (ALU) 功能实现

在第 2.3 节中我们详细介绍了运算单元控制器 (ALUCtr) 的设计,我们只需要按照第 2.3 节中的表 4 进行相应信号的实现即可。完整代码可参考附录 A.3。

```
always @ (input1 or input2 or aluCtrOut)
 1
 2
       begin
           case (aluCtrOut)
 3
              4'b0000: // and
                  aluRes = input1 & input2;
 5
              4'b0001: // or
 6
                  aluRes = input1 | input2;
 7
              4'b0010: // add
 8
9
                  aluRes = input1 + input2;
              4'b0011: // sll
10
                  aluRes = input2 << input1;</pre>
11
12
              4'b0100: // srl
                  aluRes = input2 >> input1;
1.3
              4'b0101: // no change
14
                  aluRes = input1;
15
              4'b0110: // sub
16
                  aluRes = input1 - input2;
17
              4'b0111: // slt
18
                  aluRes = ($signed(input1) < $signed(input2));</pre>
19
              4'b1100: // nor
2.0
                  aluRes = ~(input1 | input2);
21
22
              default:
                  aluRes = 0;
23
           endcase
24
           if (aluRes == 0)
25
              zero = 1;
26
```

# 3.4 寄存器 (Register)、存储器 (Data Memory) 和有符号扩展单元 (Sign Extension) 功能实现

寄存器 (Register)、存储器 (Data Memory) 和有符号扩展单元 (Sign Extension) 的实现与实验四的基本一致,但仍需注意的是寄存器中 reset 信号的响应、有符号扩展单元 signExt 信号的响应,完整代码可参考附录 A.4。

```
always @ (negedge clk or reset)
       begin
 2
           if (reset)
 3
 4
           begin
               for (cnt = 0; cnt < 32; cnt = cnt + 1)</pre>
 5
                   regFile[cnt] = 0;
 6
 7
           end
           else
 8
           begin
 9
               if (regWrite)
10
                   regFile[writeReg] = writeData;
11
           end
12
13
       end
```

#### 3.5 指令存储器 (Instruction Memory) 功能实现

在第 2.5 节中我们介绍了指令存储器 (Instruction Memory) 的原理,完整代码可参考附录 A.5。

```
module InstMemory(
    input [31 : 0] address,
    output [31 : 0] inst
    );

reg [31 : 0] instFile [0 : 1023];
    assign inst = instFile[address >> 2];
endmodule
```

#### 3.6 程序计数器模块 (PC) 功能实现

在第 2.6 节中我们详细介绍了程序计数器模块 (PC), 我们在此利用模块进行实现。完整的代码可参考附录 A.6。

```
module PC(
        input [31 : 0] pcIn,
 2
       input clk,
 3
       input reset,
 4
       output reg [31 : 0] pcOut
 5
       );
 6
 7
       initial pcOut = 0;
 8
 9
       always @ (posedge clk or reset)
10
       begin
11
12
           if(reset)
               pcOut = 0;
13
           else
14
               pcOut = pcIn;
15
       end
16
    endmodule
17
```

#### 3.7 数据选择器 (Mux) 功能实现

在第 2.7 节中我们详细介绍了数据选择器 (Mux), 其分为 5 位数据选择器与 32 位数据选择器; 两 类数据选择器的完整代码可参考附录 A.7。

```
module Mux5(
 1
       input select,
 2
       input [4 : 0] input1,
 3
       input [4 : 0] input2,
 4
       output [4 : 0] out
 5
 6
       );
       assign out = select ? input1 : input2;
 7
    endmodule
 8
 9
   module Mux32(
10
       input selectSignal,
11
       input [31 : 0] input1,
12
       input [31 : 0] input2,
13
       output [31 : 0] out
14
       );
15
       assign out = selectSignal ? input1 : input2;
16
```

#### 3.8 顶层模块 (Top) 功能实现

在第 2.8 节中我们详细介绍了顶层模块 (Top),我们根据图 1 中的连线,定义如下数据线 (每一条线都对应着图中的一条线)。

```
module Top(
 1
 2
           input clk,
           input reset
3
       );
 4
       wire REG_DST, ALU_SRC, MEM_TO_REG, REG_WRITE, MEM_READ;
 5
       wire MEM_WRITE, BRANCH, EXT_SIGN, JAL_SIGN, JUMP;
 6
 7
       wire SHAMT_SIGN, JR_SIGN, ALU_OUT_ZERO;
8
       wire [2 : 0] ALU_OP;
 9
       wire [3 : 0] ALU_CTR_OUT;
10
11
       wire [4 : 0] WRITE_REG1;
12
       wire [4 : 0] WRITE_REG2;
13
14
       wire [31 : 0] INST_ADDR;
15
       wire [31 : 0] INST;
16
       wire [31 : 0] REG_OUT1;
17
18
       wire [31 : 0] REG_OUT2;
       wire [31 : 0] ALU_INPUT1;
19
       wire [31 : 0] ALU_INPUT2;
20
       wire [31 : 0] EXT_RES;
21
       wire [31 : 0] ALU_RES;
22
       wire [31 : 0] REG_WRITE_DATA;
23
24
       wire [31 : 0] REG_WRITE_DATA_T;
       wire [31 : 0] PC_IN;
25
       wire [31 : 0] PC_OUT;
26
       wire [31 : 0] MEM_READ_DATA;
27
       wire [31 : 0] PC_TEMP1;
28
       wire [31 : 0] PC_TEMP2;
29
30
31
       Ctr mainCtr (
           .opCode(INST[31 : 26]),
32
           .regDst(REG_DST),
33
           .aluSrc(ALU_SRC),
34
           .aluOp(ALU_OP),
35
```

```
.memToReg(MEM_TO_REG),
36
           .regWrite(REG_WRITE),
37
           .memRead(MEM_READ),
38
           .memWrite(MEM_WRITE),
39
           .branch(BRANCH),
40
           .jump(JUMP),
41
           .extSign(EXT_SIGN),
42
           .jalSign(JAL_SIGN)
43
       );
44
       ALUCtr aluCtr (
45
           .aluOp(ALU_OP),
46
           .funct(INST[5 : 0]),
47
48
           .aluCtrOut(ALU_CTR_OUT),
           .shamtSign(SHAMT_SIGN),
49
           .jrSign(JR_SIGN)
50
       );
51
       ALU alu (
52
           .input1(ALU_INPUT1),
53
           .input2(ALU_INPUT2),
54
           .aluCtrOut(ALU_CTR_OUT),
55
           .zero(ALU_OUT_ZERO),
56
           .aluRes(ALU_RES)
57
       );
58
       Registers registers (
59
           .readReg1(INST[25 : 21]),
60
           .readReg2(INST[20 : 16]),
61
           .writeReg(WRITE_REG1),
62
           .writeData(REG_WRITE_DATA),
63
           .regWrite(REG_WRITE & (~JR_SIGN)),
64
           .clk(clk),
65
66
           .reset(reset),
           .readData1(REG_OUT1),
67
           .readData2(REG_OUT2)
68
69
       );
       dataMemory dataMemory (
70
71
           .clk(clk),
           .address(ALU_RES),
72
           .writeData(REG_OUT2),
73
           .memWrite(MEM_WRITE),
74
75
           .memRead(MEM_READ),
           .readData(MEM_READ_DATA)
76
```

```
);
77
        signext signExt (
78
            .inst(INST[15 : 0]),
79
            .signExt(EXT_SIGN),
80
            .data(EXT_RES)
81
        );
82
        InstMemory instMemory (
83
            .address(PC_OUT),
84
            .inst(INST)
85
        );
86
        PC pc_controller (
87
            .pcIn(PC_IN),
88
89
            .clk(clk),
            .reset(reset),
90
            .pcOut(PC_OUT)
91
        );
92
        Mux32 branch_mux (
93
94
            .select(BRANCH & ALU_OUT_ZERO),
            .input1(PC_OUT + 4 + (EXT_RES << 2)),
95
            .input2(PC_OUT + 4),
96
            .out(PC_TEMP1)
97
        );
98
        Mux32 jr_mux (
99
            .select(JR_SIGN),
100
            .input1(REG_OUT1),
101
            .input2(PC_TEMP2),
102
            .out(PC_IN)
103
        );
104
        Mux32 jump_mux (
105
            .select(JUMP),
106
            .input1(((PC_OUT + 4) & 32'hf0000000) + (INST[25 : 0] << 2)),
107
            .input2(PC_TEMP1),
108
            .out(PC_TEMP2)
109
        );
110
        Mux32 jal_mux (
111
112
            .select(JAL_SIGN),
            .input1(PC_OUT + 4),
113
            .input2(REG_WRITE_DATA_T),
114
            .out(REG_WRITE_DATA)
115
116
        );
        Mux32 reg_shamt_mux (
117
```

```
118
            .select(SHAMT_SIGN),
            .input1(\{27'b0, INST[10:6]\}),
119
120
            .input2(REG_OUT1),
            .out(ALU_INPUT1)
121
        );
122
        Mux32 alu_src_mux (
123
            .select(ALU_SRC),
124
            .input1(EXT_RES),
125
            .input2(REG_OUT2),
126
            .out(ALU_INPUT2)
127
        );
128
        Mux32 mem_to_reg_mux (
129
130
            .select(MEM_TO_REG),
            .input1(MEM_READ_DATA),
131
            .input2(ALU_RES),
132
            .out(REG_WRITE_DATA_T)
133
        );
134
        Mux5 reg_dst_mux (
135
136
            .select(REG_DST),
            .input1(INST[15 : 11]),
137
            .input2(INST[20 : 16]),
138
            .out(WRITE_REG2)
139
        );
140
        Mux5 jar_reg_mux (
141
            .select(JAL_SIGN),
142
143
            .input1(5'b11111),
            .input2(WRITE_REG2),
144
            .out(WRITE_REG1)
145
        );
146
    endmodule
147
```

## 4 结果验证

编写如下的汇编代码进行测试,

| 地址   | 数据         | 地址   | 数据         | 地址   | 数据         | 地址   | 数据         |
|------|------------|------|------------|------|------------|------|------------|
| 0x00 | 0x00000000 | 0x01 | 0x00000001 | 0x02 | 0x00000002 | 0x03 | 0x00000003 |
| 0x04 | 0x00000004 | 0x05 | 0x00000005 | 0x06 | 0x00000006 | 0x07 | 0x00000007 |

表 5: 内存中的初始值

| 指令地址 | 指令                                      | 指令解释                 | 执行结果                                            |
|------|-----------------------------------------|----------------------|-------------------------------------------------|
| 0x00 | 100011 00000 00001 00000000000000000    | lw \$1, 0(\$0)       | \$1 = Mem[0] = 0                                |
| 0x04 | 000010 00000000000000000000000000000000 | j 2                  | go to 0x0c                                      |
| 0x08 | 000000 00000 00000 00000000000000000    | nop                  | (not executed)                                  |
| 0x0c | 100011 00000 00010 00000000000000001    | lw \$2, 1(\$0)       | \$2 = Mem[1] = 1                                |
| 0x10 | 100011 00000 00011 0000000000000100     | lw \$3, 4(\$0)       | \$3 = Mem[4] = 4                                |
| 0x14 | 100011 00000 00100 00000000000000111    | lw \$4, 7(\$0)       | $\$4 = \mathrm{Mem}[7] = 7$                     |
| 0x18 | 001000 00001 00101 0000000100000000     | addi \$5, \$1, 256   | \$5 = 0 + 256 = 256                             |
| 0x1c | 001000 00010 00110 0000000011111111     | addi \$6, \$2, 255   | \$6 = 1 + 255 = 256                             |
| 0x20 | 001100 00011 00111 0000000011111111     | andi \$7, \$3, 255   | \$7 = 4 & 255 = 4                               |
| 0x24 | 001101 00100 01000 0000000011111111     | ori \$8, \$4, 255    | $\$8 = 7 \mid 255 = 255$                        |
| 0x28 | 101011 00101 00101 00000000000001011    | sw \$5, 11(\$5)      | Mem[16] = 256                                   |
| 0x2c | 000100 00101 00110 000000000000000001   | beq \$5, \$6, 1      | go to 0x3c                                      |
| 0x30 | 000000 00000 00000 00000000000000000    | nop                  | (not executed)                                  |
| 0x34 | 000000 00000 00111 01001 00010 000000   | sll \$9, \$7, 2      | $\$9 = 4 \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \$   |
| 0x38 | 000000 00001 01000 01010 00000 100000   | add \$10, \$1, \$8   | \$10 = 0 + 255 = 255                            |
| 0x3c | 000000 00101 00010 01011 00000 100010   | sub \$11, \$5, \$2   | \$11 = 256 - 1 = 255                            |
| 0x40 | 000000 00110 00100 01100 00000 100100   | and \$12, \$6, \$4   | \$12 = 256 & 7 = 0                              |
| 0x44 | 000000 01000 00111 01101 00000 100101   | or \$13, \$8, \$7    | \$13 = 255 & 4 = 255                            |
| 0x48 | 000000 00000 00110 01110 00010 000010   | srl \$14, \$6, 2     | $$14 = 256 \times 2 = 64$                       |
| 0x4c | 000000 01100 01011 01111 00000 101010   | slt \$15, \$12, \$11 | \$15 = 1                                        |
| 0x50 | 000000 01110 01101 10000 00000 101010   | slt \$16, \$14, \$13 | \$16 = 1                                        |
| 0x54 | 000011 0000000000000000000000010111     | jal 23               | go to 0x5c                                      |
| 0x58 | 000100 01001 01110 000000000000000010   | beq \$9, \$14, 2     | go to 0x64                                      |
| 0x5c | 000000 00000 01001 01001 00010 000000   | sll \$9, \$9, 2      | $\$9 = 16 \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $ |
| 0x60 | 000000 11111 000000000000000 001000     | jr \$31              | go to 0x58                                      |
| 0x64 | 000000 01010 01011 01010 00000 100000   | add \$10, \$10, \$11 | \$10 = 255 + 255 = 510                          |

表 6: 汇编代码及其解释、执行结果

其中,执行结果中表明"(not executed)"表示该指令由于跳转等原因没有被执行。可以看出,我们的测试汇编代码完整测试了本实验要求的所有的 16 条汇编指令,因此该测试结果能够反映出处理器的整体实现准确与否。

我们在激励文件中使用 readmemh 命令将其读入存储器模块的对应位置进行测试。

```
$\frac{1}{2} \$\readmemh(\"D:/Archlabs/lab05/mem_data.txt\", cpu.dataMemory.memFile);
$\frac{1}{2} \$\readmemb(\"D:/Archlabs/lab05/mem_inst.txt\", cpu.instMemory.instFile);
$\frac{1}{2} \$\readmemb(\"D:/Archlabs/lab05/mem_inst.txt\", cpu.instMemory.instFile);
$\frac{1}{2} \$\rightarrow \text{Transfer of the content of the content
```

我们用上述汇编命令以及内存的初始情况进行测试,测试结果如图 2 所示。



图 2: 单周期 MIPS 处理器测试结果

对照图 2 与表 6 中的执行结果可知,运行结果完全正确,仿真成功,说明整个单周期 MIPS 处理器实现正确。

## 5 总结与反思

本实验实现了一个完整的支持 16 指令的单周期 MIPS 处理器,以实验三、四的模块为基础,添加部分其他模块后,将模块连线组装成一个完整的单周期 MIPS 处理器。本实验中要将之前所实现的部件组合在一起,需要数十根连线,有条理地将这些线路连接到合适的模块是正确实现单周期流水线的关键。在我的实验中,将顶层模块代码依照各模块来划分成若干部分,这样增强了代码的条理性,使得连线更为规范。

通过这次实验,我对于 MIPS 处理器的数据通路、信号通路等都有了一个更加清晰地了解,也对单周期 MIPS 有了更加深刻的理解。同时,在调试的过程中,我对 MIPS 处理器的指令也有了更加深刻的理解;通过自行编写对应的汇编代码、手动模拟汇编代码的运行结果、与自己写的处理器的运行结果进行对照等过程,对汇编代码也有了更加深刻的理解。

### 附录 A 设计文件代码实现

#### A.1 主控制器 (Ctr) 的代码实现

参见代码文件 Ctr.v。

#### A.2 运算单元控制器 (ALUCtr) 的代码实现

参见代码文件 ALUCtr.v。

#### A.3 算术逻辑运算单元 (ALU) 的代码实现

参见代码文件 ALU.v。

## A.4 寄存器 (Register)、存储器 (Data Memory) 和有符号扩展单元 (Sign Extension) 的代码实现

参见代码文件 Registers.v, dataMemory.v 及 signext.v。

#### A.5 指令存储器 (Instruction Memory) 的代码实现

参见代码文件 instMemory.v。

#### A.6 程序计数器模块 (PC) 的代码实现

参见代码文件 PC.v。

#### A.7 数据选择器 (Mux) 的代码实现

参见代码文件 Mux5.v 与 Mux32.v。

#### A.8 顶层模块 (Top) 的代码实现

参见代码文件 Top.v。

## 附录 B 激励文件代码实现

参见代码文件 Top\_tb.v。