#### 5段流水CPU设计

#### 水青冈

- 1. 实验目的
- 2. 实验所用仪器及元器件
- 3. 实验任务
  - 3.1 实验内容和任务
  - 3.2 设计过程
    - 3.2.1 采用Verilog在quartus Ⅱ中实现基本的具有20条MIPS指令的5段流水CPU设计。
      - 3.2.1.1 pipepc的实现
      - 3.2.1.2 pipeif的实现
      - 3.2.1.3 pipeir的实现
      - 3.2.1.4 pipeid的实现
        - 3.2.1.4.1 pipeid中cu的实现
      - 3.2.1.5 pipedereg的实现
      - 3.2.1.6 pipeexe的实现
        - 3.2.1.6.1 pipeexe中alu的实现
      - 3.2.1.7 pipeemreg的实现
      - 3.2.1.8 pipemem的实现
      - 3.2.1.9 pipemwreg的实现
    - 3.2.2 实现CPU与外部设备的输入输出端口设计
      - 3.2.2.1 sc\_datamem.v文件
      - 3.2.2.2 io\_input\_reg.v文件
      - 3.2.2.3 io\_output\_reg.v文件
      - 3.2.2.4 最终的顶层文件
      - 3.2.2.5 汇编指令及对应的.mif文件

#### 3.3实验步骤

- 3.3.1 采用Verilog在quartusⅡ中实现基本的具有20条MIPS指令的5段流水CPU设计。
- 3.3.2 利用实验提供的标准测试程序代码,完成仿真测试。
- 3.3.3 实现CPU与外部设备的输入输出端口设计
- 3.3.4 仿真验证设计
- 3.3.5 在quartusⅡ中,进行系列操作
- 3.3.6 编译, 烧录至DE1-SOC
- 3.4 Verilog代码

#### 实验总结

# 5段流水CPU设计

# 水青冈

# 1. 实验目的

- 1. 理解计算机指令流水线的协调工作原理, 初步掌握流水线的设计和实现原理。
- 2. 深刻理解流水线寄存器在流水线实现中所起的重要作用。
- 3. 理解和掌握流水段的划分、设计原理及其实现方法原理。
- 4. 掌握运算器、寄存器堆、存储器、控制器在流水工作方式下,有别于实验一的设计和实现 方法。
- 5. 掌握流水方式下,通过I/O端口与外部设备进行信息交互的方法。

# 2. 实验所用仪器及元器件

DE1-SOC实验板 1套

# 3. 实验任务

## 3.1 实验内容和任务

- 1. 采用Verilog在quartus II 中实现基本的具有20条MIPS指令的5段流水CPU设计。
- 2. 利用实验提供的标准测试程序代码, 完成仿真测试。

- 3. 采用I/O统一编址方式,即将输入输出的I/O地址空间,作为数据存取空间的一部分,实现 CPU与外部设备的输入输出端口设计。实验中可采用高端地址。
- 4. 利用设计的I/O端口,通过Iw指令,输入DE2实验板上的按键等输入设备信息。即将外部设备状态,读到CPU内部寄存器。
- 5. 利用设计的I/O端口,通过sw指令,输出对DE2实验板上的LED灯等输出设备的控制信号 (或数据信息)。即将对外部设备的控制数据,从CPU内部的寄存器,写入到外部设备的 相应控制寄存器(或可直接连接至外部设备的控制输入信号)。
- 6. 利用自己编写的程序代码,在自己设计的CPU上,实现对板载输入开关或按键的状态输入,并将判别或处理结果,利用板载LED灯或7段LED数码管显示出来。
- 7. 例如,将一路4bit二进制输入与另一路4bit二进制输入相加,利用两组分别2个LED数码管以10进制形式显示"被加数"和"加数",另外一组LED数码管以10进制形式显示"和"等。 (具体任务形式不做严格规定,同学可自由创意)。
- 8. 在实现MIPS基本20条指令的基础上,掌握新指令的扩展方法。
- 在实验报告中,汇报自己的设计思想和方法;并以汇编语言的形式,提供以上两种指令集 (MIPS和Y86)应用功能的程序设计代码,并提供程序主要流程图。

## 3.2 设计过程

# 3.2.1 采用Verilog在quartus 工中实现基本的具有20条MIPS指令的5段流水CPU设计。

王赓老师已经给出了顶层设计,同时还有上次的代码可以使用,我需要做的工作就是依次把顶层设计中的所有模块都进行实现。流水线和单周期不同的地方就在于对于冒险的处理,尤其是数据冒险和控制冒险,对于数据冒险来说,主要是弄清楚如何正确设置fwda和fwdb的值,以及wpcir的值(低电平有效)。而对于控制冒险,则默认采用了延迟转移槽的方法,即紧随其后的语句一定会被执行。另外需要注意的地方在于,用什么时钟去控制寄存器对,指令ROM和数据RAM的读写。

## 3.2.1.1 pipepc的实现

对于pipepc来说,它的作用是提供下一条指令的PC值,即在上升沿到来时,更新PC值。如果resetn和wpcir都为1的话,那么PC值更新为输入的npc,如果resetn有效即为0,那么PC值更新为-4,如果resetn无效即为1而wpcir有效即为0,那么PC值不变(即由于lw导致的数据冒险,需要插入气泡)。

```
module pipepc( npc,wpcir,clock,resetn,pc );
input [31:0] npc;
input clock,resetn,wpcir;
```

```
4
       output [31:0] pc;
 5
       reg [31:0] pc;
       always @ (negedge resetn or posedge clock)
 6
          if (resetn == 0) // 清零
7
8
            begin
9
              pc \ll -4;
          end
10
11
            else
12
            if (wpcir != 0)
            begin
13
14
              pc <= npc; // 更新
15
          end
   endmodule
16
```

#### 3.2.1.2 pipeif的实现

pipeif的主要功能是,从指令ROM中取指令,同时设置下一条指令的PC值npc, pc4即原PC值+4, bpc即beq和bne对应的pc值,da即jr指令中读取的寄存器的值,jpc即j和jal指令对应的pc值。特别地,对于指令ROM,它对应的时钟mem\_clock是clock的反向,也就是说,当clock从1跳变到0时,mem\_clock从0跳变到1,读取出指令,使PC值有半个时钟周期的时间稳定下来,稳定后,再读取指令。

```
1
   module pipeif( pcsource,pc,bpc,da,jpc,npc,pc4,ins,mem_clock );
 2
        input [1:0] pcsource;
 3
       input
                         mem_clock;
       input [31:0] pc, bpc, jpc, da;
 4
 5
       output [31:0] npc, pc4, ins;
 6
 7
       wire
                [31:0] npc, pc4, ins;
 8
       mux4x32 npc_mux( pc4, bpc, da, jpc, pcsource, npc ); // 下一个pc值
 9
10
11
       assign pc4 = pc + 4;
12
13
       sc_instmem imem ( pc, ins, mem_clock ); //mem_clock是clock的反向
14
15 endmodule
```

#### 3.2.1.3 pipeir的实现

段间寄存器pipeir的功能主要是输出dpc4和inst, 当resetn有效时, dpc4设置为-4, 而inst 置0, 即sll \$0,\$0,0。当resetn无效, 而wpcir有效即为0时, 值不变。

```
1
   module pipeir( pc4, ins, wpcir, clock, resetn, dpc4, inst );
 2
        input [31:0] pc4, ins;
 3
        input
                       wpcir, clock, resetn:
 4
        output [31:0] dpc4, inst;
 5
              [31:0] dpc4, inst;
 6
        rea
 7
 8
        always @(posedge clock or negedge resetn)
 9
        begin
            if (resetn == 0) //清零
10
11
            begin
12
                dpc4 \ll 0;
13
                inst <= 0; // 指令清0实际上是s11 $0,$0,0
14
            end
15
            else
            if (wpcir != 0)
16
17
            begin
                dpc4 <= pc4; // 实现数据的传递
18
19
                inst <= ins;</pre>
20
            end
21
        end
22
   endmodule
```

#### 3.2.1.4 pipeid的实现

pipeid是核心模块,它负责读写寄存器堆,译码并生成相应的控制信号,同时还需要进行冒险检测并作出相应的处理,所以它的输入很多,输出也很多,需要仔细的核对。其中寄存器堆regfile的实现和单周期中完全相同,故不赘述,而多路器的实现亦是如此,需要特别说明就是cu的实现。

```
6
        input [4:0] mrn, ern, wrn;
 7
                          mm2reg, em2reg, mwreg, ewreg, wwreg, clock.
        input
    resetn;
        input [31:0] inst, wdi, ealu, malu, mmo, dpc4;
 8
 9
        output [31:0] bpc, dimm, jpc, da, db;
10
        output [1:0] pcsource;
                      wpcir, dwreg, dm2reg, dwmem, daluimm, dshift, djal;
11
        output
12
        output [3:0] daluc:
13
        output [4:0] drn;
14
15
        wire
               [31:0] q1, q2, da, db;
16
        wire
                 [1:0] fwda, fwdb;
17
                          rsrtequ = (da == db);
        wire
        wire
                      reart, sext;
18
                      e = sext & inst[15];
19
        wire
        wire [31:0] dimm = {{16{e}}}, inst[15:0]};
20
              [31:0] jpc = \{dpc4[31:28], inst[25:0], 1'b0, 1'b0\};
21
        wire
               [31:0] offset = \{\{14\{e\}\}, inst[15:0], 1'b0, 1'b0\};
22
        wire
23
        wire
               [31:0] bpc = dpc4 + offset;
24
25
        regfile rf( inst[25:21], inst[20:16], wdi, wrn, wwreg, clock,
    resetn, q1, q2 ); //寄存器堆
        mux4x32 da_mux(q1, ealu, malu, mmo, fwda, da); // 四选一 可能的直
26
   诵
        mux4x32 db_mux( q2, ealu, malu, mmo, fwdb, db );
27
28
        mux2x5 rn_mux( inst[15:11], inst[20:16], regrt, drn );
29
        sc_cu cu( inst[31:26], inst[5:0], rsrtequ, dwmem, dwreg, regrt,
    dm2reg, daluc, dshift, daluimm, pcsource, djal, sext, wpcir,
    inst[25:21], inst[20:16], mrn, mm2reg, mwreg, ern, em2reg, ewreg,
    fwda, fwdb );//控制单元
30
31 endmodule
```

#### 3.2.1.4.1 pipeid中cu的实现

cu是核心中的核心,首先它对指令进行译码,指示出当前指令是哪条指令,和单周期不同的是增加了wpcir和fwda及fwdb信号,如何设置这两个信号是本次实验的关键。对于wpcir,如果上一条指令是lw指令,且写入的寄存器号和当前指令的rs和rt相同,那么wcpir为0。注意,这样的写法可能会产生误判,比如当前指令是一条l型指令,它的rt字段是目的寄存器,而不是源操作数寄存器,这里可能会产生一条不必要的停顿,但是不影响正常执行,对速度有一定影

响。对于fwda和fwdb的设置,利用嵌套的三个if语句来区分如果需要上一条指令alu的结果,如果需要前两条指令alu的结果,如果需要前两条指令数据RAM的输出。如果都不是,那么不需要直通。这种写法,也可能导致不必要的直通,但是对程序执行实际上没有影响。

```
1 module sc_cu (op, func, rsrtequ, wmem, wreg, regrt, m2reg, aluc,
          shift.
  2
                                              aluimm, pcsource, jal, sext, wpcir, rs, rt, mrn, mm2reg,
         mwreg, ern, em2reg, ewreg, fwda, fwdb);
  3
                 input [5:0] op, func;
                                                   rsrtequ, mwreg, ewreg, mm2reg, em2reg;
  4
                 input
  5
                   input [4:0] rs, rt, mrn, ern;
  6
                 output
                                                  wreg, regrt, jal, m2reg, shift, aluimm, sext, wmem,
         wpcir;
  7
                 output [3:0] aluc;
  8
                 output [1:0] pcsource, fwda, fwdb;
  9
                  reg [1:0] fwda, fwdb;
10
                 wire r_type = ~ | op; // 是否是R型指令
11
12
                   //该R型指令是否出现
13
                 wire i_add = r_type \& func[5] \& \sim func[4] \& \sim func[3] \& \sim func[2] \&
          ~func[1] & ~func[0];
                                                                             //100000
14
                 wire i_sub = r_type & func[5] & \simfunc[4] & \simfunc[3] &\simfunc[2] &
            func[1] & ~func[0];
                                                                           //100010
                 wire i_and = r_type & func[5] & \simfunc[4] & \simfunc[3] &func[2] &
15
         ~func[1] & ~func[0];
                                                                             //100100
16
                 wire i_or = r_type & func[5] & \simfunc[4] & \simfunc[3] &func[2] &
          ~func[1] & func[0];
                                                                             //100101
                 wire i_xor = r_type & func[5] & \simfunc[4] & \simfunc[3] &func[2] &
17
            func[1] & ~func[0];
                                                                             //100110
                 wire i_s11 = r_type \& \sim func[5] \& \sim func[4] \& \sim func[3] \& \sim func[2] \& order i_s11 = r_type \& \sim func[5] \& order i_s12 = r_type \& order i_s13 = r_type \& order i
18
          ~func[1] & ~func[0];
                                                                        //000000
19
                 wire i\_srl = r\_type \& \sim func[5] \& \sim func[4] \& \sim func[3] \& \sim func[2] \& 
            func[1] & ~func[0];
                                                                         //000010
20
                 wire i_sra = r_type & ~func[5] & ~func[4] & ~func[3] &~func[2] &
            func[1] & func[0];
                                                                        //000011
21
                 wire i_jr = r_{type} \& \neg func[5] \& \neg func[4] \& func[3] \& \neg func[2] \&
          ~func[1] & ~func[0]; //001000
22
23
24
                   //该I型指令是否出现
```

```
wire i_addi = op[5] & op[4] & op[3] & op[2] & op[1] & op[0];
    //001000
26
       wire i_andi = -op[5] \& -op[4] \& op[3] \& op[2] \& -op[1] \& -op[0];
    //001100
27
       wire i_ori = \sim op[5] \& \sim op[4] \& op[3] \& op[2] \& \sim op[1] \& op[0];
    //001101
       wire i_xori = -op[5] \& -op[4] \& op[3] \& op[2] \& op[1] \& -op[0];
28
    //001110
29
       wire i_1w = op[5] \& op[4] \& op[3] \& op[2] \& op[1] \& op[0];
    //100011
30
       wire i_sw
                   = op[5] \& \sim op[4] \& op[3] \& \sim op[2] \& op[1] \& op[0];
    //101011
       wire i_beq = -op[5] \& -op[4] \& -op[3] \& op[2] \& -op[1] \& -op[0];
31
    //000100
32
       wire i_bne = \sim op[5] \& \sim op[4] \& \sim op[3] \& op[2] \& \sim op[1] \& op[0];
    //000101
33
       wire i_1ui = -op[5] \& -op[4] \& op[3] \& op[2] \& op[1] \& op[0];
    //001111
34
       wire i_j = -op[5] \& -op[4] \& -op[3] \& -op[2] \& -op[1] \& -op[0];
    //000010
35
       wire i_{jal} = -op[5] \& -op[4] \& -op[3] \& -op[2] \& -op[1] \& -op[0];
    //000011
36
37
        assign wpcir = ~(em2reg & ( ern == rs | ern == rt )); //lw的数据冒
38
    险 可能需要停顿
39
       // 如果wpcir为0 那么插入气泡停顿 将所有的控制信号置0
40
       assign pcsource[1] = i_jr | i_j | i_jal;
41
42
       assign pcsource[0] = ( i_beq & rsrtequ ) | (i_bne & ~rsrtequ) | i_j
    | i_jal ;
43
       assign wreg = wpcir & (i_add | i_sub | i_and | i_or | | i_xor |
44
45
                     i_sll | i_srl | i_sra | i_addi | i_andi |
46
                     i_ori | i_xori | i_lw | i_lui | i_jal);
47
48
       assign aluc[3] = wpcir & i_sra;
       assign aluc[2] = wpcir & (i_sub | i_or | i_lui | i_srl | i_sra |
49
    i_ori);
       assign aluc[1] = wpcir & (i_xor | i_lui | i_sll | i_srl | i_sra |
50
    i_xori);
```

```
assign aluc[0] = wpcir & (i_and | i_or | i_sll | i_srl | i_sra |
51
   i_andi | i_ori);
52
      assign shift = wpcir & (i_sll | i_srl | i_sra);
53
54
      assign aluimm = wpcir & (i_addi | i_andi | i_ori | i_xori | i_lw |
   i_sw);
55
      assign sext
                    = wpcir & (i_addi | i_lw | i_sw | i_beq | i_bne);
56
      assign wmem
                    = wpcir & i_sw;
57
      assign m2reg = wpcir & i_lw;
      assign regrt = wpcir & (i_addi | i_andi | i_ori | i_xori | i_lw |
58
   i_lui);
      assign jal = wpcir & i_jal;
59
60
61
62
      // fwda和fwda的设置
63
      always @(*)
64
      begin
65
       if(ewreg & (ern != 0) & (ern == rs) ) //将上一条指令的alu结果直通 如
66
   果上一条指令是1w的话 那么会停顿一个时钟周期 所以误直通了也无所谓
67
            fwda<=2'b01;
68
         else
           if (mwreg & ~ mm2reg & (mrn != 0) & (mrn == rs) ) //将前两条指令
69
   的alu结果直通
               fwda<=2'b10;
70
71
            else
72
               if (mwreg & mm2reg & (mrn != 0) & (mrn == rs) ) // 将前两
   条指令的数据RAM的输出直通
73
                 fwda<=2'b11;
74
               else
75
                 fwda<=2'b00; // 无需直通
76
      end
77
78
79
      always @(*)
80
      begin
81
         if(ewreg & (ern != 0) & (ern == rt) ) //将上一条指令的alu结果直通
            fwdb<=2'b01;
82
83
         else
84
            if (mwreg & ~ mm2reg & (mrn != 0) & (mrn == rt) ) //将前两条
   指令的alu结果直通
               fwdb<=2'b10;
85
```

```
86
            else
               if
                   (mwreg & mm2reg & (mrn != 0) & (mrn == rt) ) // 将前
87
   两条指令的数据RAM的输出直通
                  fwdb<=2'b11:
88
89
               else
90
                  fwdb<=2'b00; // 无需直通
91
92
      end
93
94
   endmodule
```

#### 3.2.1.5 pipedereg的实现

段间寄存器pipedereg的主要功能是如果清零信号有效,那么将输出置零,否则在时钟上 升沿将输入对应地赋给输出。

```
module pipedereg (dwreg, dm2reg, dwmem, daluc, daluimm, da, db, dimm,
   drn, dshift,
        djal, dpc4, clock, resetn, ewreg, em2reg, ewmem, ealuc, ealuimm,
 2
 3
        ea, eb, eimm, ern0, eshift, ejal, epc4);
 4
                      dwreg, dm2reg, dwmem, daluimm, dshift, djal, clock,
        input
    resetn;
 5
        input [3:0] daluc:
       input [31:0] dimm, da, db, dpc4;
 6
 7
       input [4:0] drn;
                         ewreg, em2reg, ewmem, ealuimm, eshift, eial;
 8
       output
 9
       output [3:0] ealuc;
       output [31:0] eimm, ea, eb, epc4;
10
       output [4:0] ern0;
11
                          ewreg, em2reg, ewmem, ealuimm, eshift, ejal:
12
        reg
13
              [3:0] ealuc;
        reg
14
              [31:0] eimm, ea, eb, epc4;
        reg
15
              [4:0] ern0;
        reg
16
17
        always @( posedge clock or negedge resetn)
        begin
18
19
            if (resetn == 0 ) //清零
            begin
20
21
                ewreg \ll 0;
22
                em2reg <= 0;
```

```
23
                  ewmem \ll 0;
24
                  ealuimm <= 0;
                  eshift <= 0;
25
                  ejal <= 0;
26
27
                  ealuc <= 0;
                  eimm <= 0;
28
29
                  ea \ll 0;
30
                  eb <= 0;
                  epc4 \ll 0;
31
32
                  ern0 \ll 0;
33
             end
34
             else
35
             begin
36
                  ewreg <= dwreg;</pre>
37
                  em2reg <= dm2reg;</pre>
38
                  ewmem <= dwmem;</pre>
39
                  ealuimm <= daluimm;
40
                  eshift <= dshift;
                  ejal <= djal;
41
42
                  ealuc <= daluc;
43
                  eimm <= dimm;
44
                  ea <= da;
                  eb \ll db;
45
46
                  epc4 <= dpc4;
47
                  ern0 <= drn;
48
             end
49
         end
    endmodule
50
```

## 3.2.1.6 pipeexe的实现

pipeexe的主要任务就是进行算术运算, 里面调用了alu模块。

```
module pipeexe( ealuc, ealuimm, ea, eb, eimm, eshift, ern0, epc4,
    ejal, ern, ealu );

input [3:0] ealuc;

input [31:0] ea, eb, eimm, epc4;

input [4:0] ern0;

input ealuimm, eshift, ejal;

output [31:0] ealu;
```

```
output [4:0] ern;
 8
       wire [31:0] a, b, r;
 9
       wire [31:0] epc8 = epc4 + 4;
       wire [4:0] ern = ern0 | \{5\{ejal\}\}\};
10
11
       mux2x32 a_mux( ea, eimm, eshift, a );
       mux2x32 b_mux( eb, eimm, ealuimm, b );
12
13
       mux2x32 ealu_mux( r, epc8, ejal, ealu );
14
               al_unit(a,b,ealuc,r); // alu模块
       alu
15
16 endmodule
```

#### 3.2.1.6.1 pipeexe中alu的实现

我对真值表进行了修改,将所有的x都明确为0,所以这里相应进行了修改。

```
1
   module alu (a,b,aluc,s);
 2
       input [31:0] a,b;
 3
       input [3:0] aluc:
 4
       output [31:0] s;
 5
       req [31:0] s:
 6
       always @ (a or b or aluc)
 7
          begin
                                                    // event
 8
             case (aluc)
 9
                 4'b0000: s = a + b:
                                                    //x000 ADD
10
                 4'b0100: s = a - b;
                                                    //x100 SUB
11
                 4'b0001: s = a \& b;
                                                    //x001 AND
12
                 4'b0101: s = a | b;
                                                    //x101 OR
13
                 4'b0010: s = a \land b;
                                                    //x010 XOR
                 4'b0110: s = b \ll 16;
                                                    //x110 LUI: imm << 16bit
14
15
                 4'b0011: s = b \ll a;
                                                    //0011 SLL: rd <- (rt <<
   sa)
                                                    //0111 SRL: rd <- (rt >>
16
                 4'b0111: s = b >> a:
   sa) (logical)
17
                 4'b1111: s = \$signed(b) >>> a; //1111 SRA: rd <- (rt >>
   sa) (arithmetic)
18
                 default: s = 0;
19
             endcase
20
          end
21 endmodule
```

#### 3.2.1.7 pipeemreg的实现

段间寄存器pipeemreg,如果清零信号有效,那么清零,否则按照相应的输入输出。

```
1
    module pipeemreg( ewreg, em2reg, ewmem, ealu, eb, ern, clock, resetn,
 2
        mwreg,mm2reg,mwmem,malu,mb,mrn);
 3
        input
                         ewreg, em2reg, ewmem, clock, resetn;
        input [31:0] ealu, eb;
 4
 5
        input [4:0]
                         ern;
 6
                         mwreg, mm2reg, mwmem;
        output
 7
        output [31:0]
                         malu, mb;
 8
        output [4:0]
                         mrn;
                         mwreg, mm2reg, mwmem;
 9
        reg
10
        reg
                [31:0]
                         malu, mb;
11
                [4:0]
                         mrn;
        reg
12
13
        always @( posedge clock or negedge resetn)
14
        begin
15
             if (resetn == 0 ) // 清零
16
             begin
17
                 mwreg \ll 0;
18
                 mm2reg \ll 0;
19
                 mwmem <= 0;
20
                 malu \ll 0;
21
                 mb \ll 0;
22
                 mrn \ll 0;
23
             end
24
             else
25
             begin
26
                 mwreg <= ewreg;</pre>
27
                 mm2reg <= em2reg;</pre>
28
                 mwmem <= ewmem;</pre>
29
                 malu <= ealu;
30
                 mb \ll eb;
31
                 mrn <= ern;</pre>
32
             end
33
        end
    endmodule
34
```

#### 3.2.1.8 pipemem的实现

pipemem的主要功能就是从数据RAM读取数据或将数据写入到数据RAM中,而 sc\_datamem的详情将在后面的I/O扩展部分着重介绍。

```
1 module pipemem( resetn.mwmem, malu, mb, clock, mem_clock,
   mmo,in_port0,in_port1,in_port_sub,out_port0,out_port1,out_port2,LEDR4
   );
2
       input
                       mwmem, clock,resetn;
3
       input [31:0]
                       malu, mb;
4
                      mem_clock,in_port_sub;
       input
5
       input [3:0] in_port0,in_port1;
6
       output LEDR4;
7
       output [31:0] mmo,out_port0,out_port1,out_port2;
        sc_datamem dmem( resetn, malu, mb, mmo, mwmem,
   mem_clock,in_port0,in_port1,in_port_sub,out_port0,out_port1,out_port2,
   LEDR4);
9
   endmodule
10
```

#### 3.2.1.9 pipemwreg的实现

段间寄存器pipemwreg的功能,当清空信号有效时,所有输出为0,否则对应输入即为对应输出。

```
module pipemwreg( mwreg, mm2reg, mmo, malu, mrn, clock, resetn,
 1
 2
        wwreg, wm2reg, wmo, walu, wrn );
 3
        input
                       mwreg, mm2reg, clock, resetn;
 4
        input [31:0]
                       mmo, malu;
        input [4:0]
 5
                       mrn;
 6
        output
                       wwreg, wm2reg;
 7
        output [31:0]
                       wmo, walu;
 8
        output [4:0]
                       wrn;
 9
                       wwreg, wm2reg;
        reg
10
        req
               [31:0] wmo, walu;
11
        reg
              [4:0]
                       wrn;
        always @( posedge clock or negedge resetn)
12
13
        begin
            if (resetn == 0 ) //清零
14
15
            begin
```

```
16
                  wwreq <= 0;
                  wm2req <= 0;
17
                  vmo <= 0:
18
                  walu <= 0:
19
                  wrn \ll 0;
20
21
              end
22
             else
23
             begin
24
                  wwreg <= mwreg;</pre>
25
                  wm2reg <= mm2reg;</pre>
26
                  wmo <= mmo;
                  walu <= malu;
27
28
                  wrn <= mrn;
29
              end
30
         end
31
    endmodule
```

## 3.2.2 实现CPU与外部设备的输入输出端口设计

首先要阅读实验指导书上实验三:外部I/O及接口扩展实验部分的相关内容。对于展示设计,我的想法是完成一个加法器和减法器,当开关置于加法器时,通过八个开关输入两个4位二进制数,计算结果,将被加数,加数和和用LED显示出来;当开关置于减法器时,通过八个开关输入两个4位二进制数,计算结果,将被减数,减数和差用LED显示出来。如果差为负数,那么显示绝对值,同时负数指示灯亮起。

而在具体的实现上,只需要将单周期中的sc\_datamem.v, io\_output\_reg.v和 io\_input\_reg.v过来,同时相应地做少量修改即可,其他的基本上完全一样。这里面值得一说的是,在单周期CPU中,实际上存在着四个时钟,其中特别有dmem\_clk在一个时钟周期clock的 3/4处发生0到1的跳变,同时写使能信号是we&~clock。而在五级流水线中,只有两个时钟,clock和mem\_clock,其中mem\_clock=~clock。这时,如果我们写write\_enable = we&mem\_clock,实际上会造成一个比较隐蔽的问题。我们注意到写使能信号write\_enable 和 mem\_clock似乎是在同一时刻也就是clock从1跳变到0的时候,这两个信号从0跳变到1.

而实际上,这种同时跳变是很危险的,在用ModelSim模拟的时候,由于它模拟的是没有延时的情况,是功能仿真,所以这样写没有造成什么损害,可以正常出结果。但是如果我们烧录到板子上,在实际电路中,这两个信号就不是同时跳变的,这之间由于时延的存在,可能是一个信号先变,而另一个信号后变。实际上变成了,mem\_clock发生了跳变,此时应该要写入,但是由于write\_enable还没有跳变,依然为0,所以最终的结果是不写入,所以就会导致烧录到板子上,LED的示数始终为0。

所以, 只需要 assign write\_enable = we 即可。

#### 3.2.2.1 sc\_datamem.v文件

```
1 module sc_datamem
    (resetn,addr,datain,dataout,we,clock,in_port0_tmp,in_port1_tmp,in_port
   sub_tmp,out_port0,out_port1,out_port2,LEDR4);
 2
 3
       input [31:0] addr;
 4
       input [31:0] datain;
 5
                      we, clock, in_portsub_tmp;
       input
 6
       input [3:0] in_port0_tmp, in_port1_tmp;
 7
       output [31:0] out_port0, out_port1, out_port2;
 8
       output [31:0] dataout;
 9
       output
                      LEDR4;
10
       input
                            resetn:
11
       wire [31:0]
                        mem_dataout,io_read_data;
12
                      write_enable, write_io_enable, write_datamem_enable;
       wire
13
       wire [31:0] in_port0,in_port1,in_port_sub;
14
        assign in_port0={28'b0,in_port0_tmp}; //位数扩展为32位
       assign in_port1={28'b0,in_port1_tmp};
15
        assign in_port_sub={31'b0,in_portsub_tmp};
16
17
18
19
       assign
                       write_enable = we ;
20
                        write_io_enable = addr[7] & write_enable;
                                                                        //
       assign
   写I/0
21
        assign
                        write_datamem_enable = ~addr[7] & write_enable;//
   写数据RAM
22
23
       mux2x32
   mem_io_dataout_mux(mem_dataout,io_read_data,addr[7],dataout);
24
```

#### 3.2.2.2 io\_input\_reg.v文件

```
1 | module io_input_reg
   (addr,io_clk,io_read_data,in_port0,in_port1,in_port_sub);
 2
   //inport: 外部直接输入进入ioreg
 3
       input [31:0] addr;
 4
       input
                     io_clk;
 5
       input [31:0] in_port0,in_port1,in_port_sub;
       output [31:0] io_read_data;
 6
 7
                               // input port0
8
             [31:0] in_reg0;
       reg
9
              [31:0] in_reg1;
                                // input port1
       reg
              [31:0] in_reg2; // input port1
10
        reg
11
12
       io_input_mux
   io_imput_mux2x32(in_reg0,in_reg1,in_reg2,addr[7:2],io_read_data);
13
14
       always @(posedge io_clk)
       begin
15
16
           in_reg0 <= in_port0; // 输入端口在 io_clk 上升沿时进行数据锁存
17
           in_reg1 <= in_port1; // 输入端口在 io_clk 上升沿时进行数据锁存
             in_reg2 <= in_port_sub; // 输入端口在 io_clk 上升沿时进行数据锁
18
   存
19
              // more ports, 可根据需要设计更多的输入端口。
20
21
       end
22
   endmodule
```

```
23
24
25
   module io_input_mux(a0,a1,a2,sel_addr,y);
26
27
       input
               [31:0] a0,a1,a2;
28
       input
               [ 5:0] sel_addr;
29
       output [31:0] y;
30
        rea
               [31:0] y;
31
       always @ *
32
       case (sel_addr)
33
34
           6'b110000: y = a0;
35
           6'b110001: y = a1;
             6'b110010: y = a2;
36
          // more ports, 可根据需要设计更多的端口。
37
38
           endcase
39
   endmodule
```

#### 3.2.2.3 io\_output\_reg.v文件

```
1 module
    io_output_reg(addr,datain,write_io_enable,io_clk,clrn,out_port0,out_po
    rt1,out_port2,LEDR4);
 2
 3
        input [31:0] addr, datain;
 4
        input write_io_enable, io_clk;
 5
        input clrn;
 6
        //reset signal. if necessary, can use this signal to reset the
    output to 0.
 7
        output [31:0] out_port0, out_port1, out_port2;
 8
        reg out_put2_tmp;
 9
        reg [31:0] out_port0, out_port1, out_port2;
10
11
        output LEDR4;
12
        reg LEDR4;
        always @(posedge io_clk or negedge clrn)
13
14
        begin
15
            if(clrn == 0)
16
            begin
17
                out_port0 <= 0;</pre>
```

```
18
                 out_port1 <= 0;
19
                 out_port2 <= 0;</pre>
20
            end
21
            else
22
            begin
                 if(write_io_enable == 1)
23
24
                 case(addr[7:2])
25
                     6'b100000: out_port0 <= datain;//80h
26
                     6'b100001: out_port1 <= datain;//84h
27
                     6'b100010: //88h
28
                          begin
29
                           if(datain[31]==1) // 结果为负
30
                              begin
31
                                  LEDR4<=1: // 负数指示灯亮
32
                                  out_port2 <= ~datain+1; // 取反
33
                              end
34
                          else
35
                              begin
36
                                  LEDR4<=0;
37
                                  out_port2 <= datain;</pre>
38
                              end
39
                          end
                 endcase
40
41
            end
42
        end
43
   endmodule
```

#### 3.2.2.4 最终的顶层文件

```
1 module pipelined_computer (resetn,clock,
  pc,inst,in_port0,in_port1,in_port_sub,out_port0,out_port1,out_port2,H
  EXO, HEX1, HEX2, HEX3, HEX4, HEX5, LEDR4);
  //定义顶层模块pipelined_computer,作为工程文件的顶层入口,如图1-1建立工程时指
2
  定。
3
      input [3:0] in_port0, in_port1;
4
5
      input in_port_sub;
6
      output LEDR4;
7
      output [31:0] out_port0, out_port1, out_port2;
8
      output wire [6:0] HEXO, HEX1, HEX2, HEX3, HEX4, HEX5;
```

```
9
10
      input resetn, clock;
      wire mem clock=~clock:
11
12
      //定义整个计算机module和外界交互的输入信号,包括复位信号resetn、时钟信号
   clock.
13
      //以及一个和clock同频率但反相的mem_clock信号。mem_clock用于指令同步ROM和
      //数据同步RAM使用,其波形需要有别于实验一。
14
15
      //这些信号可以用作仿真验证时的输出观察信号。
      output [31:0] pc,inst;
16
      //模块用于仿真输出的观察信号。缺省为wire型。
17
18
      wire [31:0] bpc,jpc,npc,pc4,ins, inst;
      //模块间互联传递数据或控制信息的信号线,均为32位宽信号。IF取指令阶段。
19
20
      //bpc 分支指令跳转地址
21
      //ipc 跳转指令地址
      //npc 下一条指令地址
22
23
      //pc4 PC+4
24
      wire [31:0] dpc4,da,db,dimm;
      //模块间互联传递数据或控制信息的信号线,均为32位宽信号。ID指令译码阶段。
25
26
      wire [31:0] epc4, ea, eb, eimm, ealu, malu, walu;
      //模块间互联传递数据或控制信息的信号线,均为32位宽信号。EXE指令运算阶段。
27
28
      wire [31:0] mb, mmo;
29
      //模块间互联传递数据或控制信息的信号线,均为32位宽信号。MEM访问数据阶段。
30
      wire [31:0] wmo,wdi;
      //模块间互联传递数据或控制信息的信号线,均为32位宽信号。WB回写寄存器阶段。
31
32
      wire [4:0] drn,ern0,ern,mrn,wrn;
33
      //模块间互联,通过流水线寄存器传递结果寄存器号的信号线,寄存器号(32个)为
   5bit.
34
      wire [3:0] daluc, ealuc;
      //ID阶段向EXE阶段通过流水线寄存器传递的aluc控制信号, 4bit。
35
36
      wire [1:0] pcsource;
37
      //CU模块向IF阶段模块传递的PC选择信号, 2bit。
38
      wire wpcir;
      // CU模块发出的控制流水线停顿的控制信号,使PC和IF/ID流水线寄存器保持不变。
39
40
      wire dwreg, dm2reg, dwmem, daluimm, dshift, djal; // id stage
      // ID阶段产生,需往后续流水级传播的信号。
41
42
      wire ewreg, em2reg, ewmem, ealuimm, eshift, ejal; // exe stage
      //来自于ID/EXE流水线寄存器,EXE阶段使用,或需要往后续流水级传播的信号。
43
44
      wire mwreg,mm2reg,mwmem; // mem stage
      //来自于EXE/MEM流水线寄存器, MEM阶段使用, 或需要往后续流水级传播的信号。
45
      wire wwreg, wm2reg; // wb stage
46
      //来自于MEM/WB流水线寄存器,WB阶段使用的信号。
47
      pipepc prog_cnt ( npc,wpcir,clock,resetn,pc );
48
```

```
//程序计数器模块,是最前面一级IF流水段的输入。
49
50
       pipeif if_stage ( pcsource,pc,bpc,da,jpc,npc,pc4,ins,mem_clock );
   // IF stage
      //IF取指令模块,注意其中包含的指令同步ROM存储器的同步信号,
51
52
      //即输入给该模块的mem_clock信号,模块内定义为rom_clk。// 注意mem_clock。
53
      //实验中可采用系统clock的反相信号作为mem_clock(亦即rom_clock),
54
       //即留给信号半个节拍的传输时间。
55
       pipeir inst_reg ( pc4,ins,wpcir,clock,resetn,dpc4,inst ); //
   IF/ID流水线寄存器
      //IF/ID流水线寄存器模块,起承接IF阶段和ID阶段的流水任务。
56
57
      //在clock上升沿时,将IF阶段需传递给ID阶段的信息,锁存在IF/ID流水线寄存器
58
      //中,并呈现在ID阶段。
       pipeid id_stage ( mwreg,mrn,ern,ewreg,em2reg,mm2reg,dpc4,inst,
59
      wrn.wdi.ealu.malu.mmo.wwreg.clock.resetn.
60
       bpc, jpc, pcsource, wpcir, dwreg, dm2reg, dwmem, daluc,
61
62
      daluimm,da,db,dimm,drn,dshift,djal ); // ID stage
63
      //ID指令译码模块。注意其中包含控制器CU、寄存器堆、及多个多路器等。
      //其中的寄存器堆,会在系统clock的下沿进行寄存器写入,也就是给信号从WB阶段
64
65
      //传输过来留有半个clock的延迟时间,亦即确保信号稳定。
       //该阶段CU产生的、要传播到流水线后级的信号较多。
66
67
       pipedereg de_reg (
   dwreg, dm2reg, dwmem, daluc, daluimm, da, db, dimm, drn, dshift,
68
       djal,dpc4,clock,resetn,ewreg,em2reg,ewmem,ealuc,ealuimm,
       ea,eb,eimm,ern0,eshift,ejal,epc4 ); // ID/EXE流水线寄存器
69
70
      //ID/EXE流水线寄存器模块,起承接ID阶段和EXE阶段的流水任务。
71
      //在clock上升沿时,将ID阶段需传递给EXE阶段的信息,锁存在ID/EXE流水线
72
      //寄存器中,并呈现在EXE阶段。
73
       pipeexe exe_stage (
   ealuc,ealuimm,ea,eb,eimm,eshift,ern0,epc4,ejal,ern,ealu); // EXE
   stage
74
      //EXE运算模块。其中包含ALU及多个多路器等。
75
      pipeemreg em_reg ( ewreg,em2reg,ewmem,ealu,eb,ern,clock,resetn,
      mwreg,mm2reg,mwmem,malu,mb,mrn); // EXE/MEM流水线寄存器
76
      //EXE/MEM流水线寄存器模块,起承接EXE阶段和MEM阶段的流水任务。
77
       //在clock上升沿时,将EXE阶段需传递给MEM阶段的信息,锁存在EXE/MEM
78
79
       //流水线寄存器中,并呈现在MEM阶段。
80
81
82
       pipemem mem_stage (
   resetn, mwmem, malu, mb, clock, mem_clock, mmo, in_port0, in_port1, in_port_su
   b,out_port0,out_port1,out_port2,LEDR4); // MEM stage
      //MEM数据存取模块。其中包含对数据同步RAM的读写访问。// 注意mem_clock。
83
```

```
84
        //输入给该同步RAM的mem_clock信号,模块内定义为ram_clk。
        //实验中可采用系统clock的反相信号作为mem_clock信号(亦即ram_clk),
 85
        //即留给信号半个节拍的传输时间,然后在mem_clock上沿时,读输出、或写输入。
 86
 87
        pipemwreq mw_req ( mwreq,mm2req,mmo,malu,mrn,clock,resetn,
        wwreg,wm2reg,wmo,walu,wrn); // MEM/WB流水线寄存器
 88
 89
        //MEM/WB流水线寄存器模块,起承接MEM阶段和WB阶段的流水任务。
        //在clock上升沿时,将MEM阶段需传递给WB阶段的信息,锁存在MEM/WB
 90
        //流水线寄存器中,并呈现在WB阶段。
 91
        mux2x32 wb_stage ( walu,wmo,wm2reg,wdi ); // wb stage
 92
        //WB写回阶段模块。事实上,从设计原理图上可以看出,该阶段的逻辑功能部件只
 93
        //包含一个多路器,所以可以仅用一个多路器的实例即可实现该部分。
 94
        //当然,如果专门写一个完整的模块也是很好的。
 95
 96
 97
        wire [3:0] op_0_ge,op_1_ge,op_2_ge,op_0_shi,op_1_shi,op_2_shi;
 98
 99
        assign op_0_ge=out_port0%10;
100
        assign op_0_shi=out_port0/10;
101
        assign op_1_ge=out_port1%10;
102
        assign op_1_shi=out_port1/10;
103
        assign op_2_ge=out_port2%10;
104
        assign op_2_shi=out_port2/10;
105
106
107
        sevenseg s0(op_2_ge,HEX4);
108
        sevenseg s1(op_2_shi,HEX5);
109
110
        sevenseg s2(op_1_ge,HEX2);
        sevenseg s3(op_1_shi,HEX3);
111
112
113
        sevenseg s4(op_0_ge,HEX0);
114
        sevenseg s5(op_0_shi,HEX1);
115
    endmodule
116
117
    module sevenseg ( data, ledsegments);
118
119
    input [3:0] data;
120
    output ledsegments;
121
    reg [6:0] ledsegments;
    always @ (*)
122
123
    case(data)
    // qfe_dcba // 7段LED数码管的位段编号
124
    // 654_3210 // DE1-SOC板上的信号位编号
125
```

```
126 0: ledsegments = 7'b100_0000; // DE1-SOC板上的数码管为共阳极接法。
127
    1: ledsegments = 7'b111_1001;
128 | 2: ledsegments = 7'b010_0100;
129
   3: ledsegments = 7'b011\_0000;
130 4: ledsegments = 7'b001_1001;
131 5: ledsegments = 7'b001_0010;
132 6: ledsegments = 7'b000_0010;
133 7: ledsegments = 7'b111_1000;
134 8: ledsegments = 7'b000_0000;
135 9: ledsegments = 7'b001_0000;
136 default: ledsegments = 7'b111_1111; // 其它值时全灭。
137 endcase
138 endmodule
139
```

#### 3.2.2.5 汇编指令及对应的.mif文件

```
1 DEPTH = 64; % Memory depth and width are required % 2 WIDTH = 32: % Enter a decimal number %
2
  WIDTH = 32;
                % Enter a decimal number %
  ADDRESS_RADIX = HEX; % Address and value radixes are optional %
3
  DATA_RADIX = HEX; % Enter BIN, DEC, HEX, or OCT; unless %
4
  % otherwise specified, radixes = HEX %
5
  CONTENT
6
7
  BEGIN
  0: 200100c0; % addi $1,$0,192 | 00100000000001000000011000000 %
  1: 20020080; % addi $2,$0,128 | 0010000000001000000010000000 %
9
  10
11
 3 : 8c230000; % loop: lw $3,0($1)
  4 : 8c240004; %
               12
  13
14
  6 : ac430000; %
              15
16
  8: 10a60005; % beq $5,$6,subsub | 0001000010100110000000000000101
  9:00000000; % s11 $0,$0,0
                       17
18 | a : 00643820; % add $7,$3,$4 | 0000000011001000011100000100000 %
                         101011000100011100000000000001000 %
19
  b : ac470008; % sw $7,8($2)
```

## 3.3实验步骤

# 3.3.1 采用Verilog在quartus 工中实现基本的具有20条MIPS指令的5段流水CPU设计。

王赓老师已经给出了顶层设计,同时还有上次的代码可以使用,我需要做的工作就是依次把顶层设计中的所有模块都进行实现。流水线和单周期不同的地方就在于对于冒险的处理,尤其是数据冒险和控制冒险,对于数据冒险来说,主要是弄清楚如何正确设置fwda和fwdb的值,以及wpcir的值(低电平有效)。而对于控制冒险,则默认采用了延迟转移槽的方法,即紧随其后的语句一定会被执行。另外需要注意的地方在于,用什么时钟去控制寄存器对,指令ROM和数据RAM的读写。

## 3.3.2 利用实验提供的标准测试程序代码,完成仿真测试。



#### 3.3.3 实现CPU与外部设备的输入输出端口设计

首先要阅读实验指导书上实验三:外部I/O及接口扩展实验部分的相关内容。对于展示设计,我的想法是完成一个加法器和减法器,当开关置于加法器时,通过八个开关输入两个4位二进制数,计算结果,将被加数,加数和和用LED显示出来;当开关置于减法器时,通过八个开关输入两个4位二进制数,计算结果,将被减数,减数和差用LED显示出来。如果差为负数,那么显示绝对值,同时负数指示灯亮起。

最后,要给出对应的程序,实现上述功能。思想是读入第一操作数,读入第二操作数,读入加减控制信号,根据加减控制信号,决定执行加法指令还是减法指令,将结果输出,重复此循环。写出汇编代码,同时使用shawn233学长编写的mif.py程序即可生成相应的.mif文件。

#### 3.3.4 仿真验证设计

编写了激励文件,激励文件和前面的激励大同小异,但是增加了I/O端口的输入;同时生成了对应的.mif文件,即上面给出的.mif文件。仿真结果如下:

```
`timescale 1ps/1ps
 1
 2
    module sc_computer_pipeline_sim;
 3
        reg clock, resetn;
        reg in_port_sub;
 4
        wire LEDR4;
 5
        reg [3:0] in_port0,in_port1;
 6
 7
       wire [6:0] HEXO, HEX1, HEX2, HEX3, HEX4, HEX5;
       wire [31:0] pc ,inst,out_port0 ,out_port1 ,out_port2;
 8
 9
        initial
10
       begin
11
12
            clock = 1;
13
            while (1)
14
                 #1 clock = ~clock;
15
        end
16
17
        initial
18
       begin
19
            resetn= 0;
20
            while (1)
21
                 #5 resetn = 1;
```

```
22
       end
23
        initial
24
25
        begin
            in_port0 = 4'b0000;
26
27
            in\_port1 = 4'b0000;
28
            #100;
29
          while(1)
30
            begin
31
                 in_port0 = in_port0+1;
32
                 in_port1 = in_port1+1;
33
                 #100;
34
            end
35
        end
36
        initial
37
38
        begin
39
            in_port_sub=0;
40
          while(1)
41
            begin
42
               #2000;
                in_port_sub=1- in_port_sub;
43
44
            end
45
46
        end
47
48
49
        pipelined_computer sc(resetn,clock,
    pc,inst,in_port0,in_port1,in_port_sub,out_port0,out_port1,out_port2,HE
    x0, HEX1, HEX2, HEX3, HEX4, HEX5, LEDR4);
50
51
52
    endmodule
```



## 3.3.5 在quartusⅡ中,进行系列操作

在quartus II中,生成symbol,添加到.bdf文件中,连接输入和输出,为管脚命名,分配管脚,结果如下:



#### 3.3.6 编译, 烧录至DE1-SOC

编译成功后,将.sof文件烧录至DE1-SOC上,实际验证功能。

# 3.4 Verilog代码

完整的代码在我的jbox云盘上,完整的地址为https://jbox.sjtu.edu.cn/l/KnHz3V。

# 实验总结

本次实验基本上顺利实现了实验的任务,达到了实验的目的。初步掌握了利用Verilog硬件描述语言和大规模可编程逻辑器件进行逻辑功能设计的原理和方法。在一个相对较高的层次上,利用软件和硬件的相辅相成和优势互补,设计实现了一个五段流水CPU,并进行了I/O扩展。

本次实验,王赓老师只给出了顶层设计的代码,每个模块的需要自己去实现,对于段间寄存器的实现相对比较简单,首先是厘清哪些是输入,哪些是输出,对于resetn和wpcir有效时,段间寄存器的行为是什么,这些信号无效时,段间寄存器的行为是什么。而对于IF,ID,EXE,MEM,WB五个阶段的行为,根据王赓老师给出的图和课上所学,首先确定需要哪些元件和变量,依次实现这些元件和设定相关变量的值。

五段流水线和单周期相比,一个需要仔细考虑和解决的问题就是冒险,尤其是数据冒险和控制冒险。对于数据冒险,如果可以通过直通解决,那是最好的,如何设置fwda和fwdb信号是一个难点;如果不能通过直通解决,就是lw指令造成的数据冒险,就需要使流水线停顿即插入气泡来解决对于前两个段间寄存器,其值在下一周期不变,而ID/EXE寄存器的输入变为0。对于控制冒险,实际上没有完美的解决办法,这里采用的方法是转移延迟槽,即beq,bne,jr,j,jal指令的下一条指令一定会被执行。

在完成I/O扩展的代码后,进行了仿真,仿真的结果一切正常,但是烧录到板子里,显示就是全0,毫无变化。最后排查出来的原因就是,写使能信号和mem\_clock有关,导致写使能信号和mem\_clock信号可能"同时"跳变,而烧录到板子上后,两个信号的跳变有一个时间差,导致数据实际上无法被写入。

本次实验,我的收获依然是仔细阅读王赓老师的实验指导书,同时对于5级流水线的那张图一定要研究的比较清楚,对于理论上的知识比如如何处理冒险等也要掌握得比较扎实。ModelSim的仿真是功能仿真,它没有延时,好比是最理想的情况,而烧录到板子上,在真实的情境下,存在时延,就有可能出问题。在出现问题的时候,可以排查一下是否是信号跳变时延造成的问题,可能要尽量避免两个同时跳变的信号同时起作用。