# **Computer Architecture 2020**

## **Project 2 Pipelined CPU + L1 Data Cache**

team: RISK-V

## **Modules Explanation**

本次專題的大部分檔案都是直接沿用 project 1 的模組,以下只有列出有更動過和新增的模組。

#### **Dcache Controller**

- input:
  - o c1k\_i
  - o rst\_i
  - o mem\_data\_i
  - o mem\_ack\_i
  - o cpu\_data\_i
  - o cpu\_addr\_i
  - o cpu\_MemRead\_i
  - o cpu\_MemWrite\_i
- output:
  - o mem\_data\_o
  - o mem\_addr\_o
  - o mem\_enable\_o
  - o mem\_write\_o
  - o cpu\_data\_o
  - o cpu\_stall\_o



在這個模組裡面,我們需要做的事情分為三項:

#### 接線

大部分模組所需要的接線和轉換,都已經在助教提供的模組裡面有。我們需要多接的只有三個

#### 1. r\_hit\_data :

r\_hit\_data 代表的是當 hit 時的資料,因此直接把 sram\_cache\_data assign 給 r\_hit\_data,即可。如果沒有 hit 也沒關係,因為不會用到這個資料。

#### 2. cpu\_data:

放在一個 always block 裡面,當 cup\_offset 、 r\_hit\_data 有更動時,把 cpu\_data 指 定成 r\_hit\_data 當中,根據 cpu\_offset 所指向的內容。由於 cpu\_offset 是 byte-address,但是我們使用的 bus 是 32-bit,所以需要先轉成 word-address,然後去存取相對應的內容。

#### 3. w\_hit\_data :

放在一個 always block 裡面,當 cup\_offset 、 r\_hit\_data 、 cpu\_data\_i 有更動時, 先把 w\_hit\_data 指定成 r\_hit\_data 代表目前的資料,然後根據 cpu\_offset 對其內容 進行修改。addressing 的部分和上面一樣。

#### 變數釐清

首先我們需要先釐清每一個控制變數的意義。控制變數有五個:

#### 1. state

表示目前的狀態是哪一個,讓後面的 case 可以跳到正確的狀態內。

#### 2. mem\_enable

當這個設為 1 時,Data Memory 會進入讀取資料的 state。

#### 3. mem\_write

當這個設為 1 時·且 Data Memory 的讀取狀態完成(mem\_ack\_i 為 1 ) 時·Data Memory 會把給他的資料寫入 reg 中。

#### 4. cache\_write

當這個設為 1 時,同時搭配 cache\_sram\_enable 也為 1 時,會讓 sram 把給他的資料寫入 cache 中。

#### 5. write\_back

控制的是給 Data Memory 的 addr 是由誰提供的。若為 ① · 則代表使用 sram 提供的 tag;若為 ② · 則使用 CPU 來的 tag。

#### • 狀態控制

狀態也有五個,以下分別說明:

#### 1. STATE\_IDLE

代表待機狀態,當有 cpu\_req 時,代表 CPU 需要對記憶體進行讀寫,此時,如果是 hit 的情況,就代表 sram 有資料,也都會正常的進行讀寫; 反之則會進到 STATE\_MISS 的階段。

#### 2. STATE\_MISS

不管是讀還是寫·sram 上必須都要先有正確的資料·因此都必須要進到 read miss 的階段· 而 Data Memory 也要開始進行讀取。但是如果目前的 sram 的資料是更新過的·代表目前 的資料需要被 write back。

所以如果 dirty bit 為 1,則:

■ mem\_enable : 1

mem\_write: 1

cache\_write: 0

write\_back: 1

■ state:轉成 STATE\_WRITEBACK

如果 dirty bit 為 0 , 則:

■ mem\_enable: 1

mem\_write: 0

cache\_write: 0

write\_back: 0

■ state:轉成 STATE\_READMISS

#### 3. STATE\_READMISS

進來之後,我們必須要等 Data Memory 讀取完成,再把資料帶上去 sram 裡面,因此當 mem\_ack\_i 為 1 時:

mem\_enable: 0mem\_write: 0cache\_write: 1write\_back: 0

■ state:轉成 STATE\_READMISSOK

否則保持狀態。

#### 4. STATE\_READMISSOK

當 read miss 處理完成,我們要回歸到一開始的狀態,把所有的控制變數都設定成 [0],然後狀態就可以回到 | STATE\_IDLE 。

#### 5. STATE\_WRITEBACK

進到 STATE\_WRITEBACK 之後,我們必須要等 Data Memory 寫入完成之後,才開始進行 read miss 的處理,因此當 mem\_ack\_i 為 1 時:

mem\_enable: 1mem\_write: 0cache\_write: 0write\_back: 0

■ state:轉成 STATE READMISS

否則保持狀態。

#### **Dcache Sram**

- input:
  - o clk\_i
  - o rst\_i
  - o addr\_i
  - o tag\_i
  - o data\_i
  - o enable\_i
  - o write\_i
- output:
  - o tag\_o
  - o data\_o
  - o hit\_o

#### 本次專題要求的是:

- 32-bit address
- cache size is 1KB
- 32-byte per cache line
- two-way associative cache
- Replacement policy is LRU
- write back and write allocate

在 verilog 裡面,我們的 tag 有 25 bits,最高位是 valid bit; 次高位是 dirty bit,剩下的 23 bits 就是 tag。另外,助教提供模組時,已經把 address 的各部分都 parse 好了,所以 cache index 的部分可以直接用 addr\_i。

我們的 sram 分成四個部分

- 初始化
  - o 由助教提供的內容。當 rst\_i 為 1 時,會把 cache 的所有東西都初始化成 0。
  - o 裡面也包含要把 LRU 全部預設為 0。
- LRU
  - o 我們的實做方式是建 16 個 reg·代表**下一個要被替換掉的位置**。預設是 0 · 當 hit0 為 1 · 就會換成 1 ; 如果是 hit1 為 1 · 則會換成 0 ; 如果都沒有 hit · 就會取 negation (~)。
- read
  - o 以 wire hit0 hit1 代表 tag\_i 的後 23 bits 和 cache 裡面的 tag 比對的結果,同時 vaild bit 也要是 1 。把 hit0 || hit1 assign 給 hit\_o 代表有沒有 hit 。
  - o data\_o 的部分則是根據 hit0 、hit1 的結果決定要回傳誰;如果都沒有 hit 的話‧會回傳 LRU 目前指向的那個 data。因為在 miss 的情況下還需要用 data\_o 代表是 write back ‧這時候我們需要把要被替換掉(LRU 指向的)的資料讀出來。
  - o tag\_o 的部分,因為裡面其實包含 vaild bit 和 dirty bit ,因此都需要回傳,而回傳的規則同上。
- write
  - o 當 enable\_i 和 write\_i 同時為 1 時,會根據 hit0 還是 hit1 來決定要更新誰。在更新的過程中,會把 vaild bit 和 dirty bit 都設定為 1 可時也會更新 LRU。如果都沒有 hit 的話,則是根據 LRU 的內容來決定要替換掉誰。

#### **Pipeline latches**

和 proj1 唯一的不同就是每一個 latch 都多了一個 mem\_stall\_i 的 port。當 mem\_stall\_i 為 1 時,latch 就不會進行更新。

#### **CPU**

- input:
  - o c1k\_i
  - o rst\_i
  - o start\_i
  - o mem\_data\_i
  - o mem\_ack\_i
- output:
  - o mem\_data\_o
  - o mem\_addr\_o
  - o mem\_enable\_o
  - o mem\_write\_o

與 project1 不一樣的地方在 IF\_ID, ID\_EX, EX\_MEM, MEM\_WB 和 dcache\_controller 這些地方。在前面 4 個 module 中增加 mem\_stall\_i 連到 dcache\_controller 的 cpu\_stall\_o 的線。而 dcache\_controller 主要是取代原本 project1 的 Data Memory 的位置·然後把要去 memory 的 port 拉到 CPU 的 interface 去。

#### **Testbench**

- 和 project1 一樣,增加初始化 pipeline registers 的敘述,依據各個資料的 bit 數,設成適當 bit 數的 0。
- 把 CPU 和 Data Memory 兩者相互對應的 port 連起來。

#### Members and Teamwork

• B07209016 鐘晨瑋:修改 pipeline latch、完成 dcache\_sram。

- B07201022 杜宗顁:主要負責 CPU 的接線工、dcache\_sram。
- B07902063 陳耕宇:合作完成 dcache\_sram 、dcache\_controller。
- 共同撰寫 dcache\_controller \ Report \ \ \ \ \ Report \ \ \ \ \ Report \ \ \ \ Report \ \ \ \ \ Report \ \ Report \ \ \ Report \ Report

### **Difficulties Encountered and Solutions**

Q1. or 、 | 、 | | 會搞不清楚。

A1. or 是用在 a1ways block 裡面 · 代表有改變的時候會執行迴圈 ; | 指的是 bit-wise or ; || 指的是 logical or ·

Q2. 變數多且複雜,不容易理解。

A2. 慢慢的追蹤變數,邊做筆記。以模擬特定狀況的方式來理解每一個變數的意義和過程的轉變。

## **Development Environment**

- OS: Windows 10 Home ver 1909
- Compiler: Icarus Verilog version 11.0