

# BLG 322E – Computer Architecture Assignment 2

Due Date: 14.03.2018, Wednesday, 22.00.

#### **QUESTION:**

A RISC CPU has an instruction pipeline with the following 3 segments:

**FR:** <u>Fetch</u> / Decode instruction and <u>Read</u> source registers

(Register file access hazard has been fixed.)

**EX**: <u>Ex</u>ecution (Depending on instruction type: if arithmetic instruction, then arithmetic operation is performed; if memory operation, then address is calculated; if branch, then the condition and target address are calculated.)

Branch decision and target address are directly sent from EX to FR.

**MW**: <u>Memory access</u> (if necessary) and <u>Write</u> to registers (result from the ALU or data from memory is written to registers.)

The CPU does not include any forwarding (by-pass) connections.

Answer the questions assuming that the following code is run on the given CPU above.

```
LD 0(R5), R1
                          ; R1 <- M[R5]
     LD 0(R6), R2
                         ; R2 <- M[R6]
     LD 0(R7), R3
                         ; R3 <- M[R7]
    ADD R3, R2, R3
                         ; R3 <- R3 + R2
     SUB R3, R1, R3
                          ; R3 <- R3 - R1
     BNZ EX
                          ; BRANCH IF NOT ZERO
    ADD R0, 0, R3
                          ; CLEAR R3
    NEG R3
EX:
                          ; NEGATE R3
    ADD R3, R2, R2
                          ; R2 <- R3 + R2
```

- a) Draw the space-time diagram for the given program. Solve all data and branch conflicts using NOOP instructions. What is the total amount of penalty in clock cycles caused by conflicts for the given piece of code?
- **b)** To minimize the amount of penalty, find an optimized software solution to all conflicts, if it is possible. (Do not change the algorithm and be sure that the results generated by the program are still the same.) What is the total amount of penalty in clock cycles with the new solutions?

#### **INSTRUCTION SET:**

```
LD X(Rs), Rd Rd \leftarrow M[Rs + X] Load

SUB Ri, Rj, Rd Rd \leftarrow Ri - Rj Subtract

ADD Ri, Rj, Rd Rd \leftarrow Ri + Rj Add

BNZ Y PC \leftarrow PC + Y Branch if not zero
```

**Submission**: Draw the diagrams using a computer program. You should type your name and student ID at the top of the paper. You must submit your homework in PDF format through the Ninova system before the due date.

Late submissions are not accepted.

Assignments have to be made individually. If any plagiarism issue is detected, disciplinary regulations of the university are applied.

**Note**: If you have a problem about the homework, you may make contact with the responsible research assistant of the assignment (<a href="https://hakangunduz@itu.edu.tr">https://hakangunduz@itu.edu.tr</a>).



## BLG 322 – Bilgisayar Mimarisi Ödev 2

**Teslim Tarihi:** 14.03.2018, **Çarşamba,** 22.00

**SORU:** Bir RISC işlemcisi aşağıda verilen 3 katlı komut iş hattına (*pipeline*) sahiptir.

**FR:** Komut alma / komut çözme ve kaynak saklayıcılarını okuma (Saklayıcı dosyasına (*register file*) erişim sorunun çözülmüştür.)

**EX:** İşlemin çalıştırılması (İşlemin türüne bağlı olarak, eğer aritmetik işlemse aritmetik işlem yürütülür, eğer beller işlemi ise adres hesaplanır, eğer dallanma ise koşul ve hedef adres hesaplanır.)

Dallanma kararı sonucu ve hedef adres doğrudan EX'ten FR katmanına gönderilir.

**MW:** Gerekli durumlarda bellek erişimi ve saklayıcıların güncellenmesi (MİB'den gelen sonuç veya bellekten gelen veri saklayıcılara yazılır.)

İşlemci kestirme bağlantılar (by-pass) içermemektedir.

Soruları aşağıdaki kod parçasının verilen işlemci üzerinde çalıştırıldığını düşünerek cevaplayın.

```
0(R5), R1
     LD
                          ; R1 <- M[R5]
        0(R6), R2
     LD
                          ; R2 <- M[R6]
    LD 0(R7), R3
                         ; R3 <- M[R7]
     ADD R3, R2, R3
                          ; R3 <- R3 + R2
     SUB R3, R1, R3
                          ; R3 <- R3 - R1
     BNZ EX
                          ; BRANCH IF NOT ZERO
    ADD R0, 0, R3
                          ; CLEAR R3
EX:
    NEG R3
                          ; NEGATE R3
    ADD R3, R2, R2
                          ; R2 <- R3 + R2
```

- a) Verilen programa ilişkin uzay-zaman diyagramını yukarıda tanımlanan komut iş hattını dikkate alarak çiziniz. Tüm veri ve dallanma sorunlarını NOOP komutunu kullanarak çözünüz. Verilen kod parçası için oluşan sorunların giderilmesi toplamda kaç saat çevrimi cezaya neden olmaktadır?
- b) Toplam cezayı en aza indirmek için, tüm sorunların giderilmesinde uygulayacağınız mümkün olan bir optimize yazılım çözümü bulunuz. (Algoritmayı değiştirmeyin ve program tarafından üretilen sonuçların hala aynı olduğundan emin olun) Çözümünüz kaç saat çevrimi cezaya neden olmaktadır?

### KOMUT SETİ:

```
LD X(Rs), Rd Rd \leftarrow M[Rs + X] Load

SUB Ri, Rj, Rd Rd \leftarrow Ri - Rj Subtract

ADD Ri, Rj, Rd Rd \leftarrow Ri + Rj Add

BNZ Y PC \leftarrow PC + Y Branch if not zero
```

Ödevin Teslimi: Diyagramları bilgisayarla anlaşılır biçimde çiziniz. Adınızı ve öğrenci numaranızı kağıdın üst kısmına yazmalısınız. Ödevinizi teslim tarihinden önce PDF formatında Ninova sistemi aracılığıyla teslim etmelisiniz.

Geç teslim edilen ödevler kabul edilmeyecektir.

Ödevler tek kişiliktir. Kopya belirlenmesi durumunda kopyaya karışan tüm öğrenciler hakkında üniversitenin yönetmelikleri uyarınca disiplin işlemi uygulanır.

**Not:** Ödev hakkında bir sorununuz varsa ödevden sorumlu ilgili ders yardımcısı ile iletişime geçebilirsiniz (hakangunduz@itu.edu.tr).