# Machine Architecture Assignment 2

Casper B. Hansen
University of Copenhagen
Department of Computer Science
fvx507@alumni.ku.dk

Sine Vestergård Jensen University of Copenhagen Department of Computer Science kms698@alumni.ku.dk

Nikolaj Høyer University of Copenhagen Department of Computer Science ct1533@alumni.ku.dk

20. oktober 2013

#### Resumé

# Følgende beskriver løsning af G2 gruppeopgaven til maskinarkitektur på Københavns Universitet, samt forløbet af udarbejdelsen heraf.

Ved at tage udgangspunkt i et simplere kredsløb, nemlig single-cycle kredsløbet, forsimplede vi omfanget af opgaven om, at bygge et pipelined processor kredsløb, som understøtter en delmængde af MIPS<sup>1</sup> instruktionssættet.

Efter vi havde en fungerende implementation af single-cycle kredsløbet, indførte vi pipes, som effektivt delte kredsløbet op i eksekveringsstadier, og herefter løste vi de introducerede hazards i logisk rækkefølge af deres forekomst.

Under hver udbedring af hvert stadie opfulgte vi med at teste kredsløbet, og reitererede løsningen, om nødvendigt.

Sidst opfulgte vi med omfattende tests af det endelige kredsløb, som sikrede os, at vi fange de sidste fejl.

#### Indhold

|               | dledende                           |
|---------------|------------------------------------|
| 1.1           | Instruktionssæt                    |
| 1.2           | Implementering af Single-cycle     |
| 1.3           | Konvertering til Pipeline          |
| 1.4           | Forwarding og Hazard Detection     |
| 1.5           | Done og virker                     |
| 1.6           | Fejl og mangler                    |
|               |                                    |
|               |                                    |
| $\mathbf{Te}$ | $\operatorname{sts}$               |
| <b>Te</b> 2.1 |                                    |
|               |                                    |
|               | Aritmetiske og logiske operationer |
| 2.1           | Aritmetiske og logiske operationer |

<sup>&</sup>lt;sup>1</sup>MIPS - http://en.wikipedia.org/wiki/MIPS\_architecture

#### 1 Indledende

Vi startede med at lave en single cycle, som vi lavede om til en pipeline, i nedenstående afsnit har vi forklaret processen fra single cycle til pipeline.

#### 1.1 Instruktionssæt

Vores pipelines instruktionssæt (se Figur 1) er relativt simpelt og indeholder 'kun' 14 instruktioner. På følgende tabel er disse instruktioner blevet beskrevet kort.

#### Arithmetic-logical

| Mnemonic | Code | Type | Description        |
|----------|------|------|--------------------|
| addu     | 0x21 | R    | Add unsigned       |
| addiu    | 0x09 | I    | Add imm. unsigned  |
| slt      | 0x2A | R    | Set less than      |
| slti     | OxOA | I    | Set imm. less than |
| subu     | 0x23 | R    | Subtract unsigned  |
| and      | 0x24 | R    | Logical AND        |
| andi     | 0x0C | I    | Logical imm. AND   |
| or       | 0x25 | R    | Logical OR         |
| ori      | 0x0D | I    | Logical imm. OR    |

#### Memory-reference

| Mnemonic | $\mathbf{Code}$ | Type | Description |
|----------|-----------------|------|-------------|
| lw       | 0x23            | I    | Load word   |
| sw       | 0x2B            | I    | Store word  |

#### **Branching**

| Mnemonic | Code | Type | Description      |
|----------|------|------|------------------|
| beq      | 0x04 | I    | Branch on equal  |
| jal      | 0x03 | J    | Jump and link    |
| jr       | 0x08 | R    | Jump to register |

Figur 1: Instruktionssæt

#### 1.2 Implementering af Single-cycle

Da vi mødtes første gang tog vi simpelthen udgangspunkt i et helt nyt kredsløb, og byggede et en fungerende *single-cycle* implementation af den delmængde af MIPS instruktionssættet, som vi skulle understøtte jvf. opgaveteksten i vores løsning.

Vi fik således alle instruktioner til at virke korrekt på første dag, undtagen instruktionerne jal og jr. Disse blev implementeret umiddelbart dagen efter.

#### 1.3 Konvertering til Pipeline

Da *single-cycle* kredsløbet fungerede korrekt indførte vi *pipes*, som er mellem-registrer, hvori vi midlertidigt gemmer værdier beregnet i, eller overført fra, sidste stadie (eg. IF/ID, hvorfra vi viderefører *program counter* (PC) efter at have beregnet den følgende instruktions adresse, den nuværende instruktion, samt returneringsadressen for *jumps* og et *stall-*signal.

Vi introducerede alle *pipes* på én gang, da det var svært at se, hvordan vi skulle have håndteret en halvt indført pipeline, og tog de fejl som det medførte en efter en, herunder; at rykke *branch*-delen op i *pipelinen* (i IF-stadiet), hvilket medbragte den fordel, at vi ikke skulle tænke så meget over *branch-delay slot*, i og med, at den følgende *fetched* instruktion gerne skulle udføres, men PC derefter er blevet ændret til *branch*-adressen.

#### 1.4 Forwarding og Hazard Detection

Da de indledende fejl fra konverteringen var blevet reduceret og vi fik et overskueligt overblik over kredsløbet igen, påbegyndte vi at tage os af *hazards*, hvoraf vi tog os af de nemmeste og mest åbenlyse problemer først, herunder; forwarding for de aritmetiske operationer (eg. addiu og subu), og derefter *hazard-detection* og *stall* for *memory* operationer (eg. sw og lw).

Til sidst tog vi os af *jumps* og *branches*, hvilket viste sig at være mere udfordrende end først antaget, og også årsagen til, at vi må erkende, at vores kredsløb har nogle fejl på dette område.

For det første er jal implementeret sådan, at ID-trinnet håndterer både hvilken værdi der skal skrives i returregistret (sendt direkte fra IF-trinnet), samt signalet til rent faktisk at skrive. Dette har den ulempe, at hvis en instruktion senere i pipen (fx. en addu) forsøger at skrive til registret, vil dette være 'optaget' og det vil kun være retur-addressen der bliver skrevet. Dette kunne muligvis løses ved hazard detection, der kunne stalle hele pipelinen et enkelt trin, så begge værdier kunne nå at blive skrevet. Dette har vi desværre ikke nået at implementere. Bortset fra denne ulempe fungerer jal dog som den skal.

Derudover er jr også implementeret uden hazard detection og forwarding, hvilket medfører at en instruktion der forsøger at skrive til register \$31 (\$ra), ikke vil nå igennem pipen før jr udføres. Hvis man her antager, at assembler-programmøren følger MIPS konventionen og kun skriver til \$ra med jal, vil dette ikke blive et problem, eftersom jal allerede skriver til registret i ID-trinnet.

Til gengæld er har vi indført en seperat hazard detection unit for branches, der sørger for at stalle pipelinen, hvis branch operationen afhænger af endnu ikke produceret output. For eksempel vil pipelinen blive stallet to gange i tilfælde af at branch operationen afhænger af en lw operation i instruktionen netop før branchen.

#### 1.5 Done og virker

hvad virker og hvorfor virker det (aka se test)

#### 1.6 Fejl og mangler

Har vi noget der ikke virker og hvordan har vi tænkt os at implimentere det.

### 2 Tests

Lige til, dog skal vi lave nogle gode test. Lad os komme med nogle nice ideer og så skrive hvordan de virker og giv resultatet. Husk forventet output og faktisk output.

| .\$0  | 00000000 | .\$16 | 00000000 |
|-------|----------|-------|----------|
| .\$1  | 00000000 | .\$17 | 00000000 |
| .\$2  | 00000000 | .\$18 | 00000000 |
| .\$3  | 00000000 | .\$19 | 00000000 |
| .\$4  | 00000000 | .\$20 | 00000000 |
| .\$5  | 00000000 | .\$21 | 00000000 |
| .\$6  | 00000000 | .\$22 | 00000000 |
| .\$7  | 00000000 | .\$23 | 00000000 |
| .\$8  | 00000000 | .\$24 | 00000000 |
| .\$9  | 00000000 | .\$25 | 00000000 |
| .\$10 | 00000000 | .\$26 | 00000000 |
| .\$11 | 00000000 | .\$27 | 00000000 |
| .\$12 | 00000000 | .\$28 | 00000000 |
| .\$13 | 00000000 | .\$29 | 00000000 |
| .\$14 | 00000000 | .\$30 | 00000000 |
| .\$15 | 00000000 | .\$31 | 00000000 |
|       |          |       |          |

Figur 2: Forventet resultat

## 2.1 Aritmetiske og logiske operationer

Ved at sammenligne

|               | I det følgende udregnes $((3+4)+7)-3$ . |          |       |      |       |            |        |      | .\$zero | 00000000             | .\$s0        | 00000000 |          |
|---------------|-----------------------------------------|----------|-------|------|-------|------------|--------|------|---------|----------------------|--------------|----------|----------|
| 1             | # Vi sta                                | arter 1  | med n | ogle | simr  | ole t      | test   | s af | de a    | .\$at                | 00000000     | .\$s1    | 00000000 |
| 2             | # I det                                 |          |       | -    | _     |            |        |      |         | 3.\$v0               | 00000000     | .\$s2    | 00000000 |
| 3             | # Status                                | : PASS   | 3     |      |       |            |        |      |         | .\$v1                | 00000000     | .\$s3    | 00000000 |
| $\frac{4}{5}$ | #                                       | Instri   |       |      | <br>I |            |        | ntet |         | :\$ā0 <sup>-</sup> # | 00000000     | .\$s4    | 00000000 |
| 5             | #                                       | Instr    | IKUIO | ш    | ı     | г          | or v e | псес | out     | .\$a0 "<br>.\$a1     | 00000000     | .\$s5    | 00000000 |
| 6             | #                                       |          |       |      |       |            |        |      |         | \$a2- #              | 00000000     | .\$s6    | 00000000 |
| 7             | addiu                                   | \$s0,    |       | •    |       |            |        |      |         | .\$a3                | 00000000     | .\$s7    | 00000000 |
| 8             | addiu                                   | \$s1, \$ |       | •    |       | s1:        |        |      |         | .\$t0                | 00000000     | .\$t8    | 00000000 |
| 9<br>10       | addiu<br>addiu                          | \$s2, \$ |       | •    |       | s2:<br>s3: |        |      |         | .\$t1                | 00000000     | .\$t9    | 00000000 |
| 10            |                                         | \$t1,    | •     | •    |       | t1:        |        |      |         | .\$t2                | 00000000     | .\$k0    | 00000000 |
| 12            |                                         | \$t1,    |       |      |       |            |        | (+i) | / e     |                      |              |          |          |
| 13            | subu                                    | \$t2,    | •     |      |       |            |        |      | / b     | (kgg)                | 00000000     | .\$k1    | 00000000 |
| 14            | slt \$t3,                               | •        |       |      |       |            | 11     | (01) | , 5     | (hex)<br>.\$t4       | 00000000     | .\$gp    | 00000000 |
| 15            | slti                                    | \$t4,    |       |      |       |            | 1      |      |         | .\$t5                | 00000000     | .\$sp    | 00000000 |
| 16            | and \$t5,                               | , \$s3,  | \$s3  | #    | t5:   | 1          |        |      |         | .\$t6                | 00000000     | .\$fp    | 00000000 |
| 17            | andi                                    | \$t6,    | \$t5, | 0    | #     | t6:        | 0      |      |         | .\$t7                | 00000000     | .\$ra    | 00000000 |
| 18            | or \$t7,                                | , \$s3,  | \$t6  | #    | t7:   | 1          |        |      |         | • • •                |              | • • • •  |          |
| 19            | ori \$t8,                               | \$t7,    | 0     | #    | t8:   | 0          |        |      |         | Fig                  | gur 3: Forve | ntet res | sultat   |

4

| 2.2   | Memory-reference operations |      |
|-------|-----------------------------|------|
|       |                             | <br> |
| 2.3   | Branching operations        |      |
| •••   |                             |      |
| 2.3.1 | Hazards                     |      |
|       |                             | <br> |

LITTERATUR LITTERATUR

# Litteratur

[1] David A. Patterson, John L. Hennessy, Computer Organization and Design. Morgan Kaufmann, Revised 4th Edition, 2009.