Rapport de projet : Architecture des ordinateurs

Benjamin Saint-Sever, Steven Ratton

 $27~\mathrm{avril}~2014$ 

# Table des matières

| 1 | Introduction                                                    | 2  |
|---|-----------------------------------------------------------------|----|
| 2 | Exercice 1 : Ajout de l'instruction leal                        | 3  |
|   | 2.1 implémentation de leal                                      | 3  |
|   | 2.2 Architecture séquentielle                                   | 4  |
|   | 2.3 Architecture pipelines                                      | 7  |
| 3 | Exercice 2 : Mise en œuvre de stratégies de prédiction statique | 9  |
| 4 | Exercice 3 : Exécution d'instructions sur plusieurs cycles      | 11 |
|   | 4.1 Question1:                                                  | 11 |
| 5 | Conclusion                                                      | 15 |

# Introduction

Le but de ce projet est de montrer la possibilité d'extension de l'architecture y86, en ajoutant des instructions et en manipulant les prédictions de branchement. Ce projet a pour vocation de nous enseigner la programmation de langage machine tout en tirant parti au mieux des capacités des ordinateurs.

# Exercice 1 : Ajout de l'instruction leal

#### 2.1 implémentation de leal

#### Description

Le but de ce premier exercice est de créer une nouvelle instruction "leal" pour "load effective address", cette derniere est existante sous l'architecture x86. Cette instruction charge l'adresse de la source dans dest (leal (%regS),%regD). On souhaite que cette instruction permette un déplacement mémoire, leal depl(%regS),regD. L'avantage de cette solution est que l'on peut effectuer cette opération avec une seule instruction. Son equivalent est : "rrmovl %regS,%regD; iaddl depl,%regD"

#### Assembleur

Il est possible d'ajouter cette instruction sans consommer un nouvel opcode, il suffit de reprendre le formalisme de irmovl est de donner une valeur de ifun différente afin de faire la distinction (ifun =1).

Premiere étapes, on insère dans le code assembleur la déclaration de cette nouvelle instruction :

#### Fichier test leal.ys:

On déplace de 8 à partir de l'adresse du registre %eax et on attribue l'adresse dans le registre %ebx :

```
irmovl 3, %eax
leal 8(%eax), %ebx
halt
```

#### 2.2 Architecture séquentielle

#### Code HCL:

On ajoute le code d'instruction irmovl pour identifier leal:

```
intsig LEAL 'I IRMOVL'
```

#### Etape FETCH:

On ne modifie rien puisque l'on interprète le même fonctionnement que l'instruction irmovl.

#### Etape Decode:

le contenue du registre 'B' (Source) est attribué à la source A.

```
int srcA = [
    #icode vaut irmovl ou leal, pour obtenir leal -> ifun=1
    (icode == LEAL) && (ifun == 1):rB;
];
```

le contenue du registre 'A' est attribué à la E destination afin d'écrire la nouvelle adresse de destination.

#### **Etape Execute:**

On place ValC dans l'aluA et ValA dans l'aluB, cela permettre d'effectuer le calcul de déplacement :

```
int aluA = [
     (icode == IRMOVL) && (ifun == 0) : valC;
     (icode == LEAL) && (ifun == 1): valC;
     #Deux lignes pour la lisibilité mais on peut aussi
     utiliser seulement icode in {irmovl} : valC
];
```



Figure 2.1 - Fetch



FIGURE 2.2 – Decode

#### 2.3 Architecture pipelines

Afin de pouvoir identifier la bonne instruction à l'étage Decode il est nécessaire de récupérer la valeur de ifun qui permettra de différencier irmovl de leal, on ajoute donc la déclaration suivante :

```
intsig D_ifun 'if_id_curr->ifun ' # Instruction function
```

La prise en compte de leal dans la hcl pipeline diffère peut de l'architecture séquentielle, il faut néanmoins prendre en compte le ifun et icode des étages concerner.

#### Etape Decode:

Meme chose que pour l'architecture seq :

#### **Etape Execute:**

Dans l'ALUA on utilise valC donc on ne modifie rien.

```
\label{eq:intale} \begin{array}{ll} int & aluA = [ \\ & E\_icode \ in \ \{ \ IRMOVL, \ RMMOVL, \ MRMOVL, \ IOPL \ \} \ : \ E\_valC \, ; \\ ] \, ; \end{array}
```

Dans l'ALUB on souhaite utiliser valA, IRMOVL n'utilise rien donc il utilise la condition qui suis.

```
int aluB = [
    (E_icode == IRMOVL && E_ifun == 1) : E_valA;
    E_icode in { RRMOVL, IRMOVL } : 0;
    # Other instructions don't need ALU
];
```

eax vaut 3, on ajoute 8 à l'adresse de ce dernier et on stocke le résultat de dans ebx



Figure 2.3 – Decode



Figure 2.4 – Execute



FIGURE 2.5 – Write Back



Figure 2.6 – Résultat

# Exercice 2 : Mise en œuvre de stratégies de prédiction statique

#### Gestion des versions:

- nouveau fichier "pipe-maversion1.hcl"
- changer la variable VERSION dans le fichier Makefile

#### Analyse du CPI:

- ajout des fichiers test loop.ys et cpi.ys
- make loop.yo et make cpi.yo
- ./psim -g loop.yo et ./psim -g cpi.yo

La prédiction de branchement est une fonctionnalité d'un processeur qui lui permet de prédire le résultat d'un branchement. Cette technique permet à un processeur de rendre l'utilisation de son pipeline plus efficace. Avec cette technique, le processeur va faire de l'exécution spéculative : il va parier sur le résultat d'un branchement, et va poursuivre l'exécution du programme avec le résultat du pari. Si le pari échoue, les instructions chargées par erreur dans le pipeline sont annulées.

# Question 1 : Expliquer pourquoi on perd du temps avec la prédiction de branchement actuelle de type « toujours ».

La prediction de branchement de type "toujours" suppose que les branchements conditionnels vont toujours être pris, or ce n'est pas le cas de tous les programmes, lorsqu'une ou plusieurs conditions imbriqués dans une boucle ne sont vrai que rarement, il y a forcement une perte de temps. Le prédicteur de branchement prédit que les conditions sont vrai or elles ne le sont pas souvent. Exemple avec CPI.ys.



#### Dans le cas " toujours " :

- valC utilisé comme adresse de la prochaine instruction.
- valP conservé le long du pipe-line pour devenir l'adresse de la prochaine instruction si la prédiction s'avère fausse (valP est multiplexé en tant que valA dès l'étage E).

il se pourra que ce soit valP qui serve d'adresse de la prochaine instruction, et il faudra alors préserver valC. Vous aurez donc besoin de propager valC également jusqu'à l'étage M, en plus de valP/valA. La faire cheminer dans l'UAL peut être un bon moyen pour cela, puisque celle-ci ne sert pas pour les branchements.

Prédiction de branchement "jamais": Permet d'obtenir de meilleure performance, au fait que la plus part du temps les branchement conditionnels ne sont pas pris et les branchements inconditionnels le sont.

- valP utilisé comme adresse de la prochaine instruction.
- valC conservé.
- propager valC également jusqu'à l'étage M, en plus de valP/valA.

ajout : intsig JUNCOND 'J YES'

on utilise alors "(M\_icode == JXX) && (M\_ifun!= JUNCOND)" pour tester les branchements conditionnels

Modification des lignes 123, 145,146,213 exercice non fonctionnel.

# Exercice 3 : Exécution d'instructions sur plusieurs cycles

#### 4.1 Question1:

On remplace dans misc, isa.h et isa.c ,IPOP2 par ILSM. afin que lods corresponde à l'opcode ILSM avec ifun=O , et stos au même opcode, avec ifun=1 et supprimer la définition de pop2

Ajout dans pipe-exercice3.hcl:

```
- Declarations:
                          'I LSM'
        intsig LSM
- Fetch Stage:
bool instr valid = f icode in
        { NOP, HALT, RRMOVL, IRMOVL, RMMOVL, MRMOVL,
                OPL, IOPL, JXX, CALL, RET, PUSHL, POPL, LSM };
int instr_next_ifun = [
        f_{icode} = LSM & f_{ifun} = 2 : 0;
        f icode = LSM & f ifun = 0 : 1;
        1 : -1;
];
  - Decode Stage:
int new E \operatorname{src} A = [
        D icode = LSM && D ifun = 1 : EAX;
        # EAX : écriture mémoire dans EDI => srcA
        D icode = LSM && D ifun = 0 : ESI;
```

```
D_icode in { RRMOVL, RMMOVL, OPL, PUSHL } : D_rA;
        D icode in { POPL, RET } : RESP;
        1 : RNONE; # Don't need register
];
int new E srcB = [
        D \text{ icode} = LSM \&\& D \text{ ifun} = 1 : EDI;
        D_icode in { OPL, IOPL, RMMOVL, MRMOVL } : D_rB;
        D_icode in { PUSHL, POPL, CALL, RET } : RESP;
        1 : RNONE; # Don't need register
];
int new_E_dstE = [
        D icode = LSM && D ifun = 0 : ESI;
        # ESI est incrémenté dans ALU puis réaffecté à lui-même
        D icode = LSM && D ifun = 1 : EDI;
        D icode in { RRMOVL, IRMOVL, OPL, IOPL } : D rB;
        D icode in { PUSHL, POPL, CALL, RET } : RESP;
        1 : DNONE; # Don't need register DNONE, not RNONE
];
int new E dstM = [
        D icode in { MRMOVL, POPL } : D rA;
        D_{icode} = LSM \&\& D_{ifun} = 0 : EAX;
        # EAX prend la valeur lue en mémoire dans ESI
        1 : DNONE; # Don't need register DNONE, not RNONE
];
```

```
- Execute Stage:
int aluA = [
         E_{icode} = LSM \&\& E_{ifun} = 0 : 4;
         E \text{ icode} = LSM \&\& E \text{ ifun} = 1 : 4;
         E icode in { RRMOVL, OPL } : E valA;
         E icode in { IRMOVL, RMMOVL, MRMOVL, IOPL } : E valC;
         E icode in \{ CALL, PUSHL \} : -4;
         E icode in { RET, POPL } : 4;
         # Other instructions don't need ALU
];
int aluB = [
         E \text{ icode} = LSM \&\& E \text{ ifun} = 0 : E \text{ valA};
         # Incrémentation de ESI
         E_{icode} = LSM \&\& E_{ifun} = 1 : E_{valB};
         # On décrémente de 4 le pointeur EDI
         E icode in { RMMOVL, MRMOVL, OPL, IOPL, CALL,
                         PUSHL, RET, POPL \ : E valB;
         E icode in { RRMOVL, IRMOVL } : 0;
         # Other instructions don't need ALU
];
- Memory Stage:
bool mem read = M icode in { MRMOVL, POPL, RET} ||
(M \text{ icode} = LSM \&\& M \text{ ifun} = 0);
bool mem write = M icode in { RMMOVL, PUSHL, CALL } ||
(M \text{ icode} = LSM \&\& M \text{ ifun } ==1);
int mem addr = [
         #injection de esi dans eax
         M \text{ icode} = LSM \&\& M \text{ ifun} = 0 : M \text{ valA};
         M_icode in { RMMOVL, PUSHL, CALL, MRMOVL } : M_valE;
         M \text{ icode} = LSM \&\& M \text{ ifun } ==1 : M \text{ valE};
         M_{icode} in { POPL, RET } : M_{valA};
         # Other instructions don't need address
];
```

# Conclusion

Nous avons utilisé github qui est un logiciel de gestion de version qui nous a permis de travailler indépendament mais aussi en collaboration. Nous n'avons pas terminé le projet principalement par manque de temps du à d'autres projet en cour.