## Architecture des Ordinateurs

# Processeur MIPS en Pipeline et Aléas d'Exécution

2ème Année Licence Informatique

Travaux Dirigés #6

### 1. Contrôle préalable

Cette partie est conçue comme une vérification pour vous permettre de déterminer si vous comprenez les concepts abordés en cours ou non. Veuillez répondre par « Vrai » ou « Faux » aux questions suivantes et inclure une explication :

| 1.1. L'introduction de registres | « pipeline » au   | chemin de | e données | induit u | me latenc | e et u | ın débit |
|----------------------------------|-------------------|-----------|-----------|----------|-----------|--------|----------|
| plus élevés dans l'exécution     | n des instruction | ns.       |           |          |           |        |          |

- 1.2. Les « aléas de données » se traduiront généralement par trois suspensions (*anglais*. stalls) du pipeline si nous n'utilisons pas l'unité de transfert.
- 1.3. Tous les « aléas de données » peuvent être résolus en utilisant l'unité de transfert.
- 1.4. La suspension du pipeline est le seul moyen de résoudre les « aléas de branchement ».

## 2. Registres du pipeline

2.1. Afin de convertir un processeur en cycle-unique en un processeur en pipeline, des registres sont introduits entre les différentes étapes du chemin de données. Quel est le rôle de ces registres ?

2.2. Pourquoi avons-nous besoin de sauvegarder les signaux de commande plusieurs fois dans le pipeline ?

## 3. Analyse de Performance

Avant de continuer avec les questions de ce TD, il est suggéré de consulter le document « **Contraintes de temps sur les circuits** » (disponible depuis le site du cours) pour rafraichir vos connaissances sur les contraintes de temps associées aux circuits séquentiels et combinatoires.

Pour notre circuit de processeur en pipeline, supposons les durées de temps suivantes :

| $t_{cpq}$ registre:    | 30 ps  | , | $t_{setup}$ registre:    | 20 ps  |
|------------------------|--------|---|--------------------------|--------|
| $t_{pd}$ Mux:          | 25 ps  | , | $t_{pd}$ UAL:            | 200 ps |
| $t_{cpq}$ Mem:         | 250 ps | , | $t_{setup}$ MEM:         | 200 ps |
| $t_{cpq}$ Banc Regs. : | 150 ps | , | $t_{setup}$ Banc Regs. : | 20 ps  |

3.1. Avec les délais indiqués ci-dessus pour chacun des composants du chemin de données, quel serait le temps d'horloge le plus rapide possible pour un chemin de données à cycle unique ?

| 3.2. | Quelle serait la fréquence d'horloge la plus rapide possible pour un chemin de données en pipeline ?                                                                                                                                                                                                   |
|------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 3.3. | Quelle est l'accélération obtenue après conversion du chemin de données à cycle unique vers un chemin de données en pipeline ? Pourquoi l'accélération est-elle inférieure à 5 ?                                                                                                                       |
| 4.   | Aléas d'exécution                                                                                                                                                                                                                                                                                      |
|      | La conversion d'un chemin de données à cycle unique en une version en pipeline introduit trois types d'aléas d'exécution : aléas structurels, aléas de données et aléas de branchement.                                                                                                                |
|      | Aléas structurels Ils surviennent lorsque plusieurs instructions doivent utiliser en même temps la même ressource dans le chemin de données. Il existe deux causes principales d'aléas structurels :                                                                                                   |
|      | <b>Banc de registres</b> : Le « banc de registres » est accédé à la fois pendant l'étape ID, lorsqu'il est lu, et pendant l'étape WB, lorsqu'il est modifié (écrit). Ce problème est résolu en ayant des ports de lecture et d'écriture séparés. Dans le cas de lecture et d'écriture simultanées dans |

mémoire).

Les aléas structurels peuvent toujours être résolus en ajoutant plus de matériel.

le nom de « double pompage ».

le même registre, le processeur écrit dans le registre pendant la première moitié du cycle d'horloge et lit à partir de celui-ci pendant la seconde moitié. Ceci est également connu sous

Accès Mémoire: La mémoire héberge au même temps les instructions du programme à exécuter et les données à traiter. Disposer d'une mémoire d'instructions séparée (IMEM) et d'une mémoire de données (DMEM) résout ce problème. Cela est implémenté en utilisant des mémoires caches séparées pour les instructions et les données (voir cours sur les caches

#### Aléas de données

Ces aléas sont causés par les dépendances sur les données entre les instructions. En particulier, Un aléa de données survient lorsqu'une instruction lit depuis un registre avant qu'une instruction précédente n'ait fini d'écrire dans ce registre.

#### Unité de transfert

La plupart des aléas de données peuvent être résolus par transfert, c.-à-d. lorsque la sortie de l'étage EX ou l'étage MEM est transférée directement à l'étage EX de l'instruction ultérieure.

4.1. Signalez les aléas de données dans le code ci-dessous et indiquez comment le transfert des données pourrait être utilisé pour les résoudre.

| Cycles<br>Instructions  | C1 | C2 | СЗ | C4  | C5  | C6  | C7 |
|-------------------------|----|----|----|-----|-----|-----|----|
| 1. addi \$t0, \$a0, -1  | IF | ID | EX | MEM | WB  |     |    |
| 2. and \$s2, \$t0, \$a0 |    | IF | ID | EX  | MEM | WB  |    |
| 3. sltiu \$a0, \$t0, 5  |    |    | IF | ID  | EX  | MEM | WB |

4.2. Combien d'instructions après une instruction addi pourraient être affectées par des aléas de données liés à cette instruction ?

#### Suspension de pipeline

4.3. Identifiez les aléas de données dans le code ci-dessous. Pourquoi l'un de ces aléas ne peut pas être résolu avec l'unité de transfert ? Que pouvons-nous faire pour résoudre ce problème ?

| Cycles                 | C1 | C2 | С3 | C4  | C5  | C6  | C7  | C8 |
|------------------------|----|----|----|-----|-----|-----|-----|----|
| 1. addi \$s0, \$s0, 1  | IF | ID | EX | MEM | WB  |     |     |    |
| 2. addi \$t0, \$t0, 4  |    | IF | ID | EX  | MEM | WB  |     |    |
| 3. lw \$t1, 0(\$t0)    |    |    | IF | ID  | EX  | MEM | WB  |    |
| 4. add \$t2, \$t1, \$0 |    |    |    | IF  | ID  | EX  | MEM | WB |

4.4. Dans une équipe d'ingénieurs, vous travaillez sur la conception d'un compilateur pour un processeur MIPS (rappelez-vous, c'est le compilateur qui produit des fichiers en langage assembleur). Comment ce compilateur pourrait réorganiser les instructions du code de l'exercice 4.1 afin de minimiser les aléas de données tout en garantissant le même résultat.

#### Détection des aléas de données

Supposons que nous ayons les signaux rs, rt, RegWEn et rd pour deux instructions aux instants t et t+1. Nous souhaitons déterminer si un aléa de données existe entre ces instructions. En ce sens, nous pouvons vérifier si le rd de l'instruction à l'instant t correspond à rs ou rt de l'instruction à l'instant t+1, indiquant, de ce fait, un aléa de données. Nous pourrions alors utiliser cette détection pour déterminer quels chemins de transfert à utiliser ou la période de suspension (le cas échéant) à appliquer pour assurer une exécution correcte des instructions. En pseudo-code, cela donne :

```
if (rs(n + 1) == rd(n) || rt(n + 1) == rd(n) && RegWEn(n) == 1) {
   /* transférer la sortie de l'UAL de l'instruction n */
}
```

#### Aléas de branchement

Les aléas de branchement sont causés par les instructions de saut et de branchement. En effet, dans une exécution séquentielle sans branchement et sans saut l'instruction suivante se trouve à l'adresse spécifiée par PC + 4. Dans le cas des instructions de saut et pour certaines instructions de branchement, le PC suivant n'est pas PC + 4, mais sera le résultat du calcul effectué à l'étape EX. Une solution possible à ce problème est de suspendre le pipeline lors d'un aléa de branchement, mais cela impactera négativement les performances.

- 4.5. Outre la suspension du pipeline, que pouvons-nous faire pour résoudre les aléas de branchement ?
- 4.6. Combien d'aléas d'exécution y aurait-il dans le code MIPS ci-dessous s'il est exécuté dans un processeur en pipeline **sans** unité de transfert ? Quel est le type de chaque aléa d'exécution ? (Examinez toutes les paires d'instructions possibles pour des aléas éventuels).

Combien de fois faut-il suspendre le pipeline pour éliminer des aléas de données éventuels ? Quid des aléas de branchement ?

| Cycles Instructions    | C1 | C2 | C3 | C4  | C5  | C6  | C7  | C8  | C9 |
|------------------------|----|----|----|-----|-----|-----|-----|-----|----|
| 1. sub \$t1, \$s0, 1   | IF | ID | EX | MEM | WB  |     |     |     |    |
| 2. or \$s0, \$t0, \$t1 |    | IF | ID | EX  | MEM | WB  |     |     |    |
| 3. sw \$s1, 100(\$s0)  |    |    | IF | ID  | EX  | MEM | WB  |     |    |
| 4. beq \$s0, \$s2, 1   |    |    |    | IF  | ID  | EX  | MEM | WB  |    |
| 5. add \$t2, \$0, \$0  |    |    |    |     | IF  | ID  | EX  | MEM | WB |