# Au coeur de l'ordinateur

## Éléments d'histoire

Les premiers «ordinateurs» apparaissent autour des années 1940 avec pour but principal d'accélerer le temps nécessaire à certains calculs scientifiques très chronophages.

L'un des ordinateurs emblématique de cette époque est l'[ENIAC](https://fr.wikipedia.org/wiki/ENIAC) (1945). Machine lourde et volumineuse (plusieurs tonnes et dizaines de m<sup>3</sup>), elle se programmait par cablage et les données et résultats étaient lus ou écrits sur des [cartes perforées](https://en.wikipedia.org/wiki/Punched_card#/media/File:Blue-punch-card-front-horiz.png). Elle permettait d'effectuer des milliers d'opérations par secondes sur des nombres à 10 chiffres ce qui était une [performance exceptionnelle à l'époque](https://fr.wikipedia.org/wiki/ENIAC#Comparaison_de_vitesses_de_calcul).

<img src="attachment:Eniac.jpg" width="500px"/>


Dans ces années, le mathématicien et physicien américain **John Von Neumann** participe à la conception d'un nouvel ordinateur, l'EDVAC, dont le projet fut initié par les concepteurs de l'ENIAC (Eckert et Mauchley) - avant même la mise en service de celui-ci - en vue d'améliorer son architecture.

<img src="attachment:20170710151520!JohnvonNeumann-LosAlamos.jpg" width="200px;"/>

En 1945, John Von Neumann, rapporteur des travaux en la matière, propose une architecture à *programme enregistrée* connue sous le nom d' **architecture de von Neumann**.

Elle est encore aujourd'hui à la base de l'architecture de (presque) tous les ordinateurs.

## Architecture de Von Neumann

[Vidéo sur cette partie](https://vimeo.com/420592941)

<img src="attachment:von_neumann3.jpg"/>

La machine est composée de quatre parties essentielles:
- la **mémoire principale** (*main memory*) qui contient *à la fois le programme et les données* (d'où le vocable *programme enregistré*),

- l'**unité centrale** ou *processeur* (*CPU - Central Processing Unit*) qui regroupe:
    - l'**unité de commande** (ou de *contrôle*): son rôle est de *charger* \[ *fetch* \] et de *décoder* les instructions du programme afin de générer les signaux nécessaires à leur exécution,

    - l'**unité arithmétique et logique** - *UAL* ou *ALU*: effectue les opérations arithmétiques (addition, soustraction...) et logiques (ET, OU, NON, décalages ... bit-à-bit) par l'intermédiaire d'une petite mémoire appelé *registre accumulateur*,

- les **entrées/sorties** qui permettent de recevoir ou d'envoyer des informations depuis ou vers «le monde extérieur».

La machine est animée par une **horloge**. À chaque «top» de l'horloge, elle réalise le cycle **«charger - décoder - exécuter»** (*fetch-decode-execute cycle*):
- **charger**: 
    - chercher en mémoire l'instruction située à l'adresse indiquée par le **compteur de programme** (*PC* - *Programm Counter*),
    - puis, incrémenter ce compteur d'une unité.


- **décoder**: 

  consiste à analyser le motif binaire constituant l'instruction chargée précédemment afin de générer les signaux électroniques nécessaires à l'accomplissement matériel de l'instruction,

- **exécuter**:

    réalisation effective de l'instruction précédemment décodée.



Perdu? C'est en effet un modèle assez abstrait... 

Nous allons l'explorer avec un simulateur. Relire cette section après avoir suffisemment «jouer» avec. 

## Little Man Computer (LMC)

Le «Little Man Computer» - [accessible ici](http://www.peterhigginson.co.uk/LMC/) - modélise un ordinateur simplifié avec une **architecture de Von Neumann**.

### Description du LMC

[Vidéo de présentation du LMC](https://vimeo.com/420593254)

Il est composé d'une *mémoire principale de 100 mots* (adresses 0 à 99).

Chaque **mot** «+/-ddd » est formé de trois chiffres *décimaux* et peut désigner une *instruction* ou une *donnée* (entier de -999 à +999).

Si un mot «ddd» est chargé comme une **instruction** parce qu'il est «pointé» par le *compteur de programme*, alors:
- le premier chiffre précise le *type d'opération* (*opcode*),
- les deux derniers forment une *adresse mémoire* (0 à 99).

Les opérations sont relatives à l'*accumulateur*. Voici les **types d'opérations** possibles (voir exemples plus loin):
- *mémoire*: charger - `LDA` (**3**), ranger - `STA` (**5**)
- *arithmétique*: addition - `ADD` (**1**), soustraction - `SUB` (**2**);
- *branchement*: inconditionel - `BRA` (**6**) et conditionnel si nul - `BRZ` (**7**), si positif ou nul - `BRP` (**8**);
- *entrées* ou *sortie*: `INP` **9**01 ou `OUT` **9**02.

Exemples
- l'instruction **110** signifie  «**ajouter** (le contenu de) l'accumulateur au mot d'adresse **10** et placer le résultat dans l'accumulateur»; 
- **550**: **ranger** le contenu de l'accumulateur dans le mot d'adresse **50**;
- **705**: **sauter** à l'instruction d'adresse **5** *si* l'accumulateur est nul»;
- **901**: envoyer l'entrée dans l'accumulateur.
- le programme **901 520 901 120 902** demande à l'utilisateur deux nombres et affiche leur somme en sortie.
 

On peut programmer cette machine de deux façons:
- soit en modifiant la mémoire directement,
- soit en écrivant son programme en *assembleur* dont voici les principales mnémonics 

### Pour mémoire

|         Instructions       |  Premier chiffre |   Mnémonic  |         pour         |
|:--------------------------:|:----------------:|:-----------:|:--------------------:|
|           charger          |       **5**      |    `LDA`    |     *LoaD in Acc*    |
|           ranger           |       **3**      |    `STA`    |   *STore from Acc*   |
|           ajouter          |       **1**      |    `ADD`    |                      |
|         soustraire         |       **2**      |    `SUB`    |      *SUBstract*     |
|        entrée/sortie       |  **9**(01 ou 02) | `INP`/`OUT` |   *INPut*/*OUTput*   |
| branchement inconditionnel |       **6**      |    `BRA`    |    *BRanch Always*   |
| branchement si nul         |       **7**      |    `BRZ`    |   *BRanch if Zero*   |
| branchement si $\geqslant 0$|       **8**      |    `BRP`    | *BRanch if Positive* |
|      fin du programme      |      **0**00     |    `HLT`    |        *HaLT*        |
|      donnée en mémoire     |                  |    `DAT`    |        *DATa*        |

*Exemple*: `LDA 44` - charger le mot situé à l'*adresse* 44 dans l'*accumulateur*.

En assembleur, `//` débute un commentaire.

La **directive** `DAT` suivie d'une valeur a pour effet de placer la valeur en mémoire lorsque le programme est assemblé (à l'adresse définie par la position de la directive dans le code).

      0:  DAT 1 // place la valeur 1 à l'adresse 0
      1:  LDA 0 //la valeur 1 est chargé dans l'accumulateur
      2:  ...

Enfin, il est possible d'**étiqueter** les instructions en les faisant précéder par un mot (suite de lettres sans espace) - appelé *étiquette* - et d'utiliser celle-ci n'importe où dans le code pour désigner l'adresse de l'instruction étiquetée.

    5 :        ...       // 6 instructions avant (adresses 0, 1, ... 5)
    6 : boucle LDA 50    // adresse 6
    . :        ...       
    12:        BRA boucle // l'assembleur remplace «boucle» par 6 

## Exemples de programmes en assembleur pour le LMC

L'objectif ici est de comprendre comment les principales structures algorithmiques (affectation, séquence, test, boucle) se traduisent en **langage machine** ou dans sa forme mnémonic appelée *assembleur*.

En effet, pour pouvoir être exécuté par l'ordinateur, tout programme écrit dans un langage de «haut niveau» comme Python, C, javascript ... doit-être préalablement transformé en langage machine, c'est-à-dire en *code binaire exécutable*, seule forme compréhensible par le processeur.

### Exemple 1 - Variable - Incrémentation

[Video d'aide](https://vimeo.com/420594607)

Notre premier programme demande un nombre à l'utilisateur, l'incrémente et affiche le résultat à l'écran. En Python, cela donnerait:

In [None]:
a = int(input())
a = a + 1
print(a)

Pour le [LMC](http://www.peterhigginson.co.uk/LMC/), en utilisant les mnémonics de son assembleur, on pourrait écrire (je met en commentaire l'addresse mémoire de chaque instruction):

       INP     //0
       STA a   //1
       ADD UN  //2
       STA a   //3
       OUT     //4
       HLT     //5
    UN DAT 1   //6
    a  DAT     //7

**ligne 0** On demande un nombre en entrée (INP), **1** on le range à l'adresse d'étiquette 'a' (STA), **2** on ajoute le nombre situé à l'adresse 'UN' à l'accumulateur (ADD), **3** on range à nouveau le résultat, **4** on envoie l'accumulateur sur la sortie (OUT), **5** on indique la fin de la partie «programme» (HLT) car **6, 7** la suite est constitué des données manipulées (DAT) par le programme.

Il faut bien comprendre que les *étiquettes* 'UN' (ligne 6) et 'a' (ligne 7) ont pour vocation d'être *remplacées*, au moment de l'assemblage, par une *adresse effective* en mémoire: 'UN' par 06 (ligne 2) et 'a' par 07 (ligne 1 et 3).

Le numéro de remplacement d'une étiquette est très simplement son numéro d'apparition dans la liste des instruction lorsqu'elle est *déclarée* c'est-à-dire lorsqu'elle apparaît tout à gauche (ligne 6 et 7).

**Expérimenter pour bien comprendre**, je vous conseille de charger ce programme dans le [LMC](http://www.peterhigginson.co.uk/LMC/), d'observer attentivement les valeurs en mémoire (adresses 0 à 7) puis d'exécuter le programme pas à pas (en mode *fast*) en suivant l'évolution de l'accumulateur et aussi de la mémoire à l'adresse 7 (pour a). Si une étape vous embrouille, appuyer sur *Reset* et recommencer.

*Remarque*: On peut observer que, puiqu'il n'y a qu'une variable, l'accumulateur suffit pour la gérer. On peut donc simplifier ce programme en:

       INP     
       ADD un
       OUT
       HLT
    un DAT 1
    

#### Exercice 1 - différence de deux nombres

Traduire le programme qui suit en code assembleur pour le [LMC](http://www.peterhigginson.co.uk/LMC/).

In [None]:
a = int(input())
b = int(input())
c = a - b
print(c)    

*Indice*: Vous aurez besoin d'utiliser l'instruction LDA pour récupérer les données stockées précédemment en mémoire.

Par exemple:

    INP  
    STA a
    INP  
    STA b
    LDA a
    SUB b
    STA c
    OUT
    HLT
    a DAT
    b DAT
    c DAT

*Note*: On peut observer que 'c' n'est pas utile dans ce programme. Le supprimer revient à écrire `print(a-b)` en Python. 

### Exemple 2 - Si, Alors, Sinon

[Video d'aide](https://vimeo.com/420595422)

Le programme suivant demande un nombre et affiche sa *valeur absolue* (nombre sans son signe éventuel). En Python, cela donnerait:

In [None]:
a = int(input())
if a >= 0:
    print(a)
else:
    print(-a) # -a == 0 - a

Pour réaliser un tel programme en langage machine, nous aurons besoin d'une instruction de **branchement conditionnel**, ici `BRP <etiquette>` (*branch if positive*).

Pour rappel, l'effet de cette instruction est de remplacer la valeur du compteur de programme par celle de l'étiquette *si l'accumulateur contient un nombre positif ou nul*.

         INP
         STA a
         BRP pos // test
         // le test est faux (pas de saut)
         LDA zero
         SUB a
         OUT
         HLT // -> stop!
         //le test est vrai (saut à 'pos')
    pos  LDA a
         OUT
         HLT // -> stop!
    zero DAT 0
    a    DAT

Pour bien comprendre, copier ce programme dans le [LMC](http://www.peterhigginson.co.uk/LMC/) et exécuter le pas à pas (mode fast) en observant attentivement l'évolution de l'accumulateur et du compteur de programme.

*Remarques*: Observer que, contrairement au code Python, le saut - ou branchement - a lieu lorsque le test est *vrai*. Cela ne facilite pas la lecture du code assembleur.

Noter aussi l'importance de l'instruction `HLT` qui arrête le programme. Sans elle, il continuerait d'«avancer» car `PC <- PC + 1` par défaut...

#### Exercice 2 - maximum de deux nombres

L'utilisateur saisi deux nombres et le programme affiche le plus grand des deux. En python, cela donnerait:

In [None]:
a = int(input())
b = int(input())
if a <= b: # eq. à b - a >= 0 ...
    print(b)
else:
    print(a)

Réaliser ce programme en assembleur pour le [LMC](http://www.peterhigginson.co.uk/LMC/). Vous aurez besoin de l'instruction `BRP <etiquette>` (*BRanch if Positive*) pour y parvenir...

         INP
         STA a
         INP
         STA b
         SUB a
         BRP pos
         LDA a
         OUT
         HLT
    pos  LDA b
         OUT
         HLT
    a    DAT
    b    DAT

#### Exercice 3 - «if elif else»

Le programme suivant affiche la différence «positive» des deux nombres saisis ou alors le double de l'un d'eux s'ils sont égaux. Voici ce que cela donnerait en Python:

In [None]:
a = int(input())
b = int(input())
if a == b: # eq. à b - a == 0
    print(2*a)
elif b >= a:
    print(b-a)
else:
    print(a-b)

Le coder en assembleur pour le [LMC](http://www.peterhigginson.co.uk/LMC/)

         INP
         STA a
         INP
         STA b
         SUB a
         BRZ egal
         BRP pos
         LDA a
         SUB b
         OUT
         HLT
    pos  OUT
         HLT
    egal LDA a
         ADD a
         OUT
         HLT
    a    DAT
    b    DAT

### Exemple 3 - compte à rebours - Boucle

[Video d'aide](https://vimeo.com/420596368)

L'utilisateur saisi un nombre et le programme affiche le compte à rebours à partir de ce nombre et jusqu'à 1; en python, en utilisant une boucle *while* cela donne:

In [None]:
i = int(input())
while i > 0: #eq à i - 1 >= 0 car i est un entier.
    print(i)
    i = i - 1

Pour réaliser une telle boucle en assembleur, nous aurons besoin de l'instruction de branchement *inconditionnel* `BRA <etiquette>` pour *BRanch Always*.

Expérimenter avec le code qui suit dans le [LMC](http://www.peterhigginson.co.uk/LMC/).

           INP
           STA i
    boucle LDA i
           SUB un
           BRP faire
           HLT
    faire  LDA i
           OUT
           SUB un
           STA i
           BRA boucle
     un    DAT 1
     i     DAT

Ici, le rôle essentiel du branchement *inconditonnel* est de permettre de revenir au test de boucle. 

#### Exercice 4 - soustractions successives

Demander à l'utilisateur un grand nombre puis un plus petit. Soustraire le petit en boucle tant que le résultat est posifif ou nul. Afficher alors le résultat.

Par exemple, si l'utilisateur saisi 20 et 3, cela affichera -1; s'il saisi 16 et 4 cela affichera -4.

           INP
           STA g
           INP
           STA p
           LDA g
    boucle BRP faire
           OUT
           HLT
    faire  SUB p
           STA g
           BRA boucle
    g      DAT
    p      DAT

#### Exercice 5 - apprendre au LMC à multiplier deux entiers

Observer que la multiplication revient à faire des additions successives, par exemple: 5\*7 revient à effectuer 7+7+7+7+7.

Programmer le [LMC](http://www.peterhigginson.co.uk/LMC/) pour qu'il affiche le produit des nombres saisis par l'utilisateur.

           INP a
           STA a
           INP b
           STA b
    boucle SUB UN
           STA b
           BRP faire
           LDA p
           OUT
           HLT
    faire  LDA p
           ADD a
           STA p
           LDA b
           BRA boucle
    UN     DAT 1
    a      DAT
    b      DAT
    p      DAT 0

## Conclusion

Même si «The Little Man Computer» est une simplification (nombres décimaux plutôt que binaires, pas d'opérations logiques, pas de nombres flottants ...) d'une machine d'architecture **Von Neumann**, elle nous a permis de nous familiariser avec:

- Les composants fondamentaux des machines:
    - **mémoire principale** - *RAM*,
    - **processeur** - *CPU* = unité de commande + unité arithmétique et logique,
    - **entrées/sorties** - *I/O*.


- La notion de *programme enregistré*: programme et données sont en même temps en mémoire.

- Le *cycle machine* - **Charger - Décoder - Exécuter** (*fetch, decode, execute*) en lien avec le *compteur de programme*,

- Le *code machine*: simple suite de nombres (motif binaire en réalité) qui, *après décodage*, engendre l'exécution d'une instruction.

- L'**assembleur** qui, par le biais de *mnémonics*, permet à un «humain» (certes acharné!) de programmer la machine au plus près de ce qu'elle sait faire et notamment les opérations de: 
    - gestion de la mémoire - *load and store* (notion de variable),
    - *branchements* conditionnels ou non (notion de test et de boucle).

Bien sûr, le panorama est encore loin d'être complet... Sachez que l'auteur du LMC - Peter Higginson - a produit très récemment (début 2020) un simulateur bien plus complet - l'[ARMlite](https://www.peterhigginson.co.uk/ARMlite/) - qui simule une machine «ARM» (type des processeurs qui équipent la grande majorité des «smartphones»). Si vous souhaitez développer vos compétences en «langage machine», vous trouverez dans le dossier «Initiation au langage d'assemblage» de quoi vous initiez à des concepts plus évolués comme:
- l'utilisation des opérations logiques,
- les différents modes d'adressages,
- la gestion fine de la mémoire,
- l'utilisation de la «pile» qui permet de réaliser ce que nous appelons «fonction» dans les langages de haut niveau,
- les interruptions et la programmation événementielle (en réaction aux actions de l'utilisateur),
- ...