# ASR2 - Gestion des processus et des ressources


## 0 - Rappels 

### 0.1 Exécution d'un programme

Un programme est une suite d'instructions élémentaires ayant vocation à être exécutées par une machine. On parle d'**exécutable** lorsque ce programme est écrit en **langage machine**, directement lisible par la machine.  

Le langage machine est écrit directement en binaire et est propre au processeur utilisé. Il se lit comme une succession de mots binaires, les **commandes**, de longeur fixe (généralement 32 ou 64 bits : ARM, MIPS) ou variable (x86). Ces commandes se décomposent ainsi :

- une partie du mot (généralement le début) constitue le **code opération** ou `opcode` de la commande et indique au processeur quelle opération (addition, lecture ou écriture mémoire, comparaison, etc.) il doit effectuer ;
- le reste du mot correspond aux **arguments de la commande** (adresse mémoire de lecture, registre à utiliser, nombre binaire à ajouter etc.).

Par exemple, sur les processeurs d'architecture MIPS (32 bits) on peut utiliser la commande suivante : 

`000000 00001 00010 00110 00000 100000`<br>
`op     rs    rt    rd    shamt fonct`

On a donné des noms aux différentes parties de constitutives de cette commande :

- `op = 000000` et `fonct = 100000` indiquent au processeur qu'il doit effectuer une *addition* ;
- `rs = 00001` et `rt = 00010` lui indiquent qu'il doit effectuer l'addition des contenus des *registres* 1 et 2 ;
- `rd = 00110` indique que le résultat doit être stocké dans le *registre* 6 ;
- `shamt = 00000` indique qu'il ne doit pas appliquer de *décalage* au résultat.

**Remarque :** Pour chaque langage de programmation, il existe un programme appelé **compilateur** dont le rôle est de traduire les programmes de ce langage en langage machine. Certains langages (comme C) sont utilisés avec un compilateur seul qui crée l'exécutable d'un programme une bonne fois pour toute, exécutable pouvant être exécuté ensuite. Pour d'autres (comme Python) on utilise un **interpréteur** qui se charge à la fois de la compilation et de l'exécution du programme. En Python, un programme est donc compilé à chacune de ses exécutions.  

Lorsqu'une machine exécute un programme (exécutable), elle en lit et exécute les commandes une par une en suivant le **cycle d'exécution**. 

La vidéo suivante explique plus en détail le fonctionnement de ce cycle.


In [1]:
#Ctrl+Enter pour afficher la vidéo
from IPython.display import HTML
HTML('<iframe width= 560 height = 315 src="https://www.youtube.com/embed/Z5JC9Ve1sfI" frameborder="0" allowfullscreen></iframe>')



### 0.2 - Système d'exploitation

Lorsqu'on démarre un ordinateur, un premier programme partiulier est lancé : le **système d'exploitation** souvent abrégé en OS : *operating system*. Il en existe de nombreux plus ou moins spécialisés dans l'exploitation de différents types de machines, libres ou non. Parmis les plus connus on trouve *Windows*, *GNU/Linux* et *MaxOS* pour les ordianteurs de bureau et *Android* et *iOS* pour les smartphones et tablettes.

Le système d'exploitation a pour objectif de faciliter l'utilisation de la machine par les utilisateurs et les autres programmes en leurs offrant un certain nombre de services :

- utilisation de **périphériques** (claviers, souris, écran, lecteurs, etc.) ;
- **gestion des fichiers** (arborescence) et des **permissions** ;
- **allocation des ressources** (quel programme utilise le processeur, la carte graphique, un périphérique ?) ;
- etc. 

Le service d'allocation des ressources doit permettre aux programmes de se **partager l'utilisation de la machine**. Plus précisément, le système d'explotation va décider (en fonction des demandes de l'utilisateur) quel autre programme doit être exécuté. 


### 0.3 - Lancement d'un programme par le système d'exploitation (mono-tâche)

Lorsqu'on demande au système d'exploitation d'exécuter un programme, celui-ci va effectuer plusieurs opérations : 

1. allouer de l'espace mémoire au programme dans la mémoire vive ; 
2. copier dans cet espace le code du programme en partant d'une certaine adresse ;
3. ecrire cette adresse dans le registre IP du processeur afin que celui-ci démarre l'exécution. 

Une fois le programme terminé, celui-ci redonne la main au système d'exploitation en écrivant une certaine adresse dans le registre IP du processeur.


<img src = "RAM 1.png"/>



Pour donner un exemple concret considérons un système d'exploitation, disons Debian, ainsi que deux programmes que l'utilisateur veut exécuter, disons Firefox et VLC. 

- au démarrage de la machine, Debian est chargé dans la RAM et exécuté ;
- l'utilisateur demande à Debian de lancer Firefox ;
- Debian alloue de l'espace mémoire disponible à Firefox et lui donne la main ;
- Firefox s'exécute puis rend la main à Debian ;
- l'utilisateur demande à Debian de lancer VLC ;
- Debian alloue de l'espace mémoire disponible à VLC et lui donne la main ;
- VLC s'exécute puis rend la main à Debian.






## 1- L'ordonnanceur de processus

Le mode de fonctionnement décrit plus haut permet bien au système d'exploitation d'excuter plusieurs programmes. Cependant, il ne permet pas de les exécuter **simultanément**, on parle d'**d'exécution concurrente**. Il s'agît là d'un point essentiel : imaginez travailler avec une machine qui ne peut exécuter qu'un seul programme à la fois : pas de navigateur internet pour vous aider à coder, pas de discussion vocale pendant que vous jouez à un jeu en ligne, etc.

La partie du système d'exploitation chargée de contourner ce problème est appelée un **ordonnanceur de processus**.


### 1.1 - Processus, PCB

Un **processus** est un programme en cours d'exécution. Il est décrit à un instant $t$ par les caractéristiques suivantes :

- son **PID** (*Process ID*) : l'identifiant numérique du processus ;
- son **état** : nouveau, prêt, en exécution, en attente ou terminé) ;
- les valeurs stockées dans les **registres** du processeur ;
- l'ensemble de la **mémoire** qui lui est allouée ;
- la liste des **ressources** qu'il utilise (fichiers ouverts, connexion réseau, périphériques, etc.).

L'ensemble de ces informations est appelé le **PCB** (*Process Control Bloc*) du processus. Pour chaque nouveau processus, l'ordonnanceur génère et sauvegarde à un certain endroit de la mémoire un nouveau PCB, qu'il supprime dès que le processus est terminé. 

Le PCB permet notamment de partager la RAM en plusieurs zones dédiées à l'exécution de différents programmes et éventuellement de "sauvegarder" l'état courrant d'un processus. 

<img src = "RAM 2.png"/>

### 1.2 - Interruptions

Il existe de plusieurs moyens d'interromptre un processus. Par exemple, en Python : 

- un erreur non-rattrapée interrompt définitivement l'exécution du programme ;
- une interruption clavier par l'utilisateur (`Ctrl+C` sur IDLE) a le même effet ;
- un `input` interrompt l'exécution du programme tant que l'utilisateur n'a pas entré de valeur.

Ces différentes interruptions qui peuvent terminer ou mettre en pause l'exécution du programme sont gérées par un programme appelé **gestionnaire d'interruptions**. 

Le gestionnaire d'interruptions dispose d'un type d'interruption bien particulier appelé **interruption horloge**. Cette interruption a lieu automatiquement à intervalle de temps régulier (typiquement une fois toute les 100ns) et met en pause le processus en cours sur le processeur pour rendre la main au système d'exploitation et plus précisément à l'ordonnanceur. 

1. Celui-ci met à jour le PCB du processus interrompu et décide d'un autre processus à reprendre jusque la prochaine interruption.
2. Puis, il charge dans les registres du processeur l'ensemble des valeurs enregistrées dans le PCB du nouveau processus.
3. Il redonne la main au nouveau processus qui reprend donc son exécution.

On appelle cela une **commutation de contexte**.

Ce fonctionnement permet donc de répartir l'utilisation du processeur sur plusieurs processus à la fois, les uns après les autres : chaque processus peut travailler 10ns avant de rendre la main à un autre. Cela donne l'impression que tous les processus fonctionnent en même temps, l'oeuil et le cerveau humain ne parvenant pas à distinguer des intervalles de temps aussi petits !

<img src = "RAM 3.png"/>

**Remarque :** l'exécution concurrente générère une *illusion de simultanéité* des processus. En particulier, elle ne permet pas de travailler plus vite, au contraire ! Pour véritablement exécuter plusieurs programmes en même temps, on utilise plusieurs processeurs ou plusieurs coeurs.


On peut résumer le **cycle de vie d'un processus** sur le schéma suivant :


<img src = "exécution.png"/>

### Pour résumer 

- Un **système d'explotation** (Windows, MacOS, GNU/Linux) permet entre autre d'exécuter plusieurs programmes "en même temps" sur une seule machine. 
- On parle de **processus** pour désigner un programme en cours d'exécuhtion. 
- Les processus sont exécutés en **concurrence** sur un seul processeur, c'est à dire que chaque processus peut travailler sur celui-ci pendant un certain temps avant de laisser la place à un autre. 
- **Le gestionnaire d'exceptions** est chargé d'interromptre le processus en cours exécucution à intervalle de temps régulié via des **interruptions horloge**. 
- **L'ordonnanceur de processus** du système d'exploitation décide ensuite à chaque instant de redonner la main à tel ou tel processus. 

## 2 - Threads Python

Pour illustrer en quoi l'exécution concurentielle des processus peut être compliquée à gérer, nous allons introduire la **programmation multithreadée** en Python.

Les *thread*, ou **processus légers** sont des sous-processus qu'on peut générer à l'intérieur d'un programme. Ils sont exécuté au sein d'un même processus mais en concurrence les uns avec les autres. 

### 2.1 - Créer un thread en Python

On peut créer et utiliser des threads en python grace au module `threading`.

In [5]:
#programme 57 - comptage en parallèle
#exécuter ce programme plusieurs fois et observer les différents affichages 

import threading

#une fonction hello
def hello(n):
    for i in range(100):
        print(f"Je suis le thread {n} et ma valeur est {i}")
    print(f"------ Fin du thread {n}")

# création de 4 threads qui vont exécuter la fonction hello 
for n in range(4):
    t = threading.Thread(target = hello, args = [n])
    t.start()

Je suis le thread 0 et ma valeur est 0
Je suis le thread 0 et ma valeur est 1
Je suis le thread 0 et ma valeur est 2
Je suis le thread 0 et ma valeur est 3
Je suis le thread 0 et ma valeur est 4
Je suis le thread 0 et ma valeur est 5
Je suis le thread 0 et ma valeur est 6
Je suis le thread 0 et ma valeur est 7
Je suis le thread 0 et ma valeur est 8
Je suis le thread 0 et ma valeur est 9
Je suis le thread 0 et ma valeur est 10
Je suis le thread 0 et ma valeur est 11
Je suis le thread 0 et ma valeur est 12
Je suis le thread 0 et ma valeur est 13
Je suis le thread 0 et ma valeur est 14
Je suis le thread 0 et ma valeur est 15
Je suis le thread 0 et ma valeur est 16
Je suis le thread 0 et ma valeur est 17
Je suis le thread 0 et ma valeur est 18
Je suis le thread 0 et ma valeur est 19
Je suis le thread 0 et ma valeur est 20
Je suis le thread 0 et ma valeur est 21
Je suis le thread 0 et ma valeur est 22
Je suis le thread 0 et ma valeur est 23
Je suis le thread 0 et ma valeur est 24
Je suis le


Je suis le thread 3 et ma valeur est 1
Je suis le thread 3 et ma valeur est 2
Je suis le thread 3 et ma valeur est 3
Je suis le thread 3 et ma valeur est 4
Je suis le thread 3 et ma valeur est 5
Je suis le thread 3 et ma valeur est 6
Je suis le thread 3 et ma valeur est 7
Je suis le thread 3 et ma valeur est 8
Je suis le thread 3 et ma valeur est 9
Je suis le thread 3 et ma valeur est 10
Je suis le thread 3 et ma valeur est 11
Je suis le thread 3 et ma valeur est 12
Je suis le thread 3 et ma valeur est 13
Je suis le thread 3 et ma valeur est 14
Je suis le thread 3 et ma valeur est 15
Je suis le thread 3 et ma valeur est 16
Je suis le thread 3 et ma valeur est 17
Je suis le thread 3 et ma valeur est 18
Je suis le thread 3 et ma valeur est 19
Je suis le thread 3 et ma valeur est 20
Je suis le thread 3 et ma valeur est 21
Je suis le thread 3 et ma valeur est 22
Je suis le thread 3 et ma valeur est 23
Je suis le thread 3 et ma valeur est 24
Je suis le thread 3 et ma valeur est 25
Je suis 

Le programme précédent crée quatre objets `Thread`. Pour définir un thread, ont donne :

- la fonction que le thread doit appeler; ici `target = hello` ;
- les arguments sur lesquels la fonction est appelée sous la forme d'un tableau, ici `args = [n]`.

La méthode `start` permet alors de démarrer le thread.

Comme on peut l'observer sur l'exemple ci-dessus, les threads ne s'exécutent pas toujours dans le même ordre, parfois un thread ne termine pas sont exécution avant de laisser la main à un autre. Comme les processus, les threads fonctionnent de manière **concurente**.  


### 2.2 - Attente et verrou

Voyons un autre exemple : on veut quatre threads incrémentant chacuns la valeur d'un seul et même compteur global un certain nombre de fois. Esayons un premier programme : 


In [160]:
#programme 58.1 - compteur partagé (on a l'impression que ça marche)

import threading

COMPTEUR = 0 

def incr():
    global COMPTEUR
    for i in range(1000): 
        v = COMPTEUR
        COMPTEUR = v+1

for n in range(4):
    t = threading.Thread(target = incr, args = [])
    t.start()

print("valeur finale", COMPTEUR)

valeur finale 40000


Ce programme a l'air de fonctionner. Nos quatre threads ajoutent 1000 à `COMPTEUR` et on obtient 4000. 

Cependant, lorsque'on modifie légèrement le programme, on se rend compte qu'il n'est pas satisfaisant. En remplaçant 1000 par 1000000 par exemple. Lorsqu'on fait cela, le résultat n'est plus le bon, que ce passe-t-il ?

Un premier problème vient du fait que la méthode `start` démarre le thread puis rend la main au processur principal. Ici, les quatre thread démarrent mais n'ont pas le temps de terminer avant le `print`. On peut le vérifier en ajoutant un print à la fin de la fonction `incr`.

In [8]:
#programme 58.2 - compteur partagé (les problèmes arrivent)

import threading

COMPTEUR = 0 

def incr(n):
    global COMPTEUR
    for i in range(1000000): 
        v = COMPTEUR
        COMPTEUR = v+1
    print(f"------- Fin du thread {n}")

for n in range(4):
    t = threading.Thread(target = incr, args = [n])
    t.start()

print("Valeur finale", COMPTEUR)

------- Fin du thread 0
------- Fin du thread 1
Valeur finale 3241518
------- Fin du thread 2
------- Fin du thread 3


Pour régler ce problème, on peut indiquer au programme principal d'attendre que le threads soient terminés à l'aide de la méthode `join`. Notez bien que ceci a uniquement un effet sur le programme principal, les thread sont toujours exécutés de manière concurrente.

In [9]:
#programme 58.3 - compteur partagé (ça va mieux)

import threading

COMPTEUR = 0 

def incr(n):
    global COMPTEUR
    for i in range(1000000): 
        v = COMPTEUR
        COMPTEUR = v+1
    print(f"fin du thread {n}")

th = []
for n in range(4):
    t = threading.Thread(target = incr, args = [n])
    t.start()
    th.append(t)
    
for t in th:
    t.join()

print("valeur finale", COMPTEUR)

fin du thread 0
fin du thread 1
fin du thread 2
fin du thread 3
valeur finale 4000000


Cette fois tout va bien. Presque... Modifions encore un peu le programme : 

In [163]:
#programme 58.4 - compteur partagé (rien ne va plus)

import threading

COMPTEUR = 0 

def incr(n):
    global COMPTEUR
    for i in range(1000): 
        v = COMPTEUR
        for j in range(10000):
            #une boucle qui n'a aucun effet sur le résultat ? 
            pour_patienter = 42
        COMPTEUR = v+1
    print(f"fin du thread {n}")

th = []
for n in range(4):
    t = threading.Thread(target = incr, args = [n])
    t.start()
    th.append(t)
    
for t in th:
    t.join()

print("valeur finale", COMPTEUR)

fin du thread 0
fin du thread 1
fin du thread 2
fin du thread 3
valeur finale 1613


Le problème est ici plus subtile et provient de la commutation de contexte ayant lieu entre les threads. 

Comme pour les processus, les threads se déroulent opération par opération pendant un certain temps avant de passer la main à un autre thread. À ce moment, les valeurs des différentes variables du threads sont sauvegardées à un endroit de la mémoire pour être reprises ensuite.   

Dans notre programme, imaginons que cette commutation ait lieu pour un thread `t` entre les commandes `v = COMPTEUR` et `COMPTEUR = v+1` : la valeur `v = COMPTEUR` est sauvegardée jusque la reprise de `t`. C'est un problème car entre temps, les autres threads ont augmenté la valeur du compteur et la commande `COMPTEUR = v+1` ne correspond plus à une incrémentation. 

Pour régler ce problème, il faudrait pouvoir spécifier à Python de ne jamais interrompre nos threads entre ces deux commandes critiques. On utilise pour cela des **verrous** :

In [13]:
#programme 58.5 - compteur partagé (cette fois c'est la bonne)

import threading

COMPTEUR = 0 
verrou = threading.Lock()

def incr(n):
    global COMPTEUR
    for i in range(1000): 
        verrou.acquire()
        #un thread ne peut pas être interrompu ici
        v = COMPTEUR
        for j in range(10000):
            pour_patienter = 42
        COMPTEUR = v+1
        verrou.release()
        #le thread peut de nouveau être interrompu
    print(f"fin du thread {n}")

th = []
for n in range(4):
    t = threading.Thread(target = incr, args = [n])
    t.start()
    th.append(t)
    
for t in th:
    t.join()

print("valeur finale", COMPTEUR)

fin du thread 0
fin du thread 1
fin du thread 3
fin du thread 2
valeur finale 4000


On retrouve la bonne valeur finale !

Un verrou peut être vu comme un objet qui peut être associé à un thread (et à un seul) et qui lui donne le droit de continuer.

La méthode `v.acquire()` essaie d'acquérir le verrou : 
- s'il est déjà possédé par un autre thread, la méthode ne fonctionne pas et le thread est mis en attente ;
- s'il n'est possédé par personne, le thread en fait l'acquisition et peut passe à la suite de son code. 

La méthode `v.release()` libère le verrou afin que d'autres threads puissent l'utiliser.

Comme on l'a vu dans l'exempple précédent, un verrou peu servir à "protéger" une partie du code d'un processus, alors nommée **section critique** qui ne pourra être exécutée que par un thread à la fois.

### 2.3 - Verrous multiples, interblocage

Il est tout à fait possible de créer plusieurs verrous. Par exemple :

In [57]:
import threading 

verrou1 = threading.Lock()
verrou2 = threading.Lock()

def f1():
    verrou1.acquire()
    print("Section critique 1")
    verrou1.release()
    
def f2():
    verrou2.acquire()
    print("Section critique 2")
    verrou2.release()
    
t1 = threading.Thread(target = f1, args = [])
t2 = threading.Thread(target = f2, args = [])
t1.start()
t2.start()

Section critique 1
Section critique 2


Cependant, ces deux verrous n'intéragissent pas ensemble. En effet,  le thread `t1` nécessite pour s'exécuter d'acquérir `verrou1` ce qu'il pourra toujours faire puisque celui-ci n'est pas contesté par `t2`. Ces deux verrous sont donc ici parfaitement inutiles. 

En revanche, s'il y avait eu plus de threads appelant `f1` ou `f2`, alors le fait que les deux sections critiques soient protégées par des verrous différents a son intérêt : si la section critique 1 n'a aucun effet sur la section critique 2, il n'y a pas de raison de bloquer l'exécution de l'une lorsque l'autre est exécutée. 

Voyons maintenant un problème classique pouvant apparaître en programmation concurentielle : l'**interblocage**. 

In [54]:
# Programme 59 - Interblocage (à exécuter jusqu'à ce qu'un problème survienne)

import threading

verrou1 = threading.Lock()
verrou2 = threading.Lock()

def f1():
    verrou1.acquire()
    print("Section critique 1.1")
    verrou2.acquire()
    print("Section critique 1.2")
    verrou2.release()
    verrou1.release()
    
def f2():
    verrou2.acquire()
    print("Section critique 2.1")
    verrou1.acquire()
    print("Section critique 2.2")
    verrou1.release()
    verrou2.release()
    
t1 = threading.Thread(target = f1, args = [])
t2 = threading.Thread(target = f2, args = [])

t1.start()
t2.start()

Section critique 1.1
Section critique 1.2
Section critique 2.1
Section critique 2.2


Le programme ci-dessus peut très bien se dérouler, par exemple si le premier thread s'exécute complétement avec de laisser la main au second. 

Mais il est aussi possible que se programme ne termine pas. Pour cela il suffit que les threads s'exécutent comme suit : 

- `t1` acquière `verrou1` et entre dans la section critique 1.1 ;
- `t1` est interrompu par l'horloge et passe la main à `t2` ; 
- `t2` acquière `verrou2` et entre dans la section critique 1.2 ;
- à partir de ce point, nos thread sont en situation d'**interblocage** (ou *deadlock*), ils se bloquent l'un autre. En effet, pour continuer, `t1` a besoin de `verrou2` détenu par `t2`, mais pour continuer et éventuellement libérer `verrou2`, `t2` a besoin de `verrou1` qui est détenu par `t1`. Le résultat est que les deux thread vont attendre indéfiniment que l'autre libère son verrou.


En fait, on peut retrouver des situations l'interblocage pour n'importe quel ensembles de processus ou thread tant que ceux-ci partages des ressources communes et sous certaines conditions, appelées **conditions de Coffman** : 

1. il existe une ressource exclusive (qui ne peut être utilisée par un seul processus ou thread à la fois) ;
2. un processus ou thread tenant une ressource et en attendant une autre ne la libère pas ;
3. non-préemption : une ressource ne peut être rendue que par le processus qui la détient ;
4. attente circulaire : pour $n$ processus ou threads $P_1$, ..., $P_n$, on a une situation où $P_1$ attend une ressource tenue par $P_2$ qui attend une ressource tenue par $P_3$ ... $P_n$ qui attend une ressource tenue par $P_1$. 

Dans le cas des threads, les verrous sont les ressources exclusives.



### Pour résumer 

- un **thread** ou processus léger est un sous-processus ; 
- `t = threading.Thread(target = ..., args = [...])` crée un thread `t` ;
- `target` représente la fonction que le thread doit exécuter ; 
- `args` représente les arguments passés à la fonction exécutée par le thread ;
    - la méthode `t.start()` démarre le thread `t` (il n'est pas exécuté sinon) ;
- les threads sont exécutés comme les processus en **concurrences** au sein de leur programme ;
- la méthode `t.join()` indique au processus principal qu'il doit attendre la fin du thread `t` avant de passer à la suite ; 
- `v = threading.Lock()` crée un **verrou** ;
- on utilise un verrou `v` en écrivant des instruction entre les appels des méthodes `v.acquire()`et `v.release()` ;
- un thread **ne peut pas être interrompu** lorsqu'il exécute les instructions dans un verrou ;
- il faut être très prudent lorsqu'on définit plusieurs verrou car il est possible de générer des situations d'**interblocage** (*deadlock*) où les threads s'attendent mutuellement.