# Quatrième séance : adressage et mutabilité

- auteur : <a href="mailto:lentz@insa-toulouse.fr">A. Lentz</a>
- date : 2023

Durant cette séance, on étudie la gestion des variables.

## 1) Tout est pointeur !

### a) Les références

En Ada, vous devez déclarer le type d'une variable avant de pouvoir la manipuler.

La déclaration de la variable `Valide` de type booléen permet de réserver l'espace mémoire d'un booléen (un octet). Le nom `Valide` est associé à cet espace jusqu'à la fin de la procédure. La variable `Valide` ne peut changer de type. Si on voulait écrire un Integer dans l'espace associé à `Valide`, l'espace serait insuffisant : un Integer utilise quatre octets.

En Python, vous avez vu que l'on peut modifier le type d'une variable sans problème.

In [None]:
var=2
var=True
var="ok"

En fait, le variable `var` ne correspond pas au contenu lui-même, mais à l'adresse du contenu. Lorsque l'on écrit `var=True`, plusieurs choses se passent :
- `var` est ajouté à l'espace des variables si elle n'y était pas déjà,
- l'espace mémoire pour un booléen est réservé,
- la valeur `True` est écrite à cet endroit,
- on écrit dans `var` l'adresse de cet espace mémoire.

On dit alors que `var` est une **référence** au booléen. On parle de **référencer** (resp. **déréférencer**) lorsqu'on passe d'un contenu à son adresse (resp. l'inverse).

Mais du coup, pourquoi `print(var)` n'affiche pas l'adresse que contient `var`, mais le booléen ?

In [None]:
var = True
print(var) #affiche True

Le référencement/déréférencement est géré automatiquement en Python.

In [None]:
var = 2
var = var + 1

La deuxième ligne cache plusieurs choses :
- l'opérateur `+` va récupérer le contenu pointé par l'adresse contenue dans `var` (et non l'adresse elle-même),
- un nouvel espace mémoire est réservé pour stocker le résultat du calcul.
- l'adresse de ce nouvel espace est écrit dans `var`.

Après l'exécution de la cellule précédente, l'adresse contenu dans `var` est une adresse vers un espace mémoire contenant l'entier $3$.

**Remarque :** On prêtera attention au deuxième point : le contenu pointé par `var` n'est **pas modifié** ! Un nouvel espace contiendra le résultat, même si cela peut vous paraître peu astucieux.

*L'équivalent en ADA :*

### b) L'identifiant d'une variable

Pour voir ce qui se passe, on peut utiliser la fonction `id` qui nous donne l'adresse contenue dans une variable (il n'y a pas de déréférencement cette fois).

In [None]:
var = 2
print(id(var)) #adresse à laquelle est stockée le 2
var = var + 1
print(id(var)) #nouvelle adresse à laquelle est stockée le 3

Lorsqu'une variable est affectée à une autre, seule l'adresse est copiée, pas le contenu.

In [None]:
a=1
print(id(a))
b=a
print(id(b))
a=2
print(id(a))
print(id(b))

On voit que `a` et `b` pointent vers une même case contenant `1`. Puis la deuxième affectation de `a` change l'adresse vers laquelle cette variable pointe, mais elle ne modifie pas le contenu de la case contenant `1`. La variable `b` continue donc de pointer vers la valeur `1`.

**Exercice :** à l'aide de la fonction `id`, comprenez comment est géré le passage d'une variable en paramètre d'une fonction. S'agit-il d'un passage par valeur (copie de la valeur) ou par référence (copie de l'adresse) ?

In [None]:
def mul(a):
    print("Id au début de la fonction mul : id(a)=", id(a))
    a = 2*a
    print("Id après l'affectation de la fonction mul : id(a)=", id(a))

def add(a):
    print("Id au début de la fonction add : id(a)=", id(a))
    a=a+0 #Python ne voit que la valeur est la même
    print("Id après la première affectation : id(a)=", id(a))
    mul(a)
    print("Valeur de a après l'appel à mul : a=",a)
    print("Id après l'appel à mul : id(a)=", id(a))
    a=a+1
    print("Id après la deuxième affectation : id(a)=", id(a))
    return a
    

a = 2023
print("Id avant l'appel à la fonction add : id(a)=", id(a))
b = add(a)
print("Id après l'appel à add : id(a)=", id(a))
print("Id après l'appel à add : id(b)=", id(b))

C'est donc un passage par référence : c'est l'adresse contenue dans `a` qui est donnée à `add` et `mul`, et non une copie du contenu.

### c) Valeurs internes

Vous avez peut-être remarqué quelque chose de suspect. Dans les deux cellules précédentes, le `2` est stocké au même endroit alors qu'on a dit qu'un nouvel espace était réservé à chaque fois. Il y a certains cas où ce n'est pas vrai :
- Certaines valeurs standards sont dits internes et ne seront écrites qu'à un seul endroit (petits entiers, booléens, petits strings sans caractères spéciaux). Si deux variables référencent une de ces valeurs, pas la peine de réserver deux espaces, la deuxième pointera là où pointe la première.
- D'autres types permettent d'éviter cela (partie 3 de ce TD).

In [None]:
a = 18
print(id(a))
a = 18
print(id(a))
print(id(18))

a = 8439439903930
print(id(a))
a = 8439439903930
print(id(a))
print(8439439903930)

**Exercice :** écrire un petit programme qui permet de calculer le plus petit entier naturel qui n'est pas déjà stocké en mémoire.

In [None]:
i=0
j=0
while(id(i)==id(j)):
    i+=1
    j+=1
print(i)

## 2) Une valeur est toujours bien accompagnée

### a) Par un gars...

Vous vous souvenez qu'en Python, le typage est dynamique. On pourrait imaginer que chaque variable stocke avec elle le type du contenu vers lequel elle pointe et que ce dernier est modifiable.

In [None]:
a=2
print(type(a)) #integer
a="ok"
print(type(a)) #string

En Python, c'est en fait le contenu lui-même qui stocke son type. Une variable ne pointe pas juste vers une valeur mais un type article contenant (au moins) une valeur et un type. On rappelle que mémoriser le type est primordial pour savoir comment lire la mémoire contenant la valeur.

### b) ... et par sa popularité

Un troisième attribut est toujours stocké avec une valeur et son type. Pour comprendre son intérêt, prenons l'exemple ci-dessous en ADA.

Si on alloue de la mémoire dynamiquement (avec `new`) sans jamais libérer celle qui n'est plus utilisée, on a ce qu'on appelle une fuite de mémoire. L'espace mémoire utilisé durant la boucle n'est plus accessible (on a perdu les adresses), mais le système d'exploitation n'a aucune raison de deviner qu'il peut le récupérer pour le redistribuer. On rajoute donc une libération de mémoire.

La bonne nouvelle, c'est qu'en Python, vous n'aurez pas à gérer la libération de la mémoire. Mais alors, comment ça marche ?

Une variable pointe vers une troisième information : un compteur de référence. Ce compteur, comme on s'en doute, permet de mémoriser combien de variables pointent directement ou indirectement (via une collection par exemple) vers le contenu associé. On peut récupérer ce compteur avec la fonction `sys.getrefcount`.

**Remarque :** la fonction `sys.getrefcount` peut renvoyer une valeur supérieure au nombre de références auxquelles on pense : <a href="https://docs.python.org/3/library/sys.html#sys.getrefcount">lien vers la doc.</a> En particulier, la fonction elle-même peut en créer.

In [None]:
#réinitialise l'espace des variables
%reset -f 

import sys #pour pouvoir utiliser getrefcount

potiron = "potiron"
print("nb ref du contenu pointé par potiron au début= ",sys.getrefcount(potiron))
legume=potiron
tarte=potiron
soupe=potiron
print("nb ref du contenu pointé par potiron au début= ",sys.getrefcount(potiron))

Le compteur de référence est incrémenté de trois après avoir affecté trois variables à son contenu.

De même, quand on affecte une variable par une autre, le nombre de référence augmente. Remarquez avec l'exemple suivant qu'une définition avec une valeur donnée explicitement peut créer un nouvel espace.

In [None]:
%reset -f 
import sys

print("nb ref du contenu 2023 = ", sys.getrefcount(2023))
a=2023
print("nb ref du contenu pointé par a au début = ",sys.getrefcount(a))
b=a
c=2023 #nouvel espace mémoire
print("nb ref du contenu pointé par a à la fin = ",sys.getrefcount(a))
print("nb ref du contenu pointé par b à la fin = ",sys.getrefcount(b))
print("nb ref du contenu pointé par c à la fin = ",sys.getrefcount(c))

Ce compteur de référence permet de libérer la mémoire intelligemment : si il tombe à $0$, c'est que rien ne l'utilise. On peut donc libérer l'espace associé. Imaginez donc un `free` automatique. Attention que des fuites de mémoire sont encore possibles...

**Résumé :**

Une variable pointe donc (au moins) vers :
- type, 
- un compteur de référence,
- une valeur.

*Ce triplet peut-être vu comme un record en ADA. On ne peut pas directement accéder aux attributs à l'instar des record privé. On ne peut accéder qu'à certains indirectement via des méthodes.*

### c) Espace utilisé

On peut voir l'espace mémoire réservé grâce à la fonction `sys.getsizeof` (l'unité est l'octet) :

In [None]:
a=3.14893303
print(sys.getsizeof(a))
print(a.__sizeof__()) #quasi équivalent

A priori, sur une machine 64-bit, les flottants sont représentés sur 24 octets :
- huit octets (64 bits) pour le type, 
- huit pour le compteur de référence,
- huit pour la valeur.

Si vous avez la curiosité de tester sur d'autres types, vous serez surpris. Par exemple, les entiers sont de taille variable : $0$ ne prend que $24$ octets, alors que $1$ en prend $28$. 

Un entier contient lui aussi un type, un compteur de référence et une valeur. Mais cette valeur étant de taille variable, il stocke aussi cette taille sur $8$ octets. Par exemple :
- Pour $0$, la taille vaut $0$ (sur $8$ octets) et il n'y a pas de valeur ($0$ octets). Avec le type et le refcount, on a bien $24$ bits.
- pour $1$, la taille vaut $4$ et la valeur est $000...001$ ($32$ bits car $4$ octets). Au total, on a bien $28$ bits.

De même, `False` et `True` ne prennent pas le même espace : `False` est vu comme $0$, `True` comme $1$.

In [None]:
print(sys.getsizeof(0))
print(sys.getsizeof(1))
print(sys.getsizeof(2**30-1))
print(sys.getsizeof(2**30))


print(sys.getsizeof(False))
print(sys.getsizeof(True))

### d) Une valeur spéciale : None

Vous retrouver en Python l'équivalent du pointeur `null` du langage ADA. C'est `None`.

In [None]:
import sys

print(id(None))
print(type(None))
print(sys.getrefcount(None))
print(sys.getsizeof(None)) #le type et le refcount

Le `None` est très pratique pour les fonctions qui doivent renvoyer un résultat particulier dans certains cas. Par exemple, si vous chercher le premier indice d'une valeur dans une liste ne la contenant pas, vous pouvez utiliser des exceptions, mais aussi renvoyer `None` :

In [None]:
def chercher(l,x):
    for i in range(len(l)):
        if l[i]==x:
            return i
    return None #l'élement x n'est pas dans la liste l

print(chercher([1,3],2))

**Remarque :** ne rien renvoyer est équivalent à renvoyer `None`. Une fonction qui ne renvoie rien dans tous les cas est l'équivalent d'une procédure en ADA.

### e) Collections : toujours plus de pointeurs

Les collections fonctionnent de façon similaire. On va regarder le cas des listes.

In [None]:
l=[1,2,3]
m=[1,2,3]
n=m
print("id(l)=",id(l))
print("id(m)=",id(m))
print("id(n)=",id(n))
print("l==m : ", l==m)
print("l is m :", l is m)
print("n==m : ", n==m)
print("n is m : ", n is m)

On voit que deux listes contenant les mêmes éléments mais définies indépendemment sont à différents endroits en mémoire. En revanche, affecter une liste avec une autre ne copie que le pointeur et non le contenu. Il faut donc être vigilant quand on modifie une liste.

In [None]:
l=[1,2,3]
m=l
l.append(4)
print(m)

Pour copier une collection, utilisez la méthode `copy` (attention, une collection peut en cacher une autre) :

In [None]:
l=[1,2,3]
m = l.copy()
l.append(4)
print(m)

Pour l'organisation du contenu pointé, c'est plus compliqué. Une liste contient (entre autre) :
- un type,
- un compteur de référence,
- une capacité : nombre de cases réservées (cf TD2),
- une taille : nombre de cases réellement utilisées,
- un pointeur vers un tableau.

Ce pointeur de tableau est important. Dans l'exemple suivant, si toute la capacité de `l` est utilisée et que pour ajouter un élément, il faut copier le contenu ailleurs, on veut que toutes les références à la liste soient toujours valides. 

In [None]:
l = [1,2,3,4]
m=l
l.append(5)
print(m) #m doit toujours pointer sur la même liste que l

L'intérêt majeur d'un tableau est de pouvoir accéder à n'importe quelle case en temps constant. Pour accéder à la $i$-ème case d'un tableau, il suffit de rajouter à l'adresse du début du tableau la taille d'une case multipliée par $i$. 

*Par exemple, si la taille d'un entier est $4$ octets, pour accéder à la $10$-ème case d'un tableau d'entiers, il suffit de prendre l'adresse du début du tableau et d'y ajouter $40$.*

Le dernier attribut (pointeur vers tableau) du type `list` décrit ci-dessus est donc un pointeur de pointeur : l'adresse de la case qui stocke l'adresse du début du tableau.

Depuis le TD2, vous savez que le type `list` stocke les éléments avec un tableau. Le problème est que les éléments peuvent être de tailles différentes. On a vu par exemple que les entiers sont de taille variable. La solution adoptée est d'avoir un tableau de pointeurs (vers les valeurs) et non de valeurs. Les pointeurs sont toujours de même taille.

**Exercice :**

1) A l'aide de la fonction `sys.getsizeof`, comment récupérer la capacité (nombre de cases disponibles) d'une variable de type `list` ?

In [None]:
def capacity(l):
    return sys.getsizeof(l)-sys.getsizeof([])

2) Et le nombre de cases réellement utilisées ?

In [None]:
def used(l):
    return len(l)

3) La capacité est-elle vraiment doublée à chaque fois qu'elle est complètement utilisée ?

In [None]:
l=[]
print(capacity(l))
for i in range(20):
    l.append(l)
    print(capacity(l))

4) Dessiner sur papier les différentes cases mémoire utilisées par les variables définies ci-dessous, et les liens de référence entre elles. Si $p_a$ est un pointeur sur $a$, on fait une flèche de $p_a$ vers $a$.

In [None]:
l=[1,True,2.4]
m=l

## 3) Mutabilité

On a déjà vu que certaines collections sont modifiables et d'autres non. Ce caractère s'appelle la mutabilité. Un type est mutable si on peut modifier le contenu d'une variable de ce type, non mutable sinon.

### a) Les types non mutables

Les types de bases que vous manipulez couramment sont tous non mutables : `int`, `float` et `bool`. En effet, on a vu qu'incrémenter un entier modifie son `id` : il est réaffecté et non modifié.

Les collections non mutables que vous avez vu pour l'instant sont les suivantes :
- `tuple`, 
- `str`.

Les intérêts de ces types sont :
- de ne pas risquer de les modifier par erreur (sécurité),
- de pouvoir les utiliser en clé d'un dictionnaire (nécessaire au bon fonctionnement des tables de hachages sous jacentes),
- d'être a priori plus léger : par exemple, les tuples n'ont pas besoin de stocker un attribut de capacité, nécessaire aux listes.

Lorsqu'un paramètre de type non mutable est donné à une fonction, il n'y aura pas d'*effet de bord* : toute modification interne à la fonction ne sera pas répercutée à l'extérieur de celle-ci.

**Questions :** La modification d'une chaîne de caractère peut demander de tout déplacer. On utilisera des caractères spéciaux pour que les chaînes ne soient pas internes (! et ? feront très bien l'affaire).

a) Etudier si ce déplacement est réellement fait en pratique, en ajoutant des caractères un à un à la fin d'une chaîne intialement vide. 

In [None]:
def ajout_string(n):
    mot = ""
    for i in range(n):
        mot = mot+"?"
        print("id=" + str(id(mot)) + " pour i=" + str(i)) 
                   
ajout_string(20)   

On remarque qu'une optimisation a lieu et que `mot` n'est réaffecté que de temps en temps. On ne modifie pas les caractères déjà présents donc c'est cohérent avec le fait qu'un `string` soit constant. On retrouve un fonctionnement similaire aux listes.

b) Et si on modifie le contenu d'une chaîne non vide ?

In [None]:
def modif_string(n):
    mot = "!"*n
    for i in range(n):
        mot = mot[:i] + '?' + mot[i+1:]
        print("id=" + str(id(mot)) + " pour i=" + str(i)) 

modif_string(20)

Cette fois, pas le choix : `mot` est réaffecté à chaque modification.

### b) Les types mutables

Les types mutables que vous avez vu pour l'instant :
- `list`, 
- `dict`.

A l'inverse, ces types sont importants lorsqu'on a besoin d'une structure dynamique. 

**Attention :** ces types introduisent des effects de bords. Une modification interne à une fonction peut avoir un impact à l'extérieur. De même, si deux variables pointent vers le même contenu mutable, modifier le contenu de l'une d'entre elles le modifie pour l'autre (on l'a vu dans la partie précédente).

In [None]:
l = [1,0,9,2,7,4,3,8,2,1]

In [None]:
def transforme(l):
    for i in range(len(l)):
        if l[i]%2==0:
            l[i]=0

In [None]:
transforme(l)
print(l)

La fonction `transforme` met tous les entiers pairs à $0$. Si on s'est trompé et qu'on voulait ne le faire que pour les nombres impairs, il faut faire attention à redéfinir la liste `l` initiale (ce qui peut être bien plus lourd parfois). Essayez de ne modifier que la définition de `transforme` et de relancer le test.

Si vous changez `if l[i]%2==0` par `if l[i]%2==1`, vous obtenez une liste remplie de $0$ : Python est un langage interprété qui conserve l'état courant des variables donc `l` n'est pas réinitialisée toute seule.

**Remarque :** on peut convertir une collection d'un type vers un autre pour profiter de son caractère mutable ou non mutable. Il suffit d'utiliser la fonction ayant pour nom le type cible (techniquement, on appelle ça un constructeur). 

Dans l'exemple suivant, on veut appliquer une permutation aléatoire à une chaîne de caractères. Pour cela, choisit deux indices aléatoire $r1$ et $r2$ et on transpose les deux caractères à ces indices. Et on itère ce procédé. Afin d'éviter de copier toute la chaîne à chaque transposition, on convertit en amont la chaîne de caractères en liste.

In [None]:
def suivant(u):
    """
    renvoie un entier pseudo aléatoire
    """
    return (227608 * u + 9204) % 59049

def suivant_couple(u):
    """
    renvoie un couple d'entiers pseudo aléatoire
    """
    return suivant(u),suivant(suivant(u)) 

def permut(mot):
    """
    applique une série de transposition entre des couples d'indices pseudo aléatoires
    """
    u2 = 3
    for i in range(10000):
        u1,u2 = suivant_couple(u2) #choix d'une paire d'indice aléatoire
        r1,r2 = u1%len(mot),u2%len(mot)
        tmp = mot[r1]
        mot[r1] = mot[r2]
        mot[r2] = tmp


mot = "Win the yes needs the no to win against the no"
mot_list = list(mot) #on convertit en amont
permut(mot_list)
resultat = "".join(mot_list) #conversion inverse, join assemble les éléments de la liste avec "" en séparateur
print(resultat)

Vous découvrez au passage comment générer facilement une suite $(u_n)_n$ pseudo aléatoire d'entiers entre $0$ et $m-1$ :
- $u_0$ fixé (la graine, à modifier pour un tirage différent),
- $u_{n+1} = (a\cdot u_n + b) \mod c$,

avec certaines bonnes propriétés pour $a,b,c$ :
- $a-1$ multiple de tout facteur premier (et $4$) de $c$, 
- $b$ et $c$ premiers entre eux.

## 4) Exercices 

**Exercice 1 :** dessiner sur papier les différentes cases utilisées par la variable `l` définie ci-dessous, et les liens de référence entre elles.

In [None]:
l = [[0,1],True,([False,[True,2],3],False,2),False]

**Exercice 2 :** on veut implémenter une liste chaînée avec les outils qu'on a pour l'instant. On rappelle qu'une liste chaînée permet d'accéder à l'élément du début et à la sous liste privée du premier élément.

1) Vaut-il mieux utiliser des couples ou des listes à deux éléments ? `(element,suivant)` ou `[element,suivant]`

L'intérêt d'une liste chaînée est de pouvoir la modifier efficacement. Une insertion/suppression au milieu d'un tableau demande de décaler tous les éléments suivants, tandis que ces modifications dans une liste chaînée sont en temps constant (en se donnant au prélable un accès aux cases concernées). On va donc opter pour le type `list` puisqu'il est mutable : il suffit de modifier les cases voulues. Alors qu'avec des couples, il faudrait réaffecter tous les couples précédents.

2) Implémenter une fonction d'insertion à la fin d'une liste chaînée.

In [None]:
def insert_list(l,x):
    if l == []:
        l.append(x)
        l.append([])
    else:
        insert_list(l[1],x)
    
l = [] #liste vide plutôt que None car ce dernier n'est pas mutable
for i in range(10):
    insert_list(l,i)
print(l)

**Exercice 3 :** graphes d'intervalles.

On doit affecter des salles à un ensemble de cours. Chaque cours se déroule sur un intervalle de temps, fixé à l'avance. Lorsqu'on parlera de cours, on sous entendra l'intervalle correspondant. On ne manipulera que des intervalles ouverts, i.e. bornes exclues.

i) Comment représenter en mémoire un cours ?

On va utiliser des couples car les intervalles sont fixés.

ii) On dit que deux cours sont en conflits si il existe un même instant $t$ pendant lequel les deux cours se déroulent. Traduire mathématiquement cette propriété, puis implémenter une fonction `conflit` qui :
- prend en paramètre deux cours, 
- renvoie si ils sont en conflits ou non .

Deux cours sont en conflit si et seulement si leur intersection est non vide. Soit $I_1=]a_1,b_1[$ et $I_2=]a_2,b_2[$ deux intervalles. $I_1$ et $I_2$ sont en conflit si et seulement si $I_1\cap I_2\neq \emptyset$ ou encore $(a_1 < b_2 \text{ et } a_2 < b_1)$.

In [None]:
def conflit(c1,c2):
    return c1[0]<c2[1] and c2[0]<c1[1]

In [None]:
assert(not conflit((1,2),(3,4)))
assert(not conflit((3,4),(1,2)))
assert(conflit((1,3),(2,4)))
assert(conflit((1,4),(2,3)))

iii) On se donne une liste `cours` de cours. On veut créer une structure associant à chaque cours l'ensemble des cours en conflits avec lui. C'est ce qu'on appelle un graphe d'intervalles. Quelle structure utiliser ? Implémenter une fonction `graphe_intervalle` qui prend en entrée une liste de cours et renvoie le graphe d'intervalles associé. **On supposera dans toute la suite qu'il n'y a pas de doublon, i.e. pas deux cours avec exactement le même intervalle.**

On peut utiliser une liste de listes de cours : la case d'indice $i$ contient la liste des cours en conflit avec le $i$-ème cours de `cours`. Sinon, vu qu'il n'y a pas de doublon, on peut tout simplement utiliser un dictionnaire pour ne pas réfléchir aux indices. L'intérêt d'avoir choisi des couples pour représenter les cours en est renforcé (impossible d'utiliser des listes en clé de dictionnaire).

In [None]:
def tous_conflits(c1,cours):
    l = []
    for c2 in cours:
        if c1!=c2 and conflit(c1,c2):
            l.append(c2)
    return l

def graphe_intervalles(cours):
    d = dict()
    for c1 in cours:
        d[c1] = tous_conflits(c1,cours)
    return d

In [None]:
cours = [(0,2),(1,4),(3,5),(7,8),(1,5),(2,3),(2,6),(1,7),(4,5)]
d_test={
    (0, 2): [(1, 4), (1, 5), (1, 7)], 
    (1, 4): [(0, 2), (3, 5), (1, 5), (2, 3), (2, 6), (1, 7)], 
    (3, 5): [(1, 4), (1, 5), (2, 6), (1, 7), (4, 5)], 
    (7, 8): [], 
    (1, 5): [(0, 2), (1, 4), (3, 5), (2, 3), (2, 6), (1, 7), (4, 5)], 
    (2, 3): [(1, 4), (1, 5), (2, 6), (1, 7)], 
    (2, 6): [(1, 4), (3, 5), (1, 5), (2, 3), (1, 7), (4, 5)], 
    (1, 7): [(0, 2), (1, 4), (3, 5), (1, 5), (2, 3), (2, 6), (4, 5)], 
    (4, 5): [(3, 5), (1, 5), (2, 6), (1, 7)]}
assert(graphe_intervalles(cours)==d_test)

iv) Pour les intervalles $I_1=]1,3[,\ I_2=]2,5[$ et $I_3=]2,4[$, dessiner sur papier les cases mémoires utilisées par le graphe d'intervalles, et leur liens.

v) Les salles sont des chaînes de caractères : "SS12", "GEI024", "GM116", ... Ecrire une fonction `min_dispo` qui :
- prend en entrée une liste `salles` des salles existantes et une liste `utilise` de salles utilisées,
- renvoie la salle d'indice minimal (dans `salles`) qui n'est pas dans `utilise`. 

Quelle optimisation peut-on facilement faire sur `utilise` ?

In [None]:
def min_dispo(salles,utilise):
    for s in salles:
        if s not in utilise:
            return s
    return None #pas de salle dispo, exception, None ou exit

In [None]:
salles = ["SS12","SS13","SS14","GEI024","GM116","GM118","101","102","103","104"]
utilise = ["SS14","GM116","SS12","102"]
assert(min_dispo(salles,utilise)=="SS13")

Si les salles sont triées, pas besoin d'utiliser `not in` qui a une complexité linéaire. Il suffit de parcourir les deux listes en parallèle et dès qu'elles diffèrent, l'élément courant de `salles` est une salle disponible.

vi) On va progressivement associer une salle à chaque cours. Quelle structure utiliser pour stocker ces association ? Il faut prendre en compte le fait qu'au début, un cours n'a pas de salle.

Cette fois-ci, il est important de pouvoir modifier la structure : un cours n'aura pas de salle au début. On peut utiliser une liste : `[cours,salle]` et mettre `None` initialement. Ou utiliser un dictionnaire avec les cours en clé et les salles en valeurs.

In [None]:
def asso_init(cours):
    association = dict()
    for i in cours:
        association[i] = None #on peut aussi laisser le dict vide au début
    return association

vii) On considére les cours dans l'ordre de leur heure de début (et de fin si égalité). Comment s'appelle cet ordre ? *(non ce n'est pas l'ordre alphabétique)*. L'ordre initial des intervalles est quelconque. Faire en sorte qu'on puisse parcourir les intervalles dans l'ordre voulu.

L'ordre alphabétique est un ordre sur les caractères. L'ordre du dictionnaire sur les mots est l'ordre lexicographique : on trie par ordre alphabétique sur le premier caractère, et si égalité sur le deuxième, etc...

In [None]:
print(sorted(cours)) #tri par ordre lexicographique naturellement
#cours.sort() #tri en place, pas de copie

viii) Ecrire une fonction `indispo` qui :
- prend en entrée un ensemble de cours et une structure qui associe à chaque cours une salle (question vi),
- renvoie l'ensemble des salles utilisées par ces cours.

In [None]:
def indispo(cours,association):
    salles_utilisees = []
    for c in cours:
        if association[c] != None :
            salles_utilisees.append(association[c])
    return salles_utilisees

In [None]:
cours_test = [(1, 4), (1, 5), (1, 7)]
asso_test = {(1, 4) : "SS12", (1, 5) : None, (1, 7) : "GM116"}
assert(indispo(cours_test,asso_test)==["SS12","GM116"])

ix) Ecrire une fonction `affectation` qui :
- prend en entrée une liste de cours et une liste de salles,
- renvoie une affectation de salle pour chaque cours. 

Les cours sont parcourus dans l'ordre de la question vii). Pour chaque cours, on lui affecte la salle d'indice minimale qui n'est pas utilisée par les cours en conflits avec lui.

In [None]:
def affectation(cours,salles):
    cours_tries = sorted(cours)
    g_i = graphe_intervalles(cours)
    asso = asso_init(cours)
    for c in cours_tries:
        salles_indispo = indispo(g_i[c],asso)
        asso[c] = min_dispo(salles, salles_indispo)
    return asso
        

In [None]:
print(affectation(cours,salles))

x) Quelle est la complexité de l'algorithme utilisé ?

Soit $n$ le nombre de cours et $m$ le nombre de salles. Il faut trier les cours dans l'ordre lexicographique : $\Theta(n \log n)$ pour les algorithmes les plus performants, $O(n^2)$ pour ceux que vous avez déjà vus. Et ensuite, pour chaque cours, il faut :
- trouver les salles utilisées par les cours en conflits : $O(n)$ si on génère le graphe d'intervalles avec des listes de conflits dans l'ordre (pas besoin de trier à nouveau si la liste des cours l'est déjà)
- trouver la salle d'indice minimale disponible : $O(n)$ car au plus $n$ salles sont utilisées en même temps.

On a donc au total : $O(n^2)$

xi) Le nombre de salle utilisé est-il le minimum ?

Oui cet algorithme est optimal. Idée : quand on affecte une salle à un cours c, tous les cours déjà affectés et étant en conflit avec c le sont entre eux aussi.