# Conteneurs et boucles

***Basile Marchand (Centre des Matériaux - Mines ParisTech/CNRS/Université PSL)***

## Les conteneurs --- car une variable c'est bien mais un gros paquet c'est mieux 

### En pratique - une variable contenant d'autres variables

Nous avons vu précédemment que l'on peut facilement avec Python définir des variables de type nombre, booléen ou encore chaine de caractères. C'est bien mais cependant c'est loin d'être suffisant pour pouvoir automatiser les tâches ou faire du calcul numérique. C'est pour cela que nous allons maintenant voir les conteneurs. Comme son nom l'indique un conteneur va être une variable dans laquelle nous allons ranger un ensemble de variables. Par exemple pour ranger l'ensemble des notes que vous aurez pour le projet du cours il me faudra une liste. 

Nous allons voir qu'il n'existe pas qu'un seul type de conteneur en Python mais plusieurs, dans le Python que je qualifierai de base ils sont aux nombre de quatre : 
* Les tuples
* Les listes
* Les dictionnaires
* Les ensembles

Dans le cadre de ce cours nous ne nous intéresserons qu'aux trois premiers, le derniers n'ayant que peu d'intérêt pour nos applications. Bien évidemment si plusieurs conteneurs existes, c'est parce que chacun à ses particularités et ses limites que l'on va présenter. 

### Les tuples 

Il s'agit du premier conteneur Python et surement le plus utilisé. Vous vous en êtes d'ailleurs déjà servi sans vous en rendre compte. En francais on pourrait traduire la notion de tuple à celle de n-uplet. Il s'agit donc d'un ensemble de valeurs (homogène ou non), c'est-à-dire qu'un tuple peut stocker des objets de types différents. 

La syntaxe pour définir un tuple est la suivante : 

```python
nom_du_tuple = (valeur1, valeur2, ..., valeurN)
```

Pour accéder à la valeur d'un tuple il suffit d'utiliser l'opérateur **[]** avec entre crochet l'indice de l'élément auquel on souhaite accéder.

> **Attention :**
> Dans tous les conteneurs Python les indices commencent à **zéro** ! C'est à dire que pour accéder un premier élément d'un tuple il faut demander l'élément d'indice 0.


Par exemple : 

In [1]:
un_tuple = (10, "une_string", 1.e-5, False)
print(un_tuple[0])
print(un_tuple[1])
print(un_tuple[2])
print(un_tuple[3])

10
une_string
1e-05
False


On peut également extraire des sous-tuples en spécificant entre crochet **i:j:s** où : 
* **i** est l'indice du premier élément que l'on souhaite récupérer
* **j** est l'indice du dernier élément que l'on veut récupérer __+1__
* **s** est le pas entre chaque éléments que l'on extrait

Si vous ne précisez pas **i** par défaut Python prend i=0, si vous ne précisez pas j il prend j=taille du tuple et si vous ne précisez pas __s__ il prend __s=1__

In [2]:
print(un_tuple)
print(un_tuple[1:3])
print(un_tuple[:3])
print(un_tuple[2:])
print(un_tuple[::2])

(10, 'une_string', 1e-05, False)
('une_string', 1e-05)
(10, 'une_string', 1e-05)
(1e-05, False)
(10, 1e-05)


Enfin si vous souhaitez connaitre la taille d'un tuple il suffit d'utiliser la commande **len** 

In [3]:
print(un_tuple)
print(len(un_tuple))

(10, 'une_string', 1e-05, False)
4


*Remarque* : nous n'avons pas vu dans cette partie comment modifier une valeur dans un tuple et c'est normal car ce n'est pas possible. 
L'une des particularités des tuples est qu'il s'agit de variables immutables, c'est-à-dire qu'une fois définit il n'est plus possible de le modifier. L'intérêt majeur que cela peut avoir est si vous souhaitez vous assurez que des valeurs seront constantes tout au long de l'exécution de votre code. 

Pour avoir des variables semblablent aux tuples mais pouvant être modifiés il faut utiliser des listes. 

### Les listes

Les listes sont le second conteneur utilisable de base dans Python. Il s'agit comme pour les tuples d'un ensemble de valeurs (homogènes ou non) qui pourront par la suite être modifiées. La définition d'une liste en Python se fait de manière très similaire à la construction d'un tuple si ce n'est que l'on remplace les parenthèses par des crochets.

```python
nom_de_la_liste = [valeur1, valeur2, ..., valeurN]
```
L'accès à la valeur d'une liste se fait de la même manière que pour les tuples, c'est-à-dire à l'aide des opérateurs **[]**. Et de même, on peut extraire une sous-liste à l'aide de la notation **i:j:s**. 


In [4]:
une_liste = [10, "une_string", 1.e-05, False]
print(type(une_liste))

<class 'list'>


In [5]:
print(une_liste[0])
print(une_liste[2])
print(une_liste[2:])
print(une_liste[::2])

10
1e-05
[1e-05, False]
[10, 1e-05]


Pour connaitre la taille d'une liste il suffit d'utiliser la même commande que pour les tuples, à savoir **len**

In [6]:
print(len(une_liste))

4


Parmis les autres actions réalisables sur les listes et pouvant faciliter la vie, il y a l'utilisation du mot clé **in** qui permet de tester si un élément est dans la liste ou non 

In [7]:
print( 3 in une_liste )
print( "une_string" in une_liste )

False
True


Pour accéder à l'indice d'un élément dans une liste il suffit d'utiliser la commande **index**

In [8]:
une_liste.index("une_string")

1

On peut également concaténer des listes à l'aide de l'opérateur **+**. Il faut bien se souvenir que la somme de deux listes ne retourne pas la somme terme à terme des deux listes mais la concaténation.

In [9]:
liste_a = [1,2,3]
liste_b = [4,5,6]
print( liste_a + liste_b )

[1, 2, 3, 4, 5, 6]


Pour finir nous allons voir comment modifier les valeurs au sein d'une liste. Pour cela on utilise enore une fois l'opérateur **[]** mais on le fait suivre d'une opération d'affectation, c'est-à-dire qu'il est suivi d'un __=__ une valeur. On peut également modifier des sous-listes en utilisant la notation **i:j:s**.

In [10]:
print(une_liste)

[10, 'une_string', 1e-05, False]


In [11]:
une_liste[0] = -1
print(une_liste)

[-1, 'une_string', 1e-05, False]


In [12]:
une_liste[3] = [0,1]
print(une_liste)

[-1, 'une_string', 1e-05, [0, 1]]


In [13]:
une_liste[:2] = [0,1]
print(une_liste)

[0, 1, 1e-05, [0, 1]]


Cependant vous avez peut-être constaté que pour le moment nous n'avons fait que changer les valeurs dans la liste sans changer sa taille. Pour ajouter des éléments dans une liste en l'agrandissant il faut utiliser les fonctions :
* append qui ajoute un élément à la fin de la liste 
* insert qui ajoute un élément à une position donnée

In [14]:
print(une_liste)

[0, 1, 1e-05, [0, 1]]


In [15]:
une_liste.append( 10000 )
print(une_liste)

[0, 1, 1e-05, [0, 1], 10000]


In [16]:
help(une_liste.insert)
une_liste.insert(2, "new_item")
print(une_liste)

Help on built-in function insert:

insert(...) method of builtins.list instance
    L.insert(index, object) -- insert object before index

[0, 1, 'new_item', 1e-05, [0, 1], 10000]


Et si l'on veut supprimer des éléments d'une liste on peut utiliser la commande **remove** ou alors le mot clé **del** pour delete.

In [17]:
une_liste.remove(1.e-5)
print(une_liste)
 

[0, 1, 'new_item', [0, 1], 10000]


In [18]:
del une_liste[1]
print(une_liste)

[0, 'new_item', [0, 1], 10000]


**Attention :**
Il faut faire très attention avec les listes à une chose, lorsque que vous copiez une liste si vous ne le faites pas de la bonne manière vous n'aurez pas le comportement attendu et vous allez potentiellement mettre très longtemps à trouver la source du problème. Ce "problème" est lié au fait qu'en Python tout se fait par passage par référence, nous verons plus loin dans le cours ce que cela veut dire. 

Illustration : 

In [1]:
liste_a = [1,2,3,4,5]
liste_b = liste_a      ### On pense faire une copie de liste_a dans liste_b 
liste_b[0] = 10
print(liste_b)
print(liste_a)

[10, 2, 3, 4, 5]
[10, 2, 3, 4, 5]


On constate alors que la modification que l'on a fait dans liste_b se répercute aussi sur liste_a. Et cela est tout à fait normal, car si l'on regarde les adresses mémoire de chacunes des variables liste_a et liste_b nous allons qu'elles sont identiques. 

In [20]:
print(hex(id(liste_a)))
print(hex(id(liste_b)))

0x7fa214d15588
0x7fa214d15588


Pourquoi ce comportement étrange ? Car pour Python lorsque vous écrivez 

```python
liste_b = liste_a
```

Il comprend, créé moi une variable nommée liste_b pointant vers la même zone mémoire que liste_a et donc quand vous utilisez la variable liste_b vous accédez en réalité au même case mémoire que liste_a. 

Si vous ne souhaitez pas ce comportement, il faut être un peu plus explicite et procéder de la manière suivante : 


In [21]:
liste_a = [1,2,3,4,5]
liste_b = liste_a.copy()
## ou bien 
liste_b = liste_a[:]
liste_b[0] = 10
print(liste_b)
print(liste_a)

[10, 2, 3, 4, 5]
[1, 2, 3, 4, 5]


### Les dictionnaires

Nous allons à présent voir le dernier conteneur nativement disponible dans Python que l'on étudie dans le cadre de ce cours, à savoir les dictionnaires. 

Les dictionnaires sont des conteneurs assez différents dans listes et des tuples dans le sens où il ne sont pas ordonnés et il n'y pas pas la notion d'indice. L'accès aux éléments se fait à l'aide d'une clé. En effet les dictionnaire Python repose sur des doublets (clé, valeur). Chaque clé d'un dictionnaire doit nécessairement être unique et de type **int** ou **string**. La syntaxe pour définir un dictionnaire est la suivante : 

```python
un_dictionnaire = {cle1: valeur, cle2:valeur, ...}
```
L'accès aux valeurs d'un dictionnaire se fait en utilisant l'opérateur **[]** auquel on fournit la clé de l'élément que l'on souhaite récupérer.

In [22]:
un_dict = {"cle1": 1, "cle2": 2, 1035: False}
print(un_dict)
print(un_dict["cle1"])
print(un_dict[1035])

{'cle1': 1, 'cle2': 2, 1035: False}
1
False


L'intérêt des dictionnaires est multiple et ses applications sont nombreuses. La modification d'un élément du dictionnaire se fait tout simplement en faisant l'élément considéré d'une opération d'affectation avec la nouvelle valeur. 

In [23]:
print(un_dict)
un_dict["cle1"] = 18
print(un_dict)

{'cle1': 1, 'cle2': 2, 1035: False}
{'cle1': 18, 'cle2': 2, 1035: False}


Si vous souhaitez ajouter de nouvelles entrées dans un dictionnaire la chose est très simple. Il suffit de procéder commer pour la modification d'une valeur puisque si la clé que l'on donne n'existe pas elle est automatiquement créée.

In [24]:
print(un_dict)
un_dict["new_key"] = "new_val"
print(un_dict)

{'cle1': 18, 'cle2': 2, 1035: False}
{'cle1': 18, 'cle2': 2, 1035: False, 'new_key': 'new_val'}


Enfin pour se faciliter la vie avec les dictionnaires il y a quelques astuces à connaitres. Par exemple pour récupérer la liste des clés dans le dictionnaire 

In [25]:
print( un_dict.keys() )

dict_keys(['cle1', 'cle2', 1035, 'new_key'])


Pour récupérer l'ensemble des valeurs stockées dans le dictionnaire : 

In [26]:
print(un_dict.values())

dict_values([18, 2, False, 'new_val'])


Et enfin pour récupérer l'ensemble des doublets clé, valeur dans une liste : 

In [27]:
print(un_dict.items())

dict_items([('cle1', 18), ('cle2', 2), (1035, False), ('new_key', 'new_val')])


L'utilisation de ces méthodes peut s'accompagner du mot clé **in** par exemple : 

In [28]:
if "new_key" in un_dict.keys():
    print( un_dict["new_key"] )

new_val


### Pas plus ? Pas de matrices-vecteurs à la Matlab ?

Nous venons donc de faire le tour des principaux containers disponibles nativement dans Python. La question que vous devez certainement vous poser est comment je fais pour faire de la simulation avec Python donc gérer des matrices, vecteurs, ... En effet en Python natif il n'y a pas de notion de vecteurs ou de matrices comme dans Matlab qui ne gère que ça. 

Mais cependant pas d'affolement, car des gens ont fait le travail. Nous verrons un peu plus tard que Python dispose d'un certain nombre de module additionels et que parmis ces module il y a Numpy qui définit la notion de vecteur et matrice. 




## Les boucles --- ou comment tirer parti de la stupidité de l'ordinateur

### Dans quel intérêt ?

Une grosse partie des programmes informatiques nécessite le traitement répétitif de données, généralement stockées dans des listes ou des tableaux. Pour effectuer ces traitements il est donc nécessaire d'avoir des commandes de répétitions à disposition. Comme l'intégralité des langages de programmation (à ma connaissance) Python dispose de deux types de commandes pour répéter un ensemble d'instruction : 
* La boucle **for** qui permet de répéter N fois une série d'instruction.
* La boucle **while** qui permet de répéter une série d'instruction tant qu'une certaine condition est vraie. 


### Boucles *for*

La boucle, dite boucle *for*, permet de répéter une opération **N** fois avec N un entier connu avant l'entrée dans la boucle. Il s'agit donc d'une boucle adaptée lorsque l'on sait à l'avance le nombre de fois que l'on doit répéter le bloc d'instruction. 

La syntaxe Python de la boucle for est la suivante : 

```python
for i in un_iterable:
    instruction_1
    instruction_2
```

**Remarque :** on retrouve dans la syntaxe de la boucle for quelque chose de similaire à celle du *if* à savoir une première ligne se terminant avec le caractère **:** et ensuite un bloc d'instruction indenté. 

Vous pouvez remarquer que la première ligne fait intervenir ce que j'appelle un **itérable**. Il s'agit d'objets Python sur lesquels on peut itérer. Vous n'êtes pas plus avancé je sais. En pratique il s'agit d'objet particulier qui permettent de parcourir tous les éléments contenus automatiquement à l'aide d'une boucle *for* entre autres. Dans le cadre de ce cours je ne rentrerai pas dans le détail au sujet des itérateurs, je vais juste vous donner une liste des itérables que vous pouvez manipuler. 

Le premier itérable, le plus simple c'est une liste. On peut facilement parcourir les éléments d'une liste à l'aide de la boucle *for*. En effet nous pouvons écrire le code suivant : 

In [2]:
ma_liste = [1,2,3,4,5]

for x in ma_liste:
    print(x)

1
2
3
4
5


La même chose est possible avec un tuple évidemment. 

In [30]:
mon_tuple = (1,2,3,4,5)
for x in mon_tuple:
    print(x)

1
2
3
4
5


Parfois nous n'avons pas besoin d'écrire une boucle pour parcourir les éléments d'une liste mais juste pour répéter N fois une opération donnée, avec N un entier positif. Dans ce cas il faut utiliser la commande **range** qui va vous générer un itérable. La syntaxe de la commande range est la suivante : 
```python
range(A,B,S)
```

où les paramètres sont : 
* A : (int) la valeur de départ de l'itérable, par défaut A=0
* B : (int) la valeur finale de l'itérable __+1__, pas de valeur par défaut
* S : (int) le pas entre deux itérés, par défaut S=1

Par exemple : 

In [31]:
for i in range(0,5):  ## S=1 implicitement
    print(i)

0
1
2
3
4


In [32]:
for i in range(3):  ## A=0, S=1 implicitement
    print(i)

0
1
2


In [33]:
for i in range(0,10,2):
    print(i)

0
2
4
6
8


Vous pourriez alors me dire pourquoi ne pas utiliser range(len(ma_liste)) pour parcourir une liste ? Oui en effet ça fonctionne comme vous pouvez le voir ci-dessous : 

In [4]:
for i in range(len(ma_liste)):
    print(ma_liste[i])
    
    
for x in ma_liste:
    print(x)

1
2
3
4
5
1
2
3
4
5


Mais cette syntaxe n'est pas du tout recommandée, elle est même à proscrire pour plusieurs raisons.
* C'est lourd et moche
* Ce n'est pas optimisé. C'est-à-dire que si len(ma_liste)>> 1 votre code va être lent. 

Si vous faites cela pour accéder à la fois à la valeur de votre itérable et son index sachez que Python à tout fait pour vous. Il existe en effet la commande **enumerate** dont la syntaxe est la suivante : 

```python
for i,x in enumerate(un_iterable):
    instruction
```
Dans la pratique cela permet d'écrire : 

In [35]:
for i,x in enumerate(ma_liste):
    print("ma_liste[{}] = {}".format(i,x))

ma_liste[0] = 1
ma_liste[1] = 2
ma_liste[2] = 3
ma_liste[3] = 4
ma_liste[4] = 5


Et enfin si vous souhaitez parcourir plusieurs listes de même tailles simultanément là aussi il y a une astuce, la commande **zip** dont la syntaxe est la suivante : 

```python
for x,y,z in zip(list_x, list_y, list_z):
    instruction
```

In [5]:
list_x = [0,1,2,3,4]
list_y = [10,11,12,13,14]
list_z = [20,21,22,23,24]

for x,y,z in zip(list_x, list_y, list_z):
    print("x={}, y={}, z={}".format(x, y, z))

x=0, y=10, z=20
x=1, y=11, z=21
x=2, y=12, z=22
x=3, y=13, z=23
x=4, y=14, z=24


Bien entendu il est tout à fait possible de combiner les commandes **zip** et **enumerate**. Cependant attention à la syntaxe (placement des parenthèses à gauche du **in**).

In [37]:
for i,(x,y,z) in enumerate(zip(list_x, list_y, list_z)):
    print("{} => x={}, y={}, z={}".format(i, x, y, z))

0 => x=0, y=10, z=20
1 => x=1, y=11, z=21
2 => x=2, y=12, z=22
3 => x=3, y=13, z=23
4 => x=4, y=14, z=24


### Les mots clés *break* et *continue*

Dans le langage Python il existe deux mots clés particuliers destinés à modifier le comportement d'une boucle *for* (ou *while* comme nous le verrons par la suite) il s'agit de : 
* __break__ : qui permet d'interrompre une boucle prématurément
* __continue__ : qui permet de passer à l'itérer suivant sans exécuter le code qui suit le continue

Concrètement le comportement de ces deux mots clé est le suivant : 

In [6]:
ma_liste = [1,2,3,4,5]

for x in ma_liste:
    if x == 3:
        break
    print("x = {}".format(x))

x = 1
x = 2


In [39]:
for x in ma_liste:
    if x == 3:
        continue
    print("x = {}".format(x))

x = 1
x = 2
x = 4
x = 5


### Une utilisation un peu particulière du *for* --- Les "comprehension lists"

La mot clé **for** peut également servir sous une forme légèrement différente à construire ce que l'on appelle des "comprehension list". L'idée est de définir est remplir une list en une seule ligne de commande. L'intérêt est bien entendu d'avoir un code plus conçis mais également d'avoir une syntaxe qui soit plus proche de celle utilisée en mathématique. 

La syntaxe Python pour définir une comprehension list est la suivante : 

```python
nom_de_ma_liste = [ expression(x) for x in iterable if condition(x) ]
```

Le test avec le `if condition(x)` est optionel. 

Par exemple imaginons que je veuille construire la liste définie par : 
$$ S = \left\lbrace x \in [0,10[ \;\; \backslash \;\; x^2 \;\; \right\rbrace $$
avec une comprehension list cela se traduit par le code suivant : 

In [40]:
la_liste = [ x**2 for x in range(10) ]
print(la_liste)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Et si l'on veut maintenant ajouter une condition, par exemple pour construire : 
$$ S = \left\lbrace x \in [0,10[ \;\; \backslash \;\; x^2 < 30 \;\; \right\rbrace $$
Il suffit d'écrire cela sous la forme suivante : 

In [41]:
la_liste = [ x**2 for x in range(10) if x**2 < 30 ]
print(la_liste) 

[0, 1, 4, 9, 16, 25]


### La boucle *while*

La boucle dite boucle *while* permet en informatique de répéter une série d'instruction tant qu'une certaine condition (spécifier par le développeur lors de l'écriture de la boucle) est vérifiée. De ce fait la boucle *while* est adaptée lorsque l'on ne sait pas à l'avance le nombre de fois que l'on va devoir répéter le bloc d'instruction. Un exemple typique sont les méthodes de résolution des problèmes de minimisation où la boucle de convergence ne doit s'arréter qu'une fois la solution trouvée. 

La syntaxe Python de la boucle while est la suivante :    
```python 
while condition:
    instruction_1
    instruction_2
```

La condition doit nécessairement être un booléen qui va dépendre de ce qui est effectué par les instructions. Tant que cette condition est vraie alors les instructions sont répétées et lorsque la condition devient fausse la boucle s'arrète. 

Par exemple : 

In [7]:
x = 1.1
n_iter = 0
while x<10:
    x = x**2
    n_iter +=1
    
print("Il y a eu {} ( => x={}) execution du bloc avant que la condition ne deviennent fausse".format(n_iter, x))
    


Il y a eu 5 ( => x=21.1137767453526) execution du bloc avant que la condition ne deviennent fausse


Bien entendu la condition d'arrêt de la boucle *while* peut-être aussi complex que nécessaire et faire appel à de fonctions Python. Par exemple

In [8]:
ma_liste = [100,]
i = 0
while len(ma_liste)<100 and ma_liste[i]>0.001:
    ma_liste.append( ma_liste[i] / (i+1) )
    i += 1
    
print("La boucle s'est arrétée pour i={0} avec ma_liste[{0}]={1}".format(i, ma_liste[i]))
print( "La liste vaut {}".format(ma_liste))

La boucle s'est arrétée pour i=9 avec ma_liste[9]=0.00027557319223985895
La liste vaut [100, 100.0, 50.0, 16.666666666666668, 4.166666666666667, 0.8333333333333334, 0.1388888888888889, 0.019841269841269844, 0.0024801587301587305, 0.00027557319223985895]


De la même manière que pour les listes, on peut utiliser le mot clé *break* dans une boucle *while* pour en stopper l'exécution prématurément. 

In [1]:
ma_liste = [100,]
i = 0
while len(ma_liste)<100 and ma_liste[i]>0.001:
    ma_liste.append( ma_liste[i] / (i+1) )
    i += 1
    if i>5: break
    
print("La boucle s'est arrétée pour i={0} avec ma_liste[{0}]={1}".format(i, ma_liste[i]))
print( "La liste vaut {}".format(ma_liste))

La boucle s'est arrétée pour i=6 avec ma_liste[6]=0.1388888888888889
La liste vaut [100, 100.0, 50.0, 16.666666666666668, 4.166666666666667, 0.8333333333333334, 0.1388888888888889]
