# <center> Chapitre 2 : Listes en python </center>

Le type `list` permet d'implémenter les tableaux (de manière dynamique) en python.

## Qu'est-ce qu'un tableau ?

D'un point de vue algorithmique, un tableau est une structure de données qui permet de stocker une **suite ordonnée** de valeurs `x0,x1,…,xi…,xn−1` :
* chaque valeur est repérée par son indice `i` (commençant à 0); 
* l'accès à une case à partir de son indice `i` se fait en **temps constant**, c'est-à-dire que ce temps ne dépend pas de `i`, ni de la longueur `n` du tableau :
  il est donc aussi rapide d'accéder à la première valeur qu'à la 200ème (par exemple). 
  
Ceci est possible car dans un tableau :
* toutes les cases ont la même taille et occupent donc le même espace mémoire ;
* les valeurs sont stockées dans des ***cases contiguës*** de la mémoire de l'ordinateur (appelée RAM : Random Acess Memory) du système informatique.

<center><img src="./img/tableau.png" /></center>

### Quelles sont les actions possibles pour les tableaux ?

* Les seules actions possibles sur un tableau sont :

 * Créer un tableau d'une taille donnée `n` en donnant aux éléments une valeur par défaut.

 * Lire une valeur à partir de son indice `i`.

 * Écrire une valeur à partir de son indice `i`.


* La création d'un tableau nécessite **un coût en temps qui est proportionnel à la taille `n`** : 
 
 * Il faut bien écrire les `n` valeurs dans les cases. 
 
 * L'intérêt majeur des tableaux est que la lecture et l'écriture d'un élément est très rapide et se fait en temps constant.

###  Opérations sur les tableaux

####  Recopie d'un tableau

La recopie d'un tableau dans un autre tableau nécessite de recopier chaque élément du tableau source vers le tableau cible, ce qui engendre un coût en temps.


#### Ajout d'une case à un tableau

Par définition, la taille d'un tableau est fixe et est déterminée lors de sa déclaration.

Ajouter une case à un tableau nécessite plusieurs actions :
* déclarer un autre tableau avec une taille supérieure au précédent ;
* recopier les éléments du tableau source vers le tableau cible ;
* ajouter l'élément dans la dernière case du nouveau tableau.

Toute ces actions nécéssitent du temps et représentent donc un coût temporel.


#### Insérer un élément dans un tableau

Insérer un élément dans un tableau nécessite plusieurs actions :
* décaler des éléments du tableau pour ménager une place pour l'élément à insérer ;
* insérer l'élément dans le tableau.

Comme précédemment, ces actions représentent aussi un coût temporel.

#### Autres opérations sur les tableaux

Il existe une multitude d'autres traitements sur les tableaux :
* recherche d'un élément ;
* recherche d'un maximum, minimum, par exemple ;
* tri d'un tableau ;
* ...

Tout ces traitements coûtent en temps de traitement. Plusieurs algorithmes peuvent réaliser un même traitement. L'algorithme qui sera le plus "performant" sera celui qui s'exécutera en consommant le moins de temps.

##  Le type `list` rajoute en plus un côté "dynamique" aux tableaux

Python utilise le type `list`pour implémenter les tableaux ; cependant il permet, en plus, au tableau d'adapter ***dynamiquement*** leur taille en fonction des insertions d'éléments. Cependant, il est important de comprendre que ces mécanismes bien qu'automatiques représentent un coût temporel.

### Récapitulatif des opérations permises par le type `list`

|**Opération**|**Syntaxe**|**Complexité**|
|--|--|--|
|Création d'une liste vide| `[]` | 	O(1)|
|Lecture d'un élément| `x = L[i]` |	O(1)|
|Ecriture d'un élément| `L[i] = x`| 	O(1)|
|Ajout d'un élément à la fin | `L.append(x)` |	O(n)|
|Insertion d'un élément | `L.insert(indice,x)` |	O(n)|
|Copie d'une liste|	`L2 = L1.copy()`|	 O(n)|
|Test d'appartenance|	`x in L`|	 O(n)|
 
 
* Exemple d'insertion d'un élément à la fin de la liste :

In [3]:
t = [10,5,40]
t.append(60)
print(t)

[10, 5, 40, 60]


***Commentaires :***

* Il existe au moins deux façons de créer une liste L :
 * Créer une liste vide et ajouter les éléments un à un en utilisant `L.append` à l'intérieur d'une boucle ;
 * Créer une liste vide et ajouter les éléments un à un en utilisant `L.insert` à l'intérieur d'une boucle.

Chacune de ces méthodes engendrera un coup temporel qui lui est propre. Il sera alors nécessaire de choisir celle qui consommera le moins temps dans une situation donnée ; par exemple une longueur de tableau donnée (représentant souvent le "pire des cas").

* Sur ce thème : **Exercice 1, TD2**

## Mécanismes du type `list` et perfomances :

Le type `list` est __built-in__ c'est à dire qu'il est emabarqué dans le langage Python sans utilisation de module externe. L'appel des fonctions, énumérées plus haut, engage des mécanismes qu'il est important de comprendre, notamment en terme de performance.

### Création d'un tableau (eq `list` en Python)

* Une première version serait :
 * de créer un tableau vide au départ,
 * de rajouter par la suite de case à la fin du tableau.

In [6]:
t = []
i=0
while i<10 :
    t.append(4)
    i=i+1
print(t)

[4, 4, 4, 4, 4, 4, 4, 4, 4, 4]


* Cependant, on peut se poser d'autres questions
 * les performances seraient-elles les mêmes si au lieu d'utiliser `t.append(4)`, j'utilise plutôt `t.insert(0,4)` pour insérer la valeur `x` en début de tableau ?

In [1]:
t = []
i=0
while i<10 :
    t.insert(0,4)
    i=i+1
print(t)

[4, 4, 4, 4, 4, 4, 4, 4, 4, 4]


***Conclusion provisoire :***  
* Dans l'exemple précédent, nous voyons que pour le même traitement, il est possible d'opter pour deux solutions (il y en a d'autres) algorithmiques. Dès à présent, ces solutions n'auront pas la même complexité, ni les mêmes performances en terme de temps.

### Comment Python minimise le coût temporel pour gagner en performance lors des insertions de valeurs dans les listes ?


Il faut noter que Python a une façon particulière d'optimiser les temps de calcul en gérant "judicieusement" la capacité des listes. Ces mécanismes permettent de limiter les réallocations intempestives à chaque insertion de valeur :
* au départ, une liste a une capacité maximale donnée (eq nombre de cases données) et les insertions (`append()` ou `insert()`) se font "normalement" dans l'espace mémoire alloué pour la liste ;
* lorsque la capacité maximale est atteinte, Python opère plusieurs opérations pour agrandir la liste :
   * création d'une autre liste avec une capacité double (généralement) de la précédente ;
   * recopie des élements de l'ancienne liste dans la nouvelle liste ;
   * rajout de l'élément qu'on cherchait à insérer.
   
Tout cela permet de minimiser les réallocations intempestives de nouvelles listes à chaque insertion lorsque la capacité maximale de la liste est atteinte. Ce mécanisme permet de rendre a peu près constant en moyenne le temps d'exécution pour une insertion à la fin du tableau.
  

### Recopie d'un tableau


Considérons l'exemple suivant :

In [7]:
t = [10,5,40]
t1= t
t1[1] = 8
print(t)
print(t1)

[10, 8, 40]
[10, 8, 40]


Dans cet exemple, l'opération d'affectation ne recopie pas le tableau !

Pour recopier un tableau, il est possible d'utiliser la méthode built-in `L.copy()`. Cependant, comme dans la situation précédente, il est possible d'écrire son propre algorithme pour faire cette copie et de comparer les performances.

* Sur ce thème : **Exercice 2, TD2**

## Appartenance d'un élément à une liste

En utilisant la même démarche, nous pouvons soit utiliser une solution built-in, soit une solution algortihmique.


* Solution built-in :

In [None]:
 def cherche_built_in(tab, x):
    if x in tab:
        return True
    return False

* Solution algorithmique :

La récursivité sera utilisée pour faire une recherche dichotomique.

In [None]:
def cherche_algo(tab, x, borne_a=0, borne_b=0):
    if borne_a > borne_b:
        return False
    milieu = (borne_a + borne_b) // 2
    if tab[milieu] == x:
        return True
    if tab[milieu] > x:
        return cherche_algo(tab, x, borne_a, milieu-1)
    return cherche_algo(tab, x, milieu+1, borne_b)

***Quelle solution choisir ?***


Pour pouvoir se décider, il serait souhaitable de définir sur quel critère doit se faire notre choix. On peut comparer, par exemple, le temps d’exécution moyen des deux fonctions sur des listes de plus en plus grandes.



<center><img src="img/temps_exec_val_in_tab.png" /></center>


On constate maintenant que la version algorithmique est en générale beaucoup plus rapide que la version built-in. Cette comparaison ne nous dit pas pourquoi cela est vrai ; il faudrait pour cela se lancer dans une étude théorique des deux solutions précédents (cependant, vous aurez des éléments de réponse plus loin).

Cet exemple, contrairement à ce qu'on pourrait penser, montre que la méthode built-in est moins performante sur des grands tableaux !

***Attention !*** La recherche dichotomique ne peut se faire que sur des **tableaux préalablement triés**. La performance de l'algorithme devra être relativisée car le tri consomme aussi du temps d'exécution...

## La mesure du temps en Python

* Pour réaliser le graphique précédent, il est nécessaire de mettre en place un chronomètre en Python. Son fonctionnement est décrit ci-dessous :
 * on déclenche le chronomère **juste avant le début du bout de code à tester**, appelons ce temps `t_deb` ;
 * on arrête le chronomètre **juste après le bout de code à tester**, appelons ce temps `t_fin`;
 * la différence entre `t_fin` et `t_deb` donne la durée d'éxecution du bout de code.

* On peut y parvenir grâce au module `time` et en utilisant la fonction `time()` qui renvoie le temps en seconde.

Exemple :

In [4]:
from time import time
t_deb = time()*1000 # enclencher le chronomètre, temps en milliseconde

# morceau de code à tester

t_fin = time()*1000   # arrêter le chronomètre, temps en milliseconde
print(t_fin - t_deb, 'millisecondes')

0.0 secondes


## Conclusion

* Lors de l'utilisation des tableaux, il est important de ne pas perdre de vue le coup en performance. L'utilisation des méthodes built-in délèguent au langage Python tout le travail mais cela au prix d'un coût en temps occasionnant une perte de performances plus ou moins grande selon les stratégies employées dans le code embarqué par le langage (l'interpréteur en réalité) ; il en est de même pour une solution algorithmique. Il est important de prendre conscience de ces aspects dans le choix des stratégies alogorithmiques à mener pour résoudre un cahier des charges.


* Quelques soient les langages utilisés, quelques soient les technologies utilisées, tout traitement à un coût :
 * en temps d'exécution,
 * en espace mémoire,
 * en communication réseau,
 * etc.  


Il est indispensable de savoir quels sont les critères à optimiser lors de l'écriture d'un programme.

* Dans les exercices de travail pratique, nous allons comparer, pour différents situations, le coût en temps des solutions built-in par rapport aux solutions algorithmiques.

## Compléments

Le type `list` peut contenir différents types. Par exemple, `t = [10,8.6,"coucou"]`. De plus, les listes peuvent adapter leur capacité en fonction des besoins. Cette polyvalence se fait au prix d'une perte de performance. Il existe un type "plus limité" mais plus efficace. Le type `array` appartenant au module Numpy permet de stocker plusieurs éléments numériques (taille constante) de même type (uniquement). Il est cependant beaucoup plus efficace en temps d'exécution et adapté notamment au calcul scientifique.


* Sur ce thème : **Exercice 3, TD2**