<span style="float:left;">Licence CC BY-NC-ND</span><span style="float:right;">Thierry Parmentelat &amp; Arnaud Legout&nbsp;<img src="media/inria-25.png" style="display:inline"></span><br/>

# Construction de liste par compréhension

## Complément - niveau basique

Ce mécanisme très pratique permet de construire simplement une liste à partir d'une autre (ou de **tout autre type iterable** en réalité, mais nous y viendrons).

Pour l'introduire en deux mots, disons que la compréhension de liste est à l'instruction `for` ce que l'expression conditionnelle est à l'instruction  `if`, c'est-à-dire qu'il s'agit d'une **expression à part entière**.

### Cas le plus simple

Voyons tout de suite un exemple

In [None]:
depart = [-5, -3, 0, 3, 5, 10]
arrivee = [x**2 for x in depart]
arrivee

Le résultat de cette expression est donc une liste, dont les éléments sont les résultats de l'expression `x**2` pour `x` prenant toutes les valeurs de `depart`.

**Remarque**: si on prend un point de vue un peu plus mathématique, ceci revient donc à appliquer une certaine fonction (ici $x \rightarrow x^2$) à une collection de valeurs, et à retourner la liste des résultats. Dans les langages fonctionnels, cette opération est connue sous le nom de `map`.

In [None]:
# profitons de cette occasion pour voir 
# comment tracer une courbe avec matplotlib
%matplotlib inline
import matplotlib.pyplot as plt
plt.ion()

In [None]:
# si on met le depart et l'arrivee 
# en abscisse et en ordonnee, on trace
# une version tronquée de la courbe de f: x -> x**2
plt.plot(depart, arrivee);

### Restriction à certains éléments

Il est possible également de ne prendre en compte que certains des éléments de la liste de départ, comme ceci

In [None]:
[x**2 for x in depart if x%2 == 0]

qui cette fois ne contient que les carrés des éléments pairs de `depart`. 

**Remarque**: pour prolonger la remarque précédente, cette opération s'appelle fréquemment `filter` dans les langages de programmation.

### Autres types

On peut fabriquer une compréhension à partir de tout objet itérable, pas forcément une liste, mais le résultat est toujours une liste, comme on le voit sur ces quelques exemples:

In [None]:
[ord(x) for x in 'abc']

In [None]:
[chr(x) for x in (97, 98, 99)]

Nous verrons très bientôt que des mécanismes similaires sont disponibles avec les dictionnaires et les ensembles.

## Complément - niveau intermédiaire

### Imbrications

On peut également imbriquer plusieurs niveaux pour ne construire qu'une seule liste, comme par exemple

In [None]:
[n + p for n in [2, 4] for p in [10, 20, 30]]

Bien sûr on peut aussi restreindre ces compréhensions, comme par exemple

In [None]:
[n + p for n in [2, 4] for p in [10, 20, 30] if n*p >= 40]

Observez surtout que le résultat ci-dessus est une liste simple (de profondeur 1), à comparer avec 

In [None]:
[[n + p for n in [2, 4]] for p in [10, 20, 30]]

qui est de profondeur 2, et où les résultats atomiques apparaissent dans un ordre différent 

Un moyen mnémotechnique pour se souvenir dans quel ordre les compréhensions imbriquées produisent leur résultat, est de penser à la version "naïve" du code qui produirait le même résultat; dans ce code les clause `for` et `if` apparaissent **dans le même ordre** que dans la compréhension

In [None]:
# notre exemple:
# [n + p for n in [2, 4] for p in [10, 20, 30] if n*p >= 40]
# est équivalent à ceci:

resultat = []
for n in [2, 4]:
    for p in [10, 20, 30]:
        if n*p >= 40:
            resultat.append(n + p)
resultat

### Compréhension *vs* expression génératrice

#### Digression : liste *vs* itérateur

En python3, nous avons déjà rencontré la fonction `range` qui retourne les premiers entiers.

Depuis python3 toutefois, cette fonction exhibe un comportement un peu étrange, en ce sens que:

In [None]:
# on peut parcourir un range comme si c'était une liste
for i in range(4):
    print(i)

In [None]:
# mais en fait la fonction range ne renvoie PAS une liste (depuis python3)
range(4)

In [None]:
range(4) == [0, 1, 2, 3]

La raison de fond pour ceci, c'est que **le fait de construire une liste** est une opération relativement coûteuse - toutes proportions gardées - car il est nécessaire d'allouer de la mémoire pour **stocker tous les éléments** de la liste à un instant donné; alors qu'en fait dans l'immense majorité des cas, on n'a **pas réellement besoin** de cette place mémoire, tout ce dont on a besoin c'est d'itérer sur un certain nombre de valeurs mais **qui peuvent être calculées** au fur et à mesure que l'on parcourt la liste. 

#### Compréhensions et expression génératrice

À la lumière de ce qui vient d'être dit, on peut voir qu'une compréhension n'est **pas toujours le bon choix**, car par définition elle **construit une liste** de résultats - de la fonction appliquée successivment aux entrées.

Or dans les cas où, comme pour `range`, on n'a pas réellement besoin de cette liste **en temps que telle** mais seulement de cet artefact pour pouvoir itérer sur la liste des résultats, il est préférable d'utiliser une **expression génératrice**.

Voyons tout de suite sur un exemple à quoi cela ressemblerait.

In [None]:
# dans le premier calcul de arrivee 
# dans lequel, pour rappel, la compréhension est entre []
# on peut écrire presque la même chose avec des () à la place 
arrivee2 = (x**2 for x in depart)
arrivee2

Comme pour `range`, le résultat de l'expression génératrice ne se laisse pas regarder avec `print`, mais comme pour `range`, on peut itérer sur le résultat:

In [None]:
for x, y in zip(depart, arrivee2):
    print("x={} => y={}".format(x, y))

Il n'est pas **toujours** possible de remplacer une compréhension par une expression génératrice, mais c'est **souvent souhaitable**, car de cette façon on peut faire de substantielles économies en termes de performances. On peut le faire dès lors que l'on a seulement besoin d'itérer sur les résultats.

## Complément - niveau avancé

### Note sur `map` et `filter`

Avant que les compréhensions ne soient introduites, on utilisait deux fonctions built-in intitulées `map` (nom qui provient à l'origine de Lisp) et `filter`. Leur usage est à présent déconseillé, car le code est moins lisible. On les trouve encore dans du code existant.

Pour donner un aperçu de ces fonctions, au cas où vous en rencontriez dans du code existant, voici comment on écrirait

In [None]:
[x**2 for x in depart if x%2 == 0]

Avec `map` et `filter` cela donnerait

In [None]:
def pair(x): 
    return x%2 == 0

def carre(x): 
    return x**2

list(map(carre, list(filter(pair, depart))))

Ou encore, sur une ligne

In [None]:
list(map(lambda x: x**2, [x for x in depart if x%2 == 0]))

**Remarque**: l'instruction `lambda` permet permet de définir une fonction, que l'on appelle fonction lambda, à la volée et sans la nommer. Nous reviendrons dessus dans les semaines à venir. Mais à notre avis au moins, les fonctions lambda ont perdu beaucoup de leur intérêt depuis, précisément, l'introduction des compréhensions. Aussi nous ne recommandons pas non plus de les utiliser dans du code nouveau.

### Pour en savoir plus

Voyez [la section sur les compréhensions de liste](https://docs.python.org/3.5/tutorial/datastructures.html#list-comprehensions) dans la documentation python.