# Syntaxe Compréhensive

La syntaxe compréhensive est une syntaxe propre à certains langages de programmation qui vient du monde des mathématiques et qui, au lieu de décrire des éléments un par un, décrit plutôt les propriétés qu'ont en commun ces différents éléments.

En Python, on peut considérer cela comme une formule qui permet de générer des éléments au lieu de les écrire tous un par un.

Cette syntaxe peut s'appliquer sur différents objets (listes, sets et dictionnaires) et est très utilisée, notamment pour filtrer facilement des itérables.

Même si cette manière d'écrire est concise, élégante et offre de meilleures performances car elle fait appel à des fonctions codées en bas niveau, il n'est pourtant pas recommandé de les utiliser partout où c'est possible. En effet si l'opération à effecteur est complexe mieux vaut utiliser une boucle `for` qui prendra un peu plus de place dans le code mais sera aussi plus facile à créer, à tester, à débugger et à comprendre par un autre programmeur.

# Comprehension Syntax

Comprehension syntax is a syntax specific to some programming languages that comes from the world of mathematics and which, instead of describing elements one by one, describes the properties that these different elements have in common.

In Python, this can be thought of as a formula that allows us to generate elements instead of writing them all one by one.

This syntax can be applied to different objects (lists, sets and dictionaries) and is widely used, for example to easily filter iterables.

Even if this way of writing is short and elegant, it is not recommended to use it each time we need to generate a list, a dictionary or a set. Indeed, if the operation to be performed is complex, it's probably best to use a `for` loop which will take up a little more space in the code but will also be easier to create, test, debug and understand by another programmer.

# Les listes compréhensives

## Définition

Les listes compréhensives sont donc des sortes de "formules magiques" qui vont créer des listes. En général on part d'un objet itérable d'après lequel on veut créer une liste (ce peut donc être une autre liste, mais aussi un dictionnaire ou n'importe quel autre objet itérable).

Pour créer une liste compréhensive on ouvre les crochets comme si on voulait créer une liste mais au lieu d'énumérer les différents éléments qui la composent on utilise la syntaxe suivante :

```python
[expression for element in iterable]
```
Ici :

- La variable **expression** est le résultat que l'on veut obtenir.
- La variable **élément** est le nom que l'on va donner à chaque élément sur lequel on itère.
- La variable **itérable** est le nom de l'objet sur lequel on va pouvoir itérer.

On pourrait donc l'écrire ainsi :

```python
[ce_que_l_on_veut_obtenir for variable_contenant_successivement_chaque_element in objet_iterable]
```

Pour commencer de manière très simple, créeons une liste compréhensive qui va générer une copie d'une autre liste :

# List Comprehension

## Definition

List Comprehension are a kind of "magic formula" that will create lists. In general, we start with an iterable object from which we want to create a list (it can be another list, but also a dictionary or any other iterable object).

To create a comprehensive list we open the brackets as if we wanted to create a list, but instead of enumerating the different elements that make it up, we use the following syntax:

```python
[expression for element in iterable]
```
Here:

- The variable **expression** is the result we want to get.
- The **element** variable is the name we will give to each element we iterate on.
- The **iterable** variable is the name of the object on which we can iterate.

So you could write it like this:

```python
[what_we_want_to_get for variable_containing_successively_each_element in object_iterable]
```

To begin in a very simple way, let's just create a comprehension list that will generate a copy of another list:

In [1]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

[n for n in seq]

[2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

Maintenant imaginons que nous voulions générer une nouvelle liste contenant les carrés de chacun de ces chiffres, on va alors modifier l'expression que l'on cherche à obtenir :

Now let's imagine that we want to generate a new list containing the squares of each of these numbers, we will then modify the expression we are trying to obtain:

In [2]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

[n ** 2 for n in seq]

[4, 36, 64, 25, 49, 81, 1, 4, 9, 36]

Notez qu'on aurait pu l'écrire avec une boucle `for` ainsi, mais c'est plus long :

Note that we could use a `for` loop as well, but it'd take more time to write:

In [3]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

new_list = []

for n in seq:
    new_list.append(n ** 2)

print(new_list)

[4, 36, 64, 25, 49, 81, 1, 4, 9, 36]


### Exercice (facile)

A partir de la liste suivante, générez une nouvelle liste à l'aide de la syntaxe compréhensive qui triple chaque caractère. Par exemple La lettre "c" deviendra "ccc" dans la nouvelle liste.

**Astuce**

- Rappelez-vous, en python il est possible de multiplier des strings par des entiers.

### Exercise (easy)

From the following list, generate a new list using the comprehensive syntax that triples each character. For example The letter "c" will become "ccc" in the new list.

**Tip**:

- Remember, in python it is possible to multiply strings by integers.

In [4]:
seq = ["a", "c", "d", "f", "g", "z", "e", "i"]

# Code here!

In [5]:
# Solution

seq = ["a", "c", "d", "f", "g", "z", "e", "i"]

[el * 3 for el in seq]

['aaa', 'ccc', 'ddd', 'fff', 'ggg', 'zzz', 'eee', 'iii']

## Filtrer avec des listes compréhensives et `if`

Les listes compréhensives permettent de facilement filtrer, c'est-à-dire choisir les éléments qu'on va traiter (et ceux qu'on ne traitera pas).

Pour cela on ajoute tout simplement un `if` à la fin de la syntaxe.

```python
[el for el in iterable if cond]
```
Autrement dit, on veut "el" si la condition est satisfaite, où "el" est l'élément qui sera ajouté dans notre liste. Sinon l'élément ne sera pas traité.

On pourrait aussi l'écrire de cette manière :

```python
[ce_que_l_on_veut_obtenir for variable_contenant_successivement_chaque_element in objet_iterable if notre_condition_est_vraie]
```

Reprenons le dernier exemple et imaginons que nous ne voulions tripler les lettres uniquement dans le cas où celles-ci sont des voyelles :

## Filtering with list comphrension and `if`

Lists allow you to easily filter, i.e. to choose the elements that you will process (and those that you will not process).

To do this, you simply add an `if` at the end of the syntax.

```python
[el for el in iterable if cond]
```
In other words, we want "el" if the condition is met, where "el" is the element that will be added to our list. Otherwise the element will not be processed.

We could also write it this way:

```python
[what_we_want_to_get for variable_containing_successively_each_element in object_iterable if our_condition_is_true]
```

Let's go back to the last example and imagine that we only want to triple the letters in the case that they are vowels:

In [6]:
seq = ["a", "c", "d", "f", "g", "z", "e", "i"]

[el * 3 for el in seq if el in ["a", "e", "i", "o", "u", "y"]]

['aaa', 'eee', 'iii']

## Exercice (facile)

Ecrivez une liste compréhensive qui retourne le carré des nombres suivants uniquement si ils sont strictement plus grands que 5.

## Exercise (easy)

Write a comprehensive list that returns the square of the following numbers only if they are strictly greater than 5.

In [7]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

# code here!


In [8]:
# Solution

seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

[n ** 2 for n in seq if n > 5]

[36, 64, 49, 81, 36]

## `if` et `else` dans une liste compréhensive

Parfois on souhaite appliquer différentes transformations aux éléments en fonction de leur nature. Dans ce cas là on peut ajouter des `if` et des `else` dans la première partie de l'expression afin de leur faire subir un traitement différencié.

```python
[expression_1 if condition else expression_2 for element in iterable]
```
Par exemple imaginons qu'on veut avoir les carrés des nombres 2, 4 et 6 et le cube des autres nombres.

## `if` and `else` in a list comprehension

Sometimes we want to apply different transformations to elements depending on their nature. In this case you can add `if` and `else` in the first part of the expression.

```python
[expression_1 if condition else expression_2 for element in iterable]
```
For example, let's say we want to get the squares of the numbers 2, 4 and 6 and the cube of the other numbers.

In [9]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

[n ** 2 if n in [2, 4, 6] else n ** 3 for n in seq]

[4, 36, 512, 125, 343, 729, 1, 4, 27, 36]

Notez que l'on peut cumuler l'utilisation d'expressions conditionnelles (`if` et `else`) avec l'utilisation d'un `if` à la fin de l'expression qui lui filtrera en amont les éléments :

Note that the use of conditional expressions (`if` and `else`) can be combined with the use of an `if` at the end of the expression which will filter out the upstream elements:

In [10]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

[n ** 2 if n in [2, 4, 6] else n ** 3 for n in seq if n > 5]

[36, 512, 343, 729, 36]

## Exercice (facile / moyen)

Générez une nouvelle liste à partir de la liste "fruits" grâce à la syntaxe compréhensive. La nouvelle liste aura pour caractéristiques :

- La première lettre de chacun des mots devra être une majuscule.
- Les éléments "banane" seront remplacés par "Gorille".
- Les éléments "mangue" doivent être retirés de la liste.

## Exercise (easy / medium)

Generate a new list from the "fruits" list using the comprehensive syntax. The new list will have the following characteristics:

- The first letter of each word must be a capital letter.
- The items "banana" will be replaced by "Gorilla".
- The items "mango" should be removed from the list.

In [11]:
fruits = ["mangue", "banane", "kiwi", "orange",
         "banane", "banane", "banane", "banane",
         "mangue", "mangue", "banane", "mangue", "banane",
         "ananas", "mangue", "banane", "ananas"]

# Code here!

In [12]:
fruits = ["mango", "banana", "kiwi", "orange",
         "banana", "banana", "banana", "banane",
         "mango", "mango", "banana", "mango", "banana",
         "pineapple", "mango", "banana", "pineapple"]

# Code here!

In [13]:
# Solution

fruits = ["mangue", "banane", "kiwi", "orange",
         "banane", "banane", "banane", "banane",
         "mangue", "mangue", "banane", "mangue", "banane",
         "ananas"]

["Gorille" if el == "banane" else el[0].upper() + el[1:] for el in fruits if el != "mangue"]

['Gorille',
 'Kiwi',
 'Orange',
 'Gorille',
 'Gorille',
 'Gorille',
 'Gorille',
 'Gorille',
 'Gorille',
 'Ananas']

In [14]:
# Solution

fruits = ["mango", "banana", "kiwi", "orange",
         "banana", "banana", "banana", "banane",
         "mango", "mango", "banana", "mango", "banana",
         "pineapple", "mango", "banana", "pineapple"]

["Gorilla" if el == "banana" else el[0].upper() + el[1:] for el in fruits if el != "mango"]

['Gorilla',
 'Kiwi',
 'Orange',
 'Gorilla',
 'Gorilla',
 'Gorilla',
 'Banane',
 'Gorilla',
 'Gorilla',
 'Pineapple',
 'Gorilla',
 'Pineapple']

# Dictionnaires compréhensifs

## Définition

Les dictionnaires compréhensifs se comportent de la même manière que les listes compréhensives, à la différence que l'on doit leur donner deux expressions à retourner : la clé et la valeur. La syntaxe est donc légèrement différente. Voyons cela :

```python
{k: v for k, v in iterable}
```
Ici :

- La variable **k** (*key*) désigne la variable qui sera utilisée comme clé.
- La variable **v** (*value*) est la valeur associée à cette clé.
- La variable **itérable** est le nom de l'objet sur lequel on va pouvoir itérer, il faut donc que cet itérable contienne des couples de valeurs.

Commençons simplement en créant une copie d'un dictionnaire, dans ce cas-là il faut itérer sur celui-ci à l'aide de la méthode `.items()` afin qu'à chaque itération un couple clé valeur soit retourné.

# Dictionary comprehension

## Definition

Dictionary comprehension behave in the same way as list comprehension, except that they must be given two expressions to return: the key and the value. The syntax is therefore slightly different:

```python
{k: v for k, v in iterable}
```
Here:

- The variable **k** (*key*) is the variable that will be used as the key.
- The variable **v** (*value*) is the value associated with this key.
- The **iterable** variable is the name of the object that we will be able to iterate on, so this iterable must contain pairs of values.

Let's start simply by creating a copy of a dictionary, in this case we must iterate on it using the `.items()` method so that at each iteration a key-value pair is returned.

In [15]:
my_dict = {"kiwis": 3,
           "melons": 12,
           "oranges": 7}

{k: v for k, v in my_dict.items()}

{'kiwis': 3, 'melons': 12, 'oranges': 7}

Désormais multiplions les quantités par 5.

Now let's multiply the quantities by 5.

In [16]:
my_dict = {"kiwis": 3,
           "melons": 12,
           "oranges": 7}

{k: v * 5 for k, v in my_dict.items()}

{'kiwis': 15, 'melons': 60, 'oranges': 35}

Et passons les clés en majuscules.

And let's capitalise the keys.

In [17]:
my_dict = {"kiwis": 3,
           "melons": 12,
           "oranges": 7}

{k.upper(): v * 5 for k, v in my_dict.items()}

{'KIWIS': 15, 'MELONS': 60, 'ORANGES': 35}

## Générer un dictionnaire à partir de listes

Imaginons que nous ayons deux listes, et que nous voulions que l'une devienne une clé et l'autre la valeur. Nous pouvons alors utiliser la fonction `zip()` qui va faire correspondre chaque élément d'une liste à l'autre afin que nous puissions itérer sur les deux listes simultanément !

Créons un objet de type `zip` et itérons dessus pour observer son comportement :

## Generating a dictionary from lists

Let's pretend we have two lists, we want the first one to become a key and the second to become the value. We can then use the `zip()` function which will map each element of one list to the other so that we can iterate over both lists simultaneously!

Let's create an object of type `zip` and iterate over it to see how it behaves:

In [18]:
l1 = ["kiwis", "melons", "oranges"]
l2 = [3, 12, 7]

for el in zip(l1, l2): print(el)

('kiwis', 3)
('melons', 12)
('oranges', 7)


On constate que le fait de "zipper" les listes entre elles a donc créé un objet spécial de type "zip" qui permet de parcourir les deux listes à la fois. Celui-ci renvoie un "tuple" (une liste non modifiable) à chaque itération. Maintenant générons notre dictionnaire à l'aide de la syntaxe compréhensive :

Zipping the lists together has created a special "zip" object that allows us to iterate over both lists at once. This returns a "tuple" at each iteration. Now let's generate our dictionary using the comprehensive syntax :

In [19]:
l1 = ["kiwis", "melons", "oranges"]
l2 = [3, 12, 7]

{k: v for k, v in zip(l1, l2)}

{'kiwis': 3, 'melons': 12, 'oranges': 7}

Bien évidemment les structures conditionnelles (`if` et `else`) s'appliquent de la même manière que les listes compréhensives. Vérifiez ceci en effectuant l'exercice suivant :

Conditional structures (`if` and `else`) apply in the same way as in list comprehension.

# Exercice (moyen)

Créer un dictionnaire à partir des deux listes suivantes. Celle contenant les noms des produits alimentaires sera la clé, l'autre sera celle des valeurs. Faites en sorte que les contraintes suivantes soient respectées :
- Les clés commençant par la lettre "c" et "b" (quelque soit leur casse) ne devront pas être prises en compte.
- La première lettre de chaque clé du dictionnaire doit commencer par une majuscule.
- Si la valeur est égale à 0, remplacez-la par "out of stock".

**ASTUCES**

- Utilisez `.upper()`afin de gérer la casse.
- Vous souvenez-vous de l'utilisation des *slices* ?

# Exercise (medium)

Create a dictionary from the following two lists. The one containing the names of the differents types of food will be the key, the other will be the values. Make sure that the following constraints are met:

- Keys beginning with the letter "c" and "b" (regardless of their case) should be ignored.
- The first letter of each key in the dictionary must start with a capital letter.
- If the value is 0, replace it with "out of stock".

**ASTUCES**

- Use `.upper()` to deal with the letter case.
- Do you remember the use of *slices*?

In [20]:
food = ["Courgettes", "quiche", "aubergines", "croissant", "Baguette", "kiwi", "melon", "oranges", "brioche"]
stock = [1, 0, 2, 16, 46, 0, 1, 4, 5]

# Code here!


In [21]:
## Solution

food = ["Courgettes", "quiche", "aubergines", "croissant", "Baguette", "kiwi", "melon", "oranges", "brioche"]
stock = [1, 0, 2, 16, 46, 0, 1, 4, 5]

{k[0].upper() + k[1:] : v if v != 0 else "stock épuisé"
 for k, v in zip(food, stock)
 if k[0].lower() not in ["c", "b"]}

{'Quiche': 'stock épuisé',
 'Aubergines': 2,
 'Kiwi': 'stock épuisé',
 'Melon': 1,
 'Oranges': 4}

# Pour aller plus loin

## Exercice (moyen)

Ecrivez une liste compréhensive qui itérera sur la liste nommez "Filtrez-moi" et appliquera les modifications suivantes :
- Ne prendra pas en compte les strings égales ou plus grandes que 14 caractères.
- Ne prendra pas en compte les integer dont le carré est strictement plus petit que 40.
- Passera en majuscules les strings.
- Retournera le cube des nombres.

**Précision sur les tests de type**

Pour tester le type d'un élément, on pourrait bien sûr écrire quelque chose comme :
```python
if type("Hello World !") == str: print("C'est une string !")
```
Mais il est préférable d'utiliser la fonction `isinstance()` qui a été conçue pour réaliser ce type de tests et qui est plus robuste. Sa syntaxe est : `isinstance(el, type)`. Ex:

```python
if isinstance("Hello World !", str): print("C'est une string !")
```

**ASTUCES**:

- Vous vous souvenez des `and` et des `or` ?
- Et de `.upper()` et `len()` ?
- Attention à ne pas utiliser des opérations numériques sur des strings ou des méthodes réservées aux strings sur des nombres, dans ce cas-là python renverra une erreur. Pour éviter cela vérifiez le type de l'élément avec `isinstance()`.
- La réponse tient en une seule ligne de code, mais comme celle-ci est un peu longue sachez que vous pouvez tout à fait écrire des listes compréhensives sur plusieurs lignes.

In [22]:
filtrez_moi = ["topinambour", 5, "patate", 9, 7, 5, 1, 3, 5, 7, "tomates anciennes", 5, 12, 11]

# Tapez le code ici:


In [23]:
# Solution

filtrez_moi = ["topinambour", 5, "patate", 9, 7, 5, 1, 3, 5, 7, "tomates anciennes", 5, 12, 11]

[el.upper() if (isinstance(el, str)) else el ** 3 for el in filtrez_moi
if (isinstance(el, str) and len(el) < 14) or
   (isinstance(el, int) and el ** 2 > 40)]

['TOPINAMBOUR', 'PATATE', 729, 343, 343, 1728, 1331]