# Syntaxe Compréhensive

La syntaxe compréhensive est une syntaxe propre à certains langages de programmation qui vient du monde des mathématiques et qui, au lieu de décrire des éléments un par un, décrit plutôt les propriétés qu'ont en commun ces différents éléments.

En Python, on peut considérer cela comme une formule qui permet de générer des éléments au lieu de les écrire tous un par un.

Cette syntaxe peut s'appliquer sur différents objets (listes, sets et dictionnaires) et est très utilisée, notamment pour filtrer facilement des itérables.

Même si cette manière d'écrire est concise, élégante et offre de meilleures performances car elle fait appel à des fonctions codées en bas niveau, il n'est pourtant pas recommandé de les utiliser partout où c'est possible. En effet si l'opération à effecteur est complexe mieux vaut utiliser une boucle `for` qui prendra un peu plus de place dans le code mais sera aussi plus facile à créer, à tester, à débugger et à comprendre par un autre programmeur.

# Les listes compréhensives

## Définition

Les listes compréhensives sont donc des sortes de "formules magiques" qui vont créer des listes. En général on part d'un objet itérable d'après lequel on veut créer une liste (ce peut donc être une autre liste, mais aussi un dictionnaire ou n'importe quel autre objet itérable).

Pour créer une liste compréhensive on ouvre les crochets comme si on voulait créer une liste mais au lieu d'énumérer les différents éléments qui la composent on utilise la syntaxe suivante :

```python
[expression for element in iterable]
```
Ici :

- La variable **expression** est le résultat que l'on veut obtenir.
- La variable **élément** est le nom que l'on va donner à chaque élément sur lequel on itère.
- La variable **itérable** est le nom de l'objet sur lequel on va pouvoir itérer.

On pourrait donc l'écrire ainsi :

```python
[ce_que_l_on_veut_obtenir for variable_contenant_successivement_chaque_element in objet_iterable]
```

Pour commencer de manière très simple, créeons une liste compréhensive qui va générer une copie d'une autre liste :

In [None]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

[n for n in seq]

Maintenant imaginons que nous voulions générer une nouvelle liste contenant les carrés de chacun de ces chiffres, on va alors modifier l'expression que l'on cherche à obtenir :

In [None]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

[n ** 2 for n in seq]

Notez qu'on aurait pu l'écrire avec une boucle `for` ainsi, mais c'est plus long :

In [None]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

new_list = []

for n in seq:
    new_list.append(n ** 2)

print(new_list)

### Exercice (facile)

❓ **>>>** À partir de la liste suivante, générez une nouvelle liste à l'aide de la syntaxe compréhensive qui triple chaque caractère. Par exemple La lettre "c" deviendra "ccc" dans la nouvelle liste.

**Astuce**

- Rappelez-vous, en python il est possible de multiplier des strings par des entiers.

In [None]:
seq = ["a", "c", "d", "f", "g", "z", "e", "i"]

# Code here!

## Filtrer avec des listes compréhensives et `if`

Les listes compréhensives permettent de facilement filtrer, c'est-à-dire choisir les éléments qu'on va traiter (et ceux qu'on ne traitera pas).

Pour cela on ajoute tout simplement un `if` à la fin de la syntaxe.

```python
[el for el in iterable if cond]
```
Autrement dit, on veut "el" si la condition est satisfaite, où "el" est l'élément qui sera ajouté dans notre liste. Sinon l'élément ne sera pas traité.

On pourrait aussi l'écrire de cette manière :

```python
[ce_que_l_on_veut_obtenir for variable_contenant_successivement_chaque_element in objet_iterable if notre_condition_est_vraie]
```

Reprenons le dernier exemple et imaginons que nous ne voulions tripler les lettres uniquement dans le cas où celles-ci sont des voyelles :

In [None]:
seq = ["a", "c", "d", "f", "g", "z", "e", "i"]

[el * 3 for el in seq if el in ["a", "e", "i", "o", "u", "y"]]

## Exercice (facile)

❓ **>>>** Écrivez une liste compréhensive qui retourne le carré des nombres suivants uniquement si ils sont strictement plus grands que 5.

In [None]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

# code here!


## `if` et `else` dans une liste compréhensive

Parfois on souhaite appliquer différentes transformations aux éléments en fonction de leur nature. Dans ce cas là on peut ajouter des `if` et des `else` dans la première partie de l'expression afin de leur faire subir un traitement différencié.

```python
[expression_1 if condition else expression_2 for element in iterable]
```
Par exemple imaginons qu'on veut avoir les carrés des nombres 2, 4 et 6 et le cube des autres nombres.

In [None]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

[n ** 2 if n in [2, 4, 6] else n ** 3 for n in seq]

Notez que l'on peut cumuler l'utilisation d'expressions conditionnelles (`if` et `else`) avec l'utilisation d'un `if` à la fin de l'expression qui lui filtrera en amont les éléments :

In [None]:
seq = [2, 6, 8, 5, 7, 9, 1, 2, 3, 6]

[n ** 2 if n in [2, 4, 6] else n ** 3 for n in seq if n > 5]

## Exercice (facile / moyen)

❓ **>>>** Générez une nouvelle liste à partir de la liste "fruits" grâce à la syntaxe compréhensive. La nouvelle liste aura pour caractéristiques :

- La première lettre de chacun des mots devra être une majuscule.
- Les éléments "banane" seront remplacés par "Gorille".
- Les éléments "mangue" doivent être retirés de la liste.

In [None]:
fruits = ["mangue", "banane", "kiwi", "orange",
         "banane", "banane", "banane", "banane",
         "mangue", "mangue", "banane", "mangue", "banane",
         "ananas", "mangue", "banane", "ananas"]

# Code here!

# Dictionnaires compréhensifs

## Définition

Les dictionnaires compréhensifs se comportent de la même manière que les listes compréhensives, à la différence que l'on doit leur donner deux expressions à retourner : la clé et la valeur. La syntaxe est donc légèrement différente. Voyons cela :

```python
{k: v for k, v in iterable}
```
Ici :

- La variable **k** (*key*) désigne la variable qui sera utilisée comme clé.
- La variable **v** (*value*) est la valeur associée à cette clé.
- La variable **itérable** est le nom de l'objet sur lequel on va pouvoir itérer, il faut donc que cet itérable contienne des couples de valeurs.

Commençons simplement en créant une copie d'un dictionnaire, dans ce cas-là il faut itérer sur celui-ci à l'aide de la méthode `.items()` afin qu'à chaque itération un couple clé valeur soit retourné.

In [None]:
my_dict = {"kiwis": 3,
           "melons": 12,
           "oranges": 7}

{k: v for k, v in my_dict.items()}

Désormais multiplions les quantités par 5.

In [None]:
my_dict = {"kiwis": 3,
           "melons": 12,
           "oranges": 7}

{k: v * 5 for k, v in my_dict.items()}

Et passons les clés en majuscules.

In [None]:
my_dict = {"kiwis": 3,
           "melons": 12,
           "oranges": 7}

{k.upper(): v * 5 for k, v in my_dict.items()}

## Générer un dictionnaire à partir de listes

Imaginons que nous ayons deux listes, et que nous voulions que l'une devienne une clé et l'autre la valeur. Nous pouvons alors utiliser la fonction `zip()` qui va faire correspondre chaque élément d'une liste à l'autre afin que nous puissions itérer sur les deux listes simultanément !

Créons un objet de type `zip` et itérons dessus pour observer son comportement :

In [None]:
l1 = ["kiwis", "melons", "oranges"]
l2 = [3, 12, 7]

for el in zip(l1, l2): print(el)

On constate que le fait de "zipper" les listes entre elles a donc créé un objet spécial de type "zip" qui permet de parcourir les deux listes à la fois. Celui-ci renvoie un "tuple" (une liste non modifiable) à chaque itération. Maintenant générons notre dictionnaire à l'aide de la syntaxe compréhensive :

In [None]:
l1 = ["kiwis", "melons", "oranges"]
l2 = [3, 12, 7]

{k: v for k, v in zip(l1, l2)}

Bien évidemment les structures conditionnelles (`if` et `else`) s'appliquent de la même manière que les listes compréhensives. Vérifiez ceci en effectuant l'exercice suivant :

# Exercice (moyen)

❓ **>>>** Créer un dictionnaire à partir des deux listes suivantes. Celle contenant les noms des produits alimentaires sera la clé, l'autre sera celle des valeurs. Faites en sorte que les contraintes suivantes soient respectées :

- Si la clé du dictionnaire fait plus de 6 caratères, la première lettre de la clé sera mise en majuscule. Autrement, si la clé fait 6 caractères ou moins, la clé entière devra être mise en majuscules.
- Si la valeur est égale à 0, remplacez-la par "out of stock".
- Les clés commençant par la lettre "c" et "b" (quelque soit leur casse) ne devront pas être prises en compte.


**ASTUCES**

- Utilisez `.upper()`afin de gérer la casse.
- Vous souvenez-vous de l'utilisation des *slices* ?
- Lorsqu'on applique ``len()`` sur une string, on obtient le nombre de caractères de la string.

In [None]:
food = ["Courgettes", "quiches", "aubergines", "croissants", "Baguettes", "kiwis", "melons", "oranges", "brioches"]
stock = [1, 0, 2, 16, 46, 0, 1, 4, 5]

# Code here!


## Exercice (difficile)

❓ **>>>** Utilisez la syntaxe compréhensive pour générer une liste de nombres et résoudre le problème suivant.

Trouvez un nombre de 6 chiffres dont :
- Le premier et le dernier chiffre sont les mêmes.
- Le premier chiffre multiplié par 2 produit un nombre à 2 chiffres.
- Ce nombre (le résultat du double du premier chiffre) est le deuxième et troisième chiffre.
- Le dernier chiffre multiplié par 3 donne un nombre à 2 chiffres.
- Ce nombre est le quatrième et cinquième chiffre.
- Le total de tous les 6 chiffres est égal 22.

**Astuce**:

- Commencer par créer une liste compréhensive qui génère la totalité des nombres réels possédant 6 chiffres. Puis utiliser des `if` et des `and` pour filtrer la liste

In [None]:
# Code here!



## Exercice (difficile)

❓ **>>>** Certains mots de la langue française ont une propriété singulière : leurs lettres sont disposées dans l'ordre alphabétique. Par exemple les mot "accent", "afflux" ou encore "dehors" partagent cette propriété.

Exécutez la cellule ci-dessous pour créer une liste contenant un grand nombre de mots de la langue française (environ 336 000), puis créez une liste compréhensive pour ne garder que les mots qui possèdent cette propriété et qui contiennent au moins 5 lettres.

**Librairies**: Pour mener à bien notre tâche nous utiliserons deux librairies, `requests` va nous permettre de récupérer des informations via internet. Quant à `unidecode` elle nous permettra de gérer les accents.

**Astuces**:

- La fonction `all` peut vous être très utile. Celle-ci prend en entrée une liste d'itérable et renvoie `true` si tous les éléments de cette liste sont `true`. Si au moins un des éléments est `false`, alors elle renvoie `false`.

Par exemple :

```python
all([True, False, True])
>>> False
```

Mais on peut aussi appliquer `all` sur des expressions ou des listes compréhensives, par exemple :

```python
l = [n**2 > 200 for n in range(13,17)]
all(l)
>>> False
```

Ou directement (notez l'absence de crochets "[ ]", c'est l'expression qu'on évalue pas la liste compréhensive): 

```python
all(n**2 > 200 for n in range(13,17))
>>> False
```

- Après avoir importé la fonction `unidecode` de cette manière :

```python
from unidecode import unidecode
```

On peut utiliser la fonction `unidecode()`, celle-ci va retirer les accents aux lettres, par exemple :

```python
unidecode("éèç9ÉEËëù")
>>> 'eec9EEEeu'
```

- La fonction `enumerate()` permet de récupérer deux variables quand on parcourt un itérable : son index, et l'élément. Par convention on nomme ceux-ci "i" et "el". Elle est très utile quand on veut comparer des caractères d'une string à d'autres caractères, puisqu'on peut accéder à n'importe quel caractère avec s[i] (où s est une string et i un index).

```python
for i, el in enumerate('Hey') : print(i, el)
>>> 0 H
>>> 1 e
>>> 2 y
```

- La fonction `ord()`renvoie la valeur représentant l’unicode d’un caractère spécifié.

```python
ord("a")
>>> 97
```

- Vous devez trouver 30 mots.

In [None]:
import requests
from unidecode import unidecode

r = requests.get('https://www.pallier.org/extra/liste.de.mots.francais.frgut.txt')
r.encoding = 'utf-8'
mots = [mot.lower() for mot in r.text.split()]
print(f"Nombre de mots dans la liste 'mots': {len(mots)}")

# code here!

