# Boucles & Listes ++

Dans le notebook précédent, on appris à créer, manipuler et parcourir des listes, un type de collection Python important. Dans cette leçon, on va continuer à pratiquer et apprendre à :

- construire des listes avec des boucles `for`
- créer un index en cours d'exécution des éléments d'une liste avec `enumerate()`
- créer des boucles `for` d'une seule ligne avec des *list comprehensions*
- regrouper des listes avec `zip()`
- compter facilement les éléments dans une liste

Ces outils peuvent nous aider à :
- identifier combien de fois une certaine valeur apparaît dans les données (par exemple, la maladie dite "émigrant récent")
- changer programmatiquement toutes les valeurs vides dans les données (par exemple, d'une valeur vide à "aucune maladie enregistrée")
- trouver les valeurs les plus fréquentes et les moins fréquentes dans les données (par exemple, les "maladies" ou professions les plus courantes)

In [1]:
prenoms = ['Catherine', 'Thomas', 'Guillaume', 'Patrick', 'Marie-Anne', 'Morris',
               'Michaël', 'Hélène', 'James', 'Michaël', 'Hannah', 'Alexandre', 'Marie', 'Serena',
               'Marguerite', 'Michaël', 'Jane', 'Rosanna', 'James', 'Michaël', 'John', 'John', 'Marie',
               'Bantel', 'Marcella', 'Arthur', 'Michaël', 'Marie', 'Martin']


In [25]:
problemes = ['nouvel immigré', 'maladie', '', '', '', 'pauvreté', '', 'maladie', '',
            'maladie', 'nouvel immigré', '', 'aliéné', 'nouvel immigré', 'aliéné', '', '',
            'maladie', 'maladie', '', 'syphilis', 'maladie', '', 'nouvel immigré', 'pauvreté',
            'maladie', 'nouvel immigré', 'maladie', 'syphilis']


In [3]:
ages = ['22', '21', '23', '47', '45', '28', '23', '50', '26', '28', '30', '30', '65', '17', '35',
        '27', '32', '40', '22', '30', '27', '40', '41', '37', '16', '20', '30', '30', '35']

In [6]:
len(ages)

29

## Boucle For pour itérer sur tous les problèmes

In [7]:
for probleme in problemes:
    print(probleme)

nouvel immigré
maladie



pauvreté

maladie

maladie
nouvel immigré

aliéné
nouvel immigré
aliéné


maladie
maladie

syphilis
maladie

nouvel immigré
pauvreté
maladie
nouvel immigré
maladie
maladie


## Boucle for avec Enumerate

In [13]:
for index, probleme in enumerate(problemes):
    print(index, probleme)

0 nouvel immigré
1 maladie
2 
3 
4 
5 pauvreté
6 
7 maladie
8 
9 maladie
10 nouvel immigré
11 
12 aliéné
13 nouvel immigré
14 aliéné
15 
16 
17 maladie
18 maladie
19 
20 syphilis
21 maladie
22 
23 nouvel immigré
24 pauvreté
25 maladie
26 nouvel immigré
27 maladie
28 maladie


## Construire une liste avec une boucle for

On peut également créer des listes à l'aide de boucles `for`. Disons qu'on prenne cette liste `collection` et créer une nouvelle liste qui ne contient que les éléments de la liste qui correspondent à "l'élément voulu".

In [14]:
collection = ['item', 'item voulu', 'item', 'item', 'item voulu']

On peut donc créer une liste vide en assignant à la variable `liste_vide` la valeur `[]` - c'est-à-dire une liste sans éléments. Ensuite, on utilise une boucle `for` pour itérer à travers `collection`. Si un élément est égal à "l'élément voulu", alors nous utiliserons `.append()` pour ajouter cet élément à notre liste précédemment vide.

In [19]:
liste_vide = []
for elem in collection:
    if elem == 'item voulu':
        liste_vide.append(elem)

In [20]:
liste_vide

['item voulu', 'item voulu']

##### On prend dans une nouvelle liste les gens dont le problème est la syphilis

In [26]:
liste_vide = []
for elem in problemes:
    if elem == 'syphilis':
        liste_vide.append(elem)

In [27]:
liste_vide

['syphilis', 'syphilis']

##### On prend dans une nouvelle liste les problèmes des gens, et 'pas de problème' si ''

In [35]:
liste_problemes = []
for elem in problemes:
    if elem != '':
        liste_problemes.append(elem)
    else:
        liste_problemes.append('pas de probleme')

In [36]:
liste_problemes

['nouvel immigré',
 'maladie',
 'pas de probleme',
 'pas de probleme',
 'pas de probleme',
 'pauvreté',
 'pas de probleme',
 'maladie',
 'pas de probleme',
 'maladie',
 'nouvel immigré',
 'pas de probleme',
 'aliéné',
 'nouvel immigré',
 'aliéné',
 'pas de probleme',
 'pas de probleme',
 'maladie',
 'maladie',
 'pas de probleme',
 'syphilis',
 'maladie',
 'pas de probleme',
 'nouvel immigré',
 'pauvreté',
 'maladie',
 'nouvel immigré',
 'maladie',
 'syphilis']

## Zipper des listes ensembles

On peut également itérer à travers plusieurs listes en même temps en utilisant la fonction `zip()`, qui "assemble" essentiellement les listes ensemble.

In [33]:
noms_de_famille = ['Dupont', 'Lefebvre', 'Martin', 'Dubois', 'Moreau', 'Leroy', 'Simon', 'Laurent', 'Garcia', 'Fournier',
                  'Lambert', 'Roussel', 'Fontaine', 'Renaud', 'Guerin', 'Chevalier', 'Petit', 'Sanchez', 'Robert', 'Nguyen',
                  'Lemoine', 'Rousseau', 'Vincent', 'Marchand', 'Mathieu', 'Girard', 'Legrand', 'Mercier']


In [37]:
for x, y, z in zip(prenoms, noms_de_famille, liste_problemes):
    print(f"{x} // {y}// {z}")

Catherine // Dupont// nouvel immigré
Thomas // Lefebvre// maladie
Guillaume // Martin// pas de probleme
Patrick // Dubois// pas de probleme
Marie-Anne // Moreau// pas de probleme
Morris // Leroy// pauvreté
Michaël // Simon// pas de probleme
Hélène // Laurent// maladie
James // Garcia// pas de probleme
Michaël // Fournier// maladie
Hannah // Lambert// nouvel immigré
Alexandre // Roussel// pas de probleme
Marie // Fontaine// aliéné
Serena // Renaud// nouvel immigré
Marguerite // Guerin// aliéné
Michaël // Chevalier// pas de probleme
Jane // Petit// pas de probleme
Rosanna // Sanchez// maladie
James // Robert// maladie
Michaël // Nguyen// pas de probleme
John // Lemoine// syphilis
John // Rousseau// maladie
Marie // Vincent// pas de probleme
Bantel // Marchand// nouvel immigré
Marcella // Mathieu// pauvreté
Arthur // Girard// maladie
Michaël // Legrand// nouvel immigré
Marie // Mercier// maladie


#### Afficher seulement si l'âge est supérieure à 35

In [41]:
for x, y, z, w in zip(prenoms, noms_de_famille, liste_problemes, ages):
    if int(w) >= 35:
        print(f"{x} // {y}// {z}, ont plus de 35 ans")

Patrick // Dubois// pas de probleme, ont plus de 35 ans
Marie-Anne // Moreau// pas de probleme, ont plus de 35 ans
Hélène // Laurent// maladie, ont plus de 35 ans
Marie // Fontaine// aliéné, ont plus de 35 ans
Marguerite // Guerin// aliéné, ont plus de 35 ans
Rosanna // Sanchez// maladie, ont plus de 35 ans
John // Rousseau// maladie, ont plus de 35 ans
Marie // Vincent// pas de probleme, ont plus de 35 ans
Bantel // Marchand// nouvel immigré, ont plus de 35 ans


### Count Items In a List or Collection

Si vous souhaitez compter les éléments d'une liste ou d'une collection, vous pouvez utiliser le module `Counter` de la bibliothèque `collections`.

Pour utiliser cet outil, vous devez d'abord l'importer. L'instruction `import` est utilisée chaque fois que vous souhaitez importer un package ou une bibliothèque Python externe écrite par quelqu'un d'autre.

Le mot clé `from` nous permet d'importer un module spécifique à partir d'une bibliothèque plus large, dans ce cas, à partir de `collections`.

In [42]:
from collections import Counter

Maintenant que nous avons importé `Counter`, on peut l'utiliser. Pour compter les éléments d'une collection, il suffit d'insérer la collection à l'intérieur de la fonction `Counter()`.

In [47]:
dict(Counter(liste_problemes))['pas de probleme']

10

Cela nous donne un autre type de collection appelé *dictionnaire*, comme vu précédément. Ce dictionnaire inclut chaque élément de la liste et combien de fois il apparaît dans la liste.


#### Most_Common

Pour trier ce dictionnaire Counter en fonction des éléments les plus courants, nous pouvons utiliser la méthode `.most_common()`.

In [44]:
conteur_liste = Counter(liste_problemes)

In [49]:
conteur_liste.most_common(2)

[('pas de probleme', 10), ('maladie', 8)]

#### Les moins communs ?

In [None]:
conteur_liste.most_common()[-2:]

### Leçon Prochaine : Fonctions !!!

In [None]:
un exemple ?