# Boucles & Listes ++

Dans le notebook précédent, on appris à créer, manipuler et parcourir des listes, un type de collection Python important. Dans cette leçon, on va continuer à pratiquer et apprendre à :

- construire des listes avec des boucles `for`
- créer un index en cours d'exécution des éléments d'une liste avec `enumerate()`
- créer des boucles `for` d'une seule ligne avec des *list comprehensions*
- regrouper des listes avec `zip()`
- compter facilement les éléments dans une liste

Ces outils peuvent nous aider à :
- identifier combien de fois une certaine valeur apparaît dans les données (par exemple, la maladie dite "émigrant récent")
- changer programmatiquement toutes les valeurs vides dans les données (par exemple, d'une valeur vide à "aucune maladie enregistrée")
- trouver les valeurs les plus fréquentes et les moins fréquentes dans les données (par exemple, les "maladies" ou professions les plus courantes)

In [None]:
prenoms = ['Catherine', 'Thomas', 'Guillaume', 'Patrick', 'Marie-Anne', 'Morris',
               'Michaël', 'Hélène', 'James', 'Michaël', 'Hannah', 'Alexandre', 'Marie', 'Serena',
               'Marguerite', 'Michaël', 'Jane', 'Rosanna', 'James', 'Michaël', 'John', 'John', 'Marie',
               'Bantel', 'Marcella', 'Arthur', 'Michaël', 'Marie', 'Martin']


In [None]:
problemes = ['nouvel immigré', 'maladie', '', '', '', 'pauvreté', '', 'maladie', '',
            'maladie', 'nouvel immigré', '', 'aliéné', 'nouvel immigré', 'aliéné', '', '',
            'maladie', 'maladie', '', 'syphilis', 'maladie', '', 'nouvel immigré', 'pauvreté',
            'maladie', 'nouvel immigré', 'maladie', 'syphilis']

In [None]:
ages = ['22', '21', '23', '47', '45', '28', '23', '50', '26', '28', '30', '30', '65', '17', '35',
        '27', '32', '40', '22', '30', '27', '40', '41', '37', '16', '20', '30', '30', '35']

## Boucle For pour itérer sur tous les problèmes

Et en affichant tous les problèmes non vides ? 

## Boucle for avec Enumerate

`enumerate` est une fonction qu'on utilise pour ajouter, dans une boucle `for`, les indices de progression. 
La fonction s'applique sur l'élément itérables (la liste le plus souvent), et génère une nouvelle variables.

In [None]:
## Syntaxe de base
for index, valeur in enumerate(problemes):
    print(valeur)

## Construire une liste avec une boucle for

On peut également créer des listes à l'aide de boucles `for`. Disons qu'on prenne cette liste `collection` et qu'on veuille créer une nouvelle liste qui ne contient que les éléments de la liste qui correspondent à "l'élément voulu".

In [None]:
collection = ['item', 'item voulu', 'item', 'item', 'item voulu']

On peut donc créer une liste vide en assignant à la variable `liste_vide` la valeur `[]` - c'est-à-dire une liste sans éléments. Ensuite, on utilise une boucle `for` pour itérer à travers `collection`. Si un élément est égal à "l'élément voulu", alors nous utiliserons `.append()` pour ajouter cet élément à notre liste précédemment vide.

In [None]:
liste_vide = []
##

In [None]:
liste_vide

##### On prend dans une nouvelle liste les gens dont le problème est la syphilis

##### On prend dans une nouvelle liste les problèmes des gens, et 'pas de problème' si ''


## Zipper des listes ensembles

On peut également itérer à travers plusieurs listes en même temps en utilisant la fonction `zip()`, qui "assemble" essentiellement les listes ensemble.
L'idée, c'est que `zip` permet de prendre des listes (qui sont des objets différents) et de parcourir un seul objet qui combine des liste zippées ensemble.

Attention, `zip` s'arrête à la fin de la liste la plus courte, et est sensible à l'ordre des listes.

In [None]:
noms_de_famille = ['Dupont', 'Lefebvre', 'Martin', 'Dubois', 'Moreau', 'Leroy', 'Simon', 'Laurent', 'Garcia', 'Fournier',
                  'Lambert', 'Roussel', 'Fontaine', 'Renaud', 'Guerin', 'Chevalier', 'Petit', 'Sanchez', 'Robert', 'Nguyen',
                  'Lemoine', 'Rousseau', 'Vincent', 'Marchand', 'Mathieu', 'Girard', 'Legrand', 'Mercier']


#### Afficher seulement si l'âge est supérieure à 35

### Count Items In a List or Collection

Si vous souhaitez compter les éléments d'une liste ou d'une collection, vous pouvez utiliser le module `Counter` de la bibliothèque `collections`.

`collections` est une bibliothèque Python intégrée qui fournit des alternatives spécialisées aux types de conteneurs Python généraux tels que les dictionnaires, les listes, les ensembles et les tuples. `Counter` est un sous-module de `collections` qui permet de compter les objets "hashables" (ou itérables qui peuvent être découpé, indéxé etc...). (pour plus d'information voir la [documentation officielle](https://docs.python.org/3/library/collections.html#collections.Counter)).


Pour utiliser cet outil, vous devez d'abord l'importer. L'instruction `import` est utilisée chaque fois que vous souhaitez importer un package ou une bibliothèque Python externe écrite par quelqu'un d'autre.

Le mot clé `from` nous permet d'importer un module spécifique à partir d'une bibliothèque plus large, dans ce cas, à partir de `collections`.

In [None]:
from collections import Counter


Maintenant que nous avons importé `Counter`, on peut l'utiliser. Pour compter les éléments d'une d'un élément hashable, il suffit de l'insérer à l'intérieur de la fonction `Counter()`.

In [None]:
problemes

Cela nous donne un autre type de collection appelé *dictionnaire*, comme vu précédément. Ce dictionnaire inclut chaque élément de la liste et combien de fois il apparaît dans la liste.

Essayer de faire la même chose avec un dictionnaire, une chaîne de caractère ou un nombre entier : qu'est ce que le ça donne ?

In [None]:
## Essayez ici ! 


#### Most_Common

Pour trier ce dictionnaire Counter en fonction des éléments les plus courants, nous pouvons utiliser la méthode `.most_common()`.

In [None]:
conteur_liste = Counter(problemes)

#### Les moins communs ?

Il n'exite pas de méthode native pour trouver les éléments les moins communs, il va falloir ruser ! 
Comme les éléments sont ordonnées, les moins communs sont... les derniers ! 


### Leçon Prochaine : Fonctions !!!

In [None]:
def most_common(collection, n=3):
    conteur = Counter(collection)
    return conteur.most_common(n)


