# Séquence N°16 : Traitement des données en table
# TP N°1 : Traitement de données en table sous Python - Initiation

## 1. Lecture d'un fichier CSV en Python

Dans cette partie nous allons travailler avec le fichier `donnees-hospitalieres-nouveaux-covid19-2020-06-04-19h00.csv`. Il faut donc le placer dans le même dossier que ce notebook.

### a) Import du cvs dans python sous forme de liste de listes

Une première modélisation possible d'un tableau à double entrée est une liste de liste.

L'import se fait en trois temps :
* On crée un objet qui correspond au fichier (dans le code suivant, il s'agit de `fichier_csv`).
* On crée un objet `lecteur_csv` correspondant au fichier transformé en enregistrements grâce à la méthode `reader`(programmation orientée objet).
* On parcourt l'objet `lecteur_csv` et on stocke ces enregistrements dans la liste de listes.

On donne ci-dessous le code d'une fonction `charger_csv` qui reçoit en paramètre un nom de fichier (type chaîne de caractères) et qui renvoie une liste de listes modélisant la table donnée en paramètre.

In [8]:
# Chargement de la bibliothèque Python permettant le lire un fichier CSV
import csv

def charger_csv(nom_fichier):
    """Fonction qui permet d'importer les données du fichier csv sous forme de liste de listes 
    param nom_fichier : nom du fichier à importer - type str
    return liste : liste de listes
    """

    table = []  # table à retourner

    # import du fichier
    with open(nom_fichier,  # nom du fichier
              "r",          # ouverture en lecture
              newline="",   # évite les problèmes de codage du retour à la ligne
              encoding="utf-8"  # permet de forcer la lecture en utf-8
              ) as fichier_csv:     # cvsfile représente désormais le fichier que nous venons d'ouvrir.
        
        # création du lecteur csv indiquant le caractère séparateur
        lecteur_csv = csv.reader(fichier_csv, delimiter=";")
        for enreg in lecteur_csv:  # boucle de parcours des enregistrements
            # enreg est une liste de str contenant chaque ligne de l ' enregistrement
            table.append(enreg)
    return table

Proposer ci-dessous une instruction permettant de charger, dans une liste appelée `donnees_hopitaux`, la table associée au fichier sur le COVID.

In [27]:
# à toi de jouer !

<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Prise en main </strong>

1. Que représente `donnees_hopitaux[0]` ?
2. Que représente `donnees_hopitaux[1]` ?
3. De quel type sont les données chargées dans la liste `donnees_hopitaux` ?
4. Que représente `donnees_hopitaux[1][4]` ?
</div>

*Réponse aux questions 1 à 4*

**Remarque :**
Une autre écriture possible de la fonction précédente peut être :

In [26]:
# Chargement de la bibliothèque Python permettant le lire un fichier CSV
import csv

def charger_csv(nom_fichier):
    """Fonction qui permet d'importer les données du fichier csv sous forme de liste de listes 
    param nom_fichier : nom du fichier à importer - type str
    return liste : liste de listes
    """

    table = []  # table à retourner

    # ouverture du fichier CSV
    fichier_csv = open(nom_fichier, "r", newline="", encoding="utf-8") # On ouvre le fichier avec les mêmes paramétres que précédemment
    lecteur_csv = csv.reader(fichier_csv, delimiter=";")
    for enreg in lecteur_csv:  # boucle de parcours des enregistrements
        # enreg est une liste de str contenant chaque ligne de l'enregistrement
        table.append(enreg)
    fichier_csv.close() # Avec ce code, il faut fermer le fichier après la lecture.
    return table

Cette structure de données (liste de liste) présente un inconvénient majeur. Si on souhaite connaître la date associée à `donnees_hopitaux[1]` il faut connaître l'indice auquel se trouve cette information dans la liste. 
Pour palier à ce problème on peut utiliser une structure de données : les listes de dictionnaires.

### b) Import du cvs dans python sous forme d'une liste de dictionnaires.

On souhaite cette fois ci modéliser le tableau par une liste de dictionnaires où les clés des dictionnaires sont les descripteurs du tableau.

Comme pour le cas des listes de listes, l'import se fait en trois temps :
* On crée un objet qui correspond au fichier (dans le code suivant, il s'agit de `fichier_csv`).
* On crée un objet `lecteur_csv` correspondant au fichier transformé en enregistrements grâce à la méthode `DictReader`(programmation orientée objet).
* On parcourt l'objet `lecteur_csv` et on stocke ces enregistrements dans la liste de listes.

In [30]:
def charger_csv_dict(nom_fichier):
    """Fonction qui permet d'importer les données du fichier csv sous forme de liste de listes 
    param nom_fichier : nom du fichier à importer - type str
    return liste_dicos : liste de dictionnaires
    """

    liste_dicos = []  # table à retourner

    # import du fichier
    with open(nom_fichier, "r", newline="", encoding="utf-8") as fichier_csv:
        lecteur_csv = csv.DictReader(fichier_csv, delimiter=";") #le changement est ici par rapport à la structure précédente
        for enreg in lecteur_csv:  # boucle de parcours des enregistrements
            # enreg est une liste de str contenant chaque ligne de l ' enregistrement
            liste_dicos.append(dict(enreg))
    return liste_dicos

Proposer ci-dessous une instruction permettant de charger, dans une liste appelée `donnees_hopitaux`, la table associée au fichier sur le COVID.

In [38]:
# TODO

<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Prise en main </strong>

1. Que représente `donnees_hopitaux[0]` ?
2. Que représente `donnees_hopitaux[1]` ?
3. Comment récupérer Nombre quotidien de personnes nouvellement dans le départemet 01 le 19/03/2020 ?
</div>

**Remarque :**
Une autre écriture possible de la fonction précédente peut être :

In [56]:
# Chargement de la bibliothèque Python permettant le lire un fichier CSV
import csv

def charger_csv_dict(nom_fichier):
    """Fonction qui permet d'importer les données du fichier csv sous forme de liste de listes 
    param nom_fichier : nom du fichier à importer - type str
    return liste_dicos : liste de dictionnaires
    """

    liste_dicos = []  # table à retourner

    # import du fichier
    fichier_csv = open(nom_fichier, "r", newline="", encoding="utf-8")
    lecteur_csv = csv.DictReader(fichier_csv, delimiter=";")
    for enreg in lecteur_csv:  # boucle de parcours des enregistrements
        # enreg est une liste de str contenant chaque ligne de l'enregistrement
        liste_dicos.append(dict(enreg))
    fichier_csv.close() # Avec ce code, il faut fermer le fichier après la lecture.
    return liste_dicos

## 2. Traitement de données

Maintenant que nous savons charger le contenu d'une fichier CSV dans une structure adaptée (liste de listes ou liste de dictionnaires), nous allons maintenant traiter les informations contenues dans cette table.

Pour répondre aux questions suivantes, nous allons utiliser comme structure la liste de dictionnaires.

<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Question 1 </strong>

1. Proposer le code d'une fonction `nb_rea` qui reçoit en paramètres une liste de dictionnaires et qui retourne le nombre total de personnes admises en réanimation sur l'ensemble de enregistrements.<br/>
Vérifier à l'aide d'un `assert` que ce nombre est de 17642.

2. Proposer le code d'une fonction `nb_rea_date` qui reçoit en paramètres une liste de dictionnaires et qui retourne le nombre total de personnes admises en réanimation pour une date donnée.<br/>
Vérifier à l'aide d'un `assert` que ce nombre est de 208 pour le 20 avril 2020.

</div>

In [None]:
def nb_rea(liste):
    pass

def nb_rea_date(liste, date):
    pass

<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Question 2 </strong>

Proposer un script Python permettant de déterminer la date du pic de l'épidémie dans les hopitaux en terme d'admission de patients infectés par le COVID-19 en réanimation.

</div>

In [None]:
# A vous de jouer !

<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Question 3 </strong>

On souhaite déterminer les départements et les jours durant lesquels les admissions en réanimation étaient supérieurs à 60.
L'information sera données sur la forme d'une liste de tuple où les tupes seront de la forme `(departement, date)`.<br/>

Idéalement cette liste pourra être créée par compréhension :).

</div>

In [64]:
# Courage ... ça tient en une ligne :)

<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Question 4 </strong>

Proposer un script Python d'une fonction `max_rea` qui reçoit en paramètre la table des données de l'épidémie et qui renvoie, sous la forme d'un tuple,
la date et le département où le nombre d'admission en réanimation a été le plus élève. Vous pourrez comparer votre résultat aec celui obtenu avec le tableur.
</div>

In [69]:
def max_rea(liste):
    pass

## 3. Petit exercice pour finir sur d'autres données

<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Exercice 4 </strong>

On s'intéresse au fichier `villes.csv` qui contient des informations sur les 36700 communes de France.

1. Après avoir déterminer le séparateur utilisé dans ce fichier CSV, l'importer l'ensemble des enregistrements dans une variable `liste_communes` dont la structure de données sera une liste de dictionnaires.
2. Proposer le script d'une fonction `caract_commune` qui 
    * reçoit en paramètres `liste_communes` et une commune (sous forme de chaîne de caractères)
    * qui renvoie les caractéristiques de cette commune sous la forme d'une dictionnaire.
    
3. Proposer un script permettant de déterminer la commune ayant la plus grande altitude maximale. <br/>
Attention certaines communes n'ont pas d'altitude max de renseignée ...

</div>

In [None]:
# Importation du contenu du fichier CSV à faire ici

In [None]:
def caract_commune(liste_communes, commune):
    pass

# Tester cette fonction avec votre commune

In [70]:
# Script pour la question 3