# ACTIVITE N°3 : MANIPULATION DE DONNEES DANS UNE BASE 
# -----------------------------A L'AIDE PYTHON------------------------------------

A partir de maintenant, vous avez les connaissances pour réaliser une application s'appuyant sur une base de données. Il ne reste plus qu'à les appliquer dans le cadre d'un mini projet. Un exemple de mini-projet possible dans le domaine du BigData consiste à récupérer des données officielles et à s'aider du langage SQL pour les exploiter.

## A) LE JEU DE DONNEES UTILISE

Une source intéressante pour récupérer des données est data.gouv.fr. Voici un exemple de jeu de données : [les données hospitalières liées au covid 19.](https://www.data.gouv.fr/fr/datasets/donnees-hospitalieres-relatives-a-lepidemie-de-covid-19/)

La description de chacun des fichiers se trouve ici :[ Ici](https://www.data.gouv.fr/fr/datasets/r/3f0f1885-25f4-4102-bbab-edec5a58e34a)

* Téléchargez le fichier donnees-hospitalieres-covid19-2020-08-14-19h00.csv le plus récent. Décompressez le et analysez sa structure.
* Créez une nouvelle base de données et au départ une seule table à l'intérieur : Resultat
* Créez dans chacune des tables une clé primaire nommée IdNomTable ainsi que des attributs correspondants aux intitulés de colonne
* A l'aide de Python, lisez chacun des fichiers et peuplez les tables correspondantes.
* Créez des requêtes SQL afin de vous renseigner sur l'évolution de la maladie en France et en Guyane.


## B) CREATION DE LA BASE

Nous créons d'abord la base.

In [None]:
import sqlite3
bdd = sqlite3.connect("COVID19_France_db")
curseur = bdd.cursor()

Puis nous incluons une table nommée.

In [None]:
# Creation table Communes
requete = """
CREATE TABLE RESULTATS
(
    Id INTEGER  PRIMARY KEY,
    departement INTEGER,
    sexe INTEGER,
    date TEXT,
    nombre_hosptalisees INTEGER,
    nombre_en_reanimation INTEGER,
    nombre_retour_domicile INTEGER,
    nombre_morts INTEGER
);"""
curseur.execute(requete)

# Creation de la table Resultats

# YOUR CODE HERE
# raise NotImplementedError()

# On enregistre les changements !

bdd.commit()

## C) ALIMENTATION DE LA BASE EN DONNEES

J'utilise le fichier csv fourni par l'état et j'entre les données du fichier ligne par ligne, en ajoutant ma clé, dans ma table.

In [None]:
# Exemple d'import d'un fichier CSV dans une BDD

import csv

with open('donnees-hospitalieres-covid19-2020-08-14-19h00.csv', newline='') as csvfile:
    nb_lignes = 0
    lignes = csv.reader(csvfile,delimiter=';')
    entete = True
    for l in lignes:
        if entete:
            entete = False
        else:
            nb_lignes += 1
            requete = f"""
            INSERT INTO RESULTATS
                (departement,sexe,date,nombre_hosptalisees,nombre_en_reanimation,nombre_retour_domicile,nombre_morts)
            VALUES
                (?, ?, ?, ?, ?, ?,?)
            """
            curseur.execute(requete, l)
    bdd.commit()
    print(f"{nb_lignes} enregistrements créés")

## D) RECUPERATION DE DONNES DE LA BASE ET INTERROGATION DE CELLE-CI

J'utilise le fichier csv fourni par l'état et j'entre les données du fichier ligne par ligne, en ajoutant ma clé, dans ma table.

In [None]:
requete = "SELECT * FROM RESULTATS;"
curseur.execute(requete)

Pour visualiser le résultat, deux solutions sont possibles, c'est à dire deux méthodes :
- fetchone() pour récupérer un résultat puis avancer le curseur d'un cran
- fetchall() pour récupérer d'un coup tous les résultats.

Regardons le résultat de la première méthode :




In [None]:
curseur.fetchone()

In [None]:
curseur.fetchall()

Donc la méthode envoie sous forme d'un tuple le premier uplet de la base.
Et la deuxième méthode renvoie l'intégralité des uplets de la base dans un tuple.
Attention, si vous avez utilisé la méthode fetchone() avant, vous avez décalé le curseur d'un rang et donc dans le tuple renvoyé par la fonction fetchall() il manque le premier uplet.

Encore une petite astuce, executer l'expression suivante :

In [None]:
curseur.description

Nous obtenons les noms des divers champs de la base.

In [None]:
[d[0] for d in curseur.description]

Nous obtenons dans un tableau l'ensemble des noms des attributs.

Executez le code suivant :

In [None]:
requete = "SELECT * FROM RESULTATS WHERE departement=973;"
curseur.execute(requete)
RESULTATS973 = curseur.fetchall()

In [None]:
print(RESULTATS974)

Que représente ces données ?
A vous de répondre :

..................  


..................  


.................. Maintenant regardez maintenant ce code, que fait-il ?

In [None]:
essai = [RESULTATS974[i][7] for i in range(len(RESULTATS974))]


In [None]:
import numpy as np
import matplotlib.pyplot as plt

x = [i for i in range(len(RESULTATS974))]
y = essai
plt.plot(x, y)

plt.show()

# affiche la figure a l'ecran

In [None]:
print(essai)

A vous de dire à quoi correspondent ces données et le graphe ?
''' Commentez 

........................................................................


......................................................................................


......................................................................................


..........................................................................Commentez'''

Apportez des modifications au code ci-dessus pour afficher des légendes au graphe.



## E) A VOUS DE JOUER

Vous allez compléter la base de données avec une nouvelle table DECES en France.
[Sur ce site](https://insee.fr/fr/statistiques/4487988?sommaire=4487854), vous trouverez toutes les informations nécessaires.

Compléter le code suivant :


In [None]:
# Creation table DECES a COMPLETER
requete = """
CREATE TABLE DECES
(
    Id INTEGER  PRIMARY KEY,
    ........ ...........,
    ........ ...........,
    ........ ...........,
    ........ ...........,
    ........ ...........,
    ........ ...........,
    ........ ...........,
    ........ ...........
);"""
curseur.execute(requete)

# Creation de la table Resultats

# YOUR CODE HERE
# raise NotImplementedError()

# On enregistre les changements !

bdd.commit()
# A compléter

#import csv

#with open('2020-31-07_deces_quotidiens_departement_csv.csv', newline='') as csvfile:
 #   nb_lignes = 0
 #  lignes = csv.reader(csvfile,delimiter=',')
 #   entete = True
 #   for l in lignes:
 #       if entete:
 #           entete = False
 #       else:
 #           nb_lignes += 1
 #           requete = f"""
 #           INSERT INTO DECES
 #               (date,....,....,....,..........,..........,............,Total_deces_2018)
 #           VALUES
 #               (?, ?, ?, ?, ?, ?,?)
 #           """
 #           curseur.execute(requete, l)
    bdd.commit()
    print(f"{nb_lignes} enregistrements créés")

Vérifiez que votre table a été créée en affichant les cimq premiers uplets.

In [None]:
requete = "SELECT * FROM DECES;"
curseur.execute(requete)
#A compléter
#A compléter
#A compléter
#A compléter

Déterminer le nombre de déces en Guyane en 2019.

In [None]:
#A compléter
#A compléter
#A compléter
#A compléter

Déterminer le nombre de déces en Guyane du au COVID-19 en 2019.

In [None]:
#A compléter
#A compléter
#A compléter
#A compléter

Comparez les deux valeurs et conclure.

.................................................................................................................

.................................................................................................................

Maintenant créer  un graphe avec deux courbes qui rendent compte de l'évolution des décès totales et ceux dus au COVID-19. 

In [None]:
#A compléter
#
import numpy as np
import matplotlib.pyplot as plt

# x = [i for i in range(len(.........))]
# y1 = ...........
# y2 = ...........
#
#
#
plt.plot(..........)

plt.show()

# affiche la figure a l'ecran

In [None]:
bdd.close()