# TP N°2 - Traitement de données en table
# Implantation d'Eoliennes en Eure et Loir

Le département de l’Eure-et-Loir décide de développer son parc éolien à l’horizon 2025.
Pour cela un bureau de la préfecture est chargé de définir les lieux potentiellement éligibles pour accueillir un futur parc éolien, et il fait appel à vous pour le faire de façon automatique grâce à un script Python.

Pour être éligible, la commune devra avoir moins de 1000 habitants et être située à une altitude supérieure à 200 mètres . Il y aura maximum 8 parcs de créer. Si le nombre de communes éligibles est supérieur à 8, ce seront celles qui ont la plus grande superficie qui seront retenues.

Pour cela, le bureau décide de référencer toutes les communes du département et d’en extraire les communes éligibles. Il dispose d’un fichier au format csv , récupéré sur data.gouv.fr . Malheureusement ce fichier contient toutes communes de la région Centre val de Loire. Et des renseignements inutiles pour la problématique.


## 1. Préliminaires

#### a) Réaliser un fichier CSV à partir de Python

On considère la fonction `export_fichier_csv` suivante. Exécuter le code et compléter la documentation de la fonction.

In [68]:
import csv

liste = [{'a':0,'b':2}, {'a':5,'b':6}, {'a':-3,'b':3}]

def export_fichier_csv(nom_fichier, liste_enregistrements, separateur):
    """
    Rôle de la fonction : exporter une liste d'enregistrements en un fichier au format CSV
    param nom_fichier : type str - nom au format CSV qui contient les données exportées
    param liste_enregistrements : type liste de dict. liste des enregistrements à enregistrer dans le fichier CSV créé
    param separateur : type str - séparateur utilisé par le fichier CSV.
    """

    with open(nom_fichier, 'w', newline='', encoding="utf-8") as csvfile:
        writer = csv.DictWriter(csvfile,
                                fieldnames=list(liste_enregistrements[0].keys()),
                                delimiter=separateur)

        # Ecriture de la premiere ligne du fichier CSV avec le nom des descripteurs
        writer.writeheader()

        # Export de tous les enregistrements de la liste
        for enregistrement in liste_enregistrements:
            writer.writerow(enregistrement)

export_fichier_csv('essai.csv',liste,";")
# Youpi le fichier essai.cvs est créé dans le répertoire courant avec les infos de la liste :)

### b) Trier une liste de dictionnaires selon une clé

Si `liste = [5,1,7,3]`, pour trier la `liste`, on peut utiliser la méthode `liste.sort()`. 

In [5]:
liste = [5,1,7,3]

sorted(liste)
print(liste)
# sorted(liste) renvoie une liste triée mais ne modifie la liste initiale.

liste.sort()
print(liste)
#liste est modifiée et se retrouvée triée

# pour trier par ordre décroissant, on peut utiliser l'option reverse comme ci-dessous :
liste.sort(reverse = True)
print(liste)

[5, 1, 7, 3]
[1, 3, 5, 7]
[7, 5, 3, 1]


Mais comment trier `liste = [('Bob', 25),('Alice', 17),('Corale', 15)]` ?

In [8]:
liste = [('Bob', 25),('Carole', 15), ('Alice', 17)]

# Pour trier cette liste selon le premier élément de chaque tuple
def choix_param_tri(elt):
    return elt[0]

liste.sort(key = choix_param_tri) 
# key reçoit une fonction, cette fonction reçoit en paramètre un élément de la liste et retourne le critère de tri 
# ici elt[0]
print(liste)

# Autre codage possible plus concis
liste = [('Bob', 25), ('Carole', 15), ('Alice', 17)]
liste.sort(key = lambda elt:elt[0])
# lambda est une fonction où elt est un paramètre et elt[0] est la valeur retournée
print(liste)

[('Alice', 17), ('Bob', 25), ('Carole', 15)]
[('Alice', 17), ('Bob', 25), ('Carole', 15)]


<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> A faire </strong>
</div>

In [12]:
liste = [('Bob', 25), ('Carole', 15), ('Alice', 17)]
# Proposer un code permet de trier liste par ordre décroissant, en utilisant comme critère de tri 
# le deuxième elt de chaque tuple

liste.sort(key = lambda elt: elt[1], reverse = True)
print(liste)

[('Bob', 25), ('Alice', 17), ('Carole', 15)]


In [15]:
liste = [{'a':0,'b':2},{'a':5,'b':6},{'a':-3,'b':3}]
# Proposer un code permettant de trier la liste par ordre croissant en utilisant comme critère de tri
# la valeur associée à la clé 'b'.

liste.sort(key = lambda elt: elt['b'])
print(liste)

[{'a': 0, 'b': 2}, {'a': -3, 'b': 3}, {'a': 5, 'b': 6}]


## 2. Retour au projet

L'ensemble des communes de la région Centre Val de Loire, sont répertoriées, avec leurs caractéristiques dans le fichier `communes_2016.csv`.

<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Importation des données </strong>

1. On souhaite importer les données de la table sur la forme d'une liste de dictionnaires.<br/>
Ces informations seront stockées dans une liste appelée `liste_communes`.

2. Compléter le code pour afficher la liste des descripteurs.
</div>

In [1]:
# Code pour importer les données du fichier CSV
import csv

def charger_csv_dict(nom_fichier):
    """Fonction qui permet d'importer les données du fichier csv sous forme de liste de listes 
    param nom_fichier : nom du fichier à importer - type str
    return liste_dicos : liste de dictionnaires
    """

    liste_dicos = []  # table à retourner

    # import du fichier
    with open(nom_fichier, "r", newline="", encoding="utf-8") as fichier_csv:
        lecteur_csv = csv.DictReader(fichier_csv, delimiter=";") #le changement est ici par rapport à la structure précédente
        for enreg in lecteur_csv:  # boucle de parcours des enregistrements
            # enreg est une liste de str contenant chaque ligne de l ' enregistrement
            liste_dicos.append(dict(enreg))
    return liste_dicos

liste_communes = charger_csv_dict('communes_2016.csv')

# Code pour afficher la liste des descripteurs
print("l'ensemble des descripteurs est :")
for cle in liste_communes[0].keys():
    print(cle)

l'ensemble des descripteurs est :
Geo Point
Geo Shape
ID
Code Commune
Code Insee
Commune
X Chf Lieu
Y Chf Lieu
X Centroid
Y Centroid
Altitude Moyenne
Superficie
Population
Code Canton
Code Arrondissement
Code Département
Année
Région
Département
Statut
Code Région
Code EPCI


<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Sélection des données </strong>

1. Avant de s’intéresser à proprement parler au problème éolien, il faut modifier les données pour ne garder que les champs pertinents évoqués dans la présentation du projet.<br/>
Ecrire le code de la fonction `selection_descripteurs` suivante.
2. Ecrire le script d'une fonction `selection_departement` qui reçoit en paramètres une liste d'enregistrements et un département et qui retourne la liste d'enregistrements avec uniquement les enregistrements du département entré en paramètre.
</div>

In [6]:
from pprint import pprint

def selection_descripteurs(liste_enregistrements, liste_champs):
    """
    param liste_enregistrements: liste de dictionnaires (liste des enregistrements d'une table)
    param liste_champs: liste de str correspon à la liste des descripteurs à conserver
    return: liste_enregistrements avec les clés des descripteurs inutiles supprimés.
    """
    liste_descripteurs = list(liste_enregistrements[0].keys())
    for enregistrement in liste_enregistrements:
        for cle in liste_descripteurs:
            if cle not in liste_champs:
                del(enregistrement[cle])
    return liste_enregistrements


def selection_departement(liste_enregistrements, departement):
    """
    Fonction qui retourne la liste liste_enregistrements avec uniquement les enregistrements de département donné
    en paramètre.
    param liste_communes: liste de dictionnaires (liste des enregistrements d'une table)
    param departement: chaine de caractères : numéro du département à sélectionner
    return: liste_enregistrements modifiée.
    """
    liste_communes_departement = []
    for enregistrement in liste_enregistrements:
        if enregistrement['Code Département'] == departement:
            liste_communes_departement.append(enregistrement)
    return liste_communes_departement
    

# afficher le premier enregistrement pour vérifier le bon fonctionnement de la première fonction
liste_communes = charger_csv_dict('communes_2016.csv')
selection_descripteurs(liste_communes,['ID', 'Code Département'])
pprint(liste_communes[0])

# vérifier le bon fonctionnement de la deuxième fonction.
#liste_communes = charger_csv_dict('communes_2016.csv')
liste_departement = selection_departement(liste_communes,'28')
pprint(liste_departement)


{'Code Département': '36', 'ID': 'COMMUNE00000000000030834'}
[{'Code Département': '28', 'ID': 'COMMUNE00000000000030712'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000012611'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000005889'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000014902'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000012731'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000023707'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000031724'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000034204'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000011597'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000020518'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000031963'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000015083'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000029479'},
 {'Code Département': '28', 'ID': 'COMMUNE00000000000011535'},
 {'Code Département': '28', 'ID': 'COMMUNE000000000000118

<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Choix des communes candidates </strong>

Ecrire le script d'une fonction `selection_criteres` qui reçoit en paramètre une liste d'enregistrements et qui renvoie la liste des enregistrements répondant aux critères pour installer des éoliennes.
</div>

In [46]:
def selection_criteres(liste_enregistrements):
    liste_criteres = []
    for enregistrement in liste_enregistrements:
        if (int(enregistrement['Altitude Moyenne']) > 200) and (float(enregistrement['Population']) < 1000):
            liste_criteres.append(enregistrement)
    return liste_criteres

<div class="alert alert-info">
    
<strong class='fa fa-cogs' style="color: darkorange"> Edition des communes retenues </strong>

1. Donner le script d'un algorithme permettant de déterminer les communes retenues pour l'implantation des éoliennes.
2. Enregistrer ces communes et leurs caractéristiques retenues dans un fichier `communes_retenues.csv`.
</div>

In [73]:
# Question 1
# Script pour trouver les communes retenues. Il faut sélectionner les 8 qui ont la plus grande superficie

def tri_communes_superficie(liste_enregistrements):
    """
    Fonction qui reçoit une liste de communes (liste de dictionnaires) et qui retourne la liste des 8 communes ayant la plus grande superficie
    """
    if len(liste_enregistrements) <=8:
        return liste_enregistrements
    else:
        liste_enregistrements.sort(key = lambda commune:int(commune['Superficie']), reverse = True)
        liste_communes_retenues = []
        for i in range(8):
            liste_communes_retenues.append(liste_enregistrements[i])
        return liste_communes_retenues
        # On peut remplacer la boucle par du slicing en faisant return liste_communes[0:8]

        
        
# On donne ici la liste des descripteurs à retenir
liste_descripteurs = ['Code Insee', 'Commune', 'Altitude Moyenne', 'Superficie', 'Population', 'Code Département']
liste_communes = charger_csv_dict('communes_2016.csv')
selection_descripteurs(liste_communes, liste_descripteurs)
# il n'est pas nécessaire de faire une affectation car liste_communes est modifiée

liste_communes = selection_departement(liste_communes, '28')
liste_criteres = selection_criteres(liste_communes)

#pprint(liste_criteres)
# il n'est pas nécessaire de faire une affectation car liste_communes est modifiée
liste_communes_retenues = tri_communes_superficie(liste_criteres)

# Question 2 : enregistrement dans un fichier csv
export_fichier_csv('communes_retenues.csv',liste_communes_retenues,";")