# TP Départements - CORRECTION

## Traitements de données en tables

Dans ce TP nous allons traiter un fichier de données structurées au format `CSV` à l'aide de la bibliothèque Python `csv` déjà utilisée dans le TP sur les prénoms.

Le fichier utilisé, <a href="departement_francais.csv"><b>departement_francais.csv</b></a> est issu du site  https://www.data.gouv.fr .  
Il contient la liste des départements français avec comme ligne d'entête les champs suivants :
<ul>
    <li>
        <b>Numéro</b> : Numéro du département
    </li>
    <li>
        <b>Département</b> : nom du département
    </li>
    <li>
        <b>Superficie</b> : en km²
    </li>
    <li>
        <b>Population</b>
    </li>
</ul>

## 1. Lecture du fichier `departement_francais.csv`  

Uploader dans Jupyter le fichier csv puis éxécuter le code ci-dessous pour afficher la liste des départements :

In [1]:
import csv
FICHIER_DEPARTEMENTS = "departement_francais.csv"

def lit_fichier_csv(nom_fichier):
    f = open(nom_fichier,encoding="utf-8")
    reader = csv.reader(f)
    #reader = csv.DictReader(f)
    donnees = [ligne for ligne in reader]
    return donnees[1:]

donnees = lit_fichier_csv(FICHIER_DEPARTEMENTS)
for ligne in donnees[:10]:
    print(ligne)

['1', 'Ain', '5762', '638425']
['2', 'Aisne', '7369', '536136']
['3', 'Allier', '7340', '339384']
['4', 'Alpes-de-Haute-Provence', '6925', '162565']
['5', 'Hautes-Alpes', '5549', '141107']
['6', 'Alpes-Maritimes', '4299', '1083704']
['7', 'Ardèche', '5529', '325157']
['8', 'Ardennes', '5229', '275371']
['9', 'Ariège', '4890', '153067']
['10', 'Aube', '6004', '308910']


### Remarques :
La fonction `lit_fichier_csv(nom_fichier)` lit le fichier `nom_fichier` qui est passé en paramètre et renvoie une liste de listes contenant chaque ligne du fichier sauf la ligne d'entête.


## Exercice 1
- Compléter la documentation (*docstring*) de la fonction `nom_departement(numero)` qui doit renvoyer le nom du département correspondant au `numero` passé en paramètre si le numéro de département est bien présent dans le fichier ou bien "Numéro de département inconnu" sinon.  
- Ajouter un ou deux tests unitaires `assert`  
**Attention au type de données** du numéro de département renvoyé par la fonction `lit_fichier_csv(nom_fichier)`  

In [2]:
def nom_departement(numero):
    '''la fonction prend en argument un numero de département 
    de type int ou string et renvoie en chaine de caractères
    le nom du département ou le message département inconnu '''
    donnees = lit_fichier_csv(FICHIER_DEPARTEMENTS)
    for d in donnees:
        if d[0] == str(numero):
            return d[1]
    return "Numéro de département inconnu"


# Ajouter ici les tests unitaires
assert nom_departement(1)=='Ain'
assert nom_departement('2B')== 'Haute-Corse'
assert nom_departement(100)=="Numéro de département inconnu"

In [3]:
print(nom_departement(84))

Vaucluse


## Exercice 2

- En vous aidant du code précédent, compléter la fonction `numero_departement(nom)` qui doit retourner le numéro du département correspondant au `nom` du département passé en paramètre si le nom de département est bien présent dans le fichier ou bien "Nom de département inconnu" sinon.  
- Compléter également la documentation et ajouter un ou deux tests `assert`

In [4]:
def numero_departement(nom):
    '''La fonction prend en argument un string nom
    et renvoie un string correspondant au numéro du département
    ou un message si nom n est pas un département '''
    donnees = lit_fichier_csv(FICHIER_DEPARTEMENTS)
    for d in donnees:
        if d[1]==nom:
            return d[0]
    return 'Nom de département inconnu'

In [5]:
help(numero_departement)

Help on function numero_departement in module __main__:

numero_departement(nom)
    La fonction prend en argument un string nom
    et renvoie un string correspondant au numéro du département
    ou un message si nom n est pas un département



In [6]:
# Vos tests unitaires ici
assert numero_departement('Ain')=='1'
assert numero_departement('Vaucluse')=='84'
assert numero_departement('bouches-du-rhone')=='Nom de département inconnu'

In [7]:
print(numero_departement('Bouches-du-Rhône'))

13


## Exercice 3

- En vous aidant du code de l'**Exercice 1**, compléter la fonction `superficie_et_population_departement(numero)` qui doit renvoyer la superficie et la population département correspondant au `numero` du département passé en paramètre si le numéro du département est bien présent dans le fichier ou bien "Numéro de département inconnu" sinon.  
- Compléter également la documentation et ajouter un ou deux tests `assert`

In [8]:
def superficie_et_population_departement(numero):
    '''La fonction prend en argument un numero de département 
    de type int ou string et renvoie :
    - un tuple de deux integer, la superficie et la population si numero est un numero valide de département
    - le message Numéro de département inconnu, sinon '''
    donnees = lit_fichier_csv(FICHIER_DEPARTEMENTS)
    # votre code ici
    for d in donnees:
        if d[0] == str(numero):
            return int(d[2]),int(d[3])
    return "Numéro de département inconnu"

In [9]:
# Vos tests unitaires ici
assert superficie_et_population_departement(1)==(5762,638425)
assert superficie_et_population_departement('2B')==(4666,176152)
assert superficie_et_population_departement(100)=='Numéro de département inconnu'

In [10]:
surface,effectif = superficie_et_population_departement(13)
print('Superficie BdR :',surface,'km^2 et population :',effectif)

Superficie BdR : 5087 km^2 et population : 2019717


## Exercice 4

- Compléter la fonction `intervalle_population(mini,maxi)` qui doit retourner la liste des noms des départements dont la population est comprise dans l'intervalle [min,maxi].  
- Compléter également la documentation et ajouter un ou deux tests `assert`

In [11]:
def intervalle_population(mini,maxi):
    '''La fonction prend en arguments deux entiers : mini et maxi 
    et renvoie dept une liste de noms de département dont la population est comprise entre mini et maxi'''
    donnees = lit_fichier_csv(FICHIER_DEPARTEMENTS)
    # votre code ici
    dept = []
    for d in donnees:
        if int(d[3])>=mini and int(d[3])<=maxi:
        # if mini <= int(d[3]) <= maxi :   
            dept.append(d[1])    
    return dept

In [12]:
# Vos tests unitaires ici
assert intervalle_population(0,100)==[]
assert intervalle_population(0,100000)==['Lozère']
assert intervalle_population(2000000,5000000)==['Bouches-du-Rhône', 'Nord', 'Paris']

In [13]:
intervalle_population(550000,600000)

["Côtes-d'Armor", 'Marne', 'Saône-et-Loire', 'Sarthe', 'Somme', 'Vaucluse']

## Exercice 5

- Compléter la fonction `top_population(nb)` qui doit renvoyer la liste des <code>nb</code> départements les plus peuplés.  
- On retournera une **liste de dictionnaires** dont la **clef** sera le nom du département et la **valeur** le nombre d'habitants du département.

In [14]:
def top_population(nb):
    '''La fonction prend en argument un entier nb
    et renvoie dico un dictionnaire de nb départements
    ayant pour chaque cle le nom du département et pour valeur sa population '''
    donnees = lit_fichier_csv(FICHIER_DEPARTEMENTS)
    donnees_triees = sorted(donnees, key=lambda d:int(d[3]), reverse=True)
    # votre code ici
    dico={}
    for d in donnees_triees[:nb]:
        dico[d[1]]=d[3]
    return dico

In [15]:
# Vos tests unitaires ici
assert top_population(0)=={}
assert top_population(2)=={'Nord': '2603723', 'Paris': '2190327'}

<p>Utiliser les fonctions précédentes pour déterminer le département le plus densemment peuplé et le département le moins densemment peuplé.</p>

In [16]:
print('Le plus peuplé :',top_population(1))

Le plus peuplé : {'Nord': '2603723'}


In [17]:
def flop_population(nb):
    '''La fonction prend en argument un entier nb
    et renvoie dico un dictionnaire de nb départements
    ayant pour chaque cle le nom du département et pour valeur sa population '''
    donnees = lit_fichier_csv(FICHIER_DEPARTEMENTS)
    donnees_triees = sorted(donnees, key=lambda d:int(d[3]))
    # votre code ici
    dico={}
    for d in donnees_triees[:nb]:
        dico[d[1]]=d[3]
    return dico

In [18]:
print('Le moins peuplé :',flop_population(1))

Le moins peuplé : {'Lozère': '76422'}


## Exercice 6
Déterminer enfin la superficie totale du territoire français (métropole uniquement) en écrivant le corps de la fonction `superficie_territoire_francais()`. Vous effectuerez pour cela la somme des superficies de chaque département.

In [19]:
def superficie_territoire_francais():
    '''La fonction renvoie total un entier correspondant à la superficie totale 
    du territoire français métropole uniquement'''
    donnees = lit_fichier_csv(FICHIER_DEPARTEMENTS)
    # votre code ici
    total = 0
    for d in donnees:
        if d[0]<'970':
            total+=int(d[2])
    return total

In [20]:
superficie_territoire_francais()

543948

Comparer le résultat de votre programme avec celui donné officiellement.  
Comment expliquer la différence ?