# Aéroports du monde


En prenant pour prétexte un fichier de données recensant un très grands nombre d'aéroports, nous allons travailler les méthodes vues en cours pour : 
- importer un fichier csv
- sélectionner des données
- trier des données

Pour fonctionner, ce notebook doit être dans le même répertoire (ou dossier) que le dossier `.\airports\` qui contient deux fichiers CSV : `.\airports\airports.csv` et `.\airports\countries.csv`

# 1) Pour commencer : fichier que nous allons exploiter

In [None]:
import csv

def charger_fichier( nom_fic ):
    """
    Permet de lire un fichier CSV en utilisant la ligne d'entêtes
    Retourne une liste de dictionnaires.
    """
    table = []
    fichier_csv = open( nom_fic , "r", newline ="", encoding ="utf-8" )
    lecteur_fichier = csv.DictReader( fichier_csv , delimiter =",")    
    for enreg in lecteur_fichier :
        table.append (dict ( enreg )) # enreg est de type OrderedDict on le remet endict
    fichier_csv.close()    
    return table

In [None]:
table_aeroports = charger_fichier('.\\airports\\airports.csv')

In [None]:
table_aeroports[0]

<div class = "alert alert-info">  


**Question**  


Exécuter les deux cellules de code ci-dessus : 
    
- Quel est l'encodage du fichier CSV utilisé ? utf-8

- Quel est le séparateur du fichier CSV utilisé ? la virgule
    
- Quel est le nom de variable de la table qui a été créée dans python ? `table_aeroports`

- Combien de champs (ou colonnes) comporte cette table ? Quels sont les descripteurs ? Il y a neuf champs : `Airport_ID, Name, Type, City, Country_Code, IATA, Latitude, Longitude, Altitude`.
    

<div class = "alert alert-info">  


**Question**  

En exécutant une instruction bien choisie, déterminer combien d'enregistrements (c-à-d de lignes) contient cette table ?

In [None]:
len(table_aeroports)

<div class = "alert alert-info">  


**Question**  
- Afficher tout l'enregistrement d'indice 1111 de cette table. 


- Quel est le code du pays de cet aéroport ? D'après vous à quel pays cela correspond-il ? NG : Niger ou Nigeria ...
    

- Quelle est son altitude (attention elle est exprimée en pieds)? 4232 pieds.

In [None]:
table_aeroports[1111]

<div class = "alert alert-info">  


**Question**  

Afficher uniquement le nom de l'aéroport de l'enregistrement d'indice 1234 de cette table.

In [None]:
table_aeroports[1234]['Name']

<div class = "alert alert-danger">


## MISE EN GARDE N°1

Rappelez vous que les valeurs de tous les champs sont de type `str` et qu'il faut les convertir en `float` ou en `int` si besoin (et le besoin sera très souvent là).  
    

## MISE EN GARDE N°2

On appellera **table** une `list` de `dict` python (c'est à dire un tableau de p-uplets nommés en langage "algorithmique").

# 2) rechercher des données

<div class = "alert alert-info">  


**Question**  

En une seule instruction, à partir de la table `table_aeroports`, creer la liste `liste_des_types` des types de tous les aéroports figurant dans la table (un même type pourra figurer plusieurs fois dans la liste).

In [None]:
liste_des_types = [aeroport['Type'] for aeroport in table_aeroports]

<div class = "alert alert-info">  
    
    
**Question**  
Les types d'aéroports apparaissent plusieurs fois dans cette liste. Ce qui est gênant.  
Compléter la fonction `enlever_doublons_liste` qui prend en argument une liste `avec_doublons` et renvoie une autre liste `sans_doublons` dont les éléments sont les éléments de `avec_doublons` mais présents une seule fois (et en conservant l'ordre des indices de première apparition de gauche à droite).  
Quelques assertions que devra satisfaire votre fonction sont données plus bas

In [None]:
def enlever_doublons_liste(avec_doublons):
    sans_doublons = []
    for element in avec_doublons:
        if element not in sans_doublons:
            sans_doublons.append(element)
    return sans_doublons

In [None]:
assert enlever_doublons_liste(['a', 'c', 'b', 'a', 'a', 'z', 'k', 'b']) == ['a', 'c', 'b', 'z', 'k']
assert enlever_doublons_liste([10, 9, 10, 10, -99, 99, -99]) == [10, 9, -99, 99]

In [None]:
liste_des_types = enlever_doublons_liste(liste_des_types)
liste_des_types

<div class = "alert alert-info">  


**Question**  

En une seule instruction, à partir de la table `table_aeroports`, créer la **table** `table_large_airports` de tous les aéroports de type `large_airport`.
    
    
Combien y'en a-t-il ?

In [None]:
table_large_airports = [aeroport for aeroport in table_aeroports 
                        if aeroport['Type'] == 'large_airport']
len(table_large_airports)

<div class = "alert alert-info">  


**Question**  

En une seule instruction, à partir de la table `table_aeroports`, créer la **table** `table_large_airports_FR` de tous les aéroports de type `large_airport` situés en France (`Country_Code` égal à `FR`).
    
    
Combien y'en a-t-il ? Quels sont leurs noms ?

In [None]:
table_large_airports_FR = [aeroport for aeroport in table_aeroports 
                        if aeroport['Type'] == 'large_airport'
                       and aeroport['Country_Code'] == 'FR']
len(table_large_airports_FR)

In [None]:
liste_nom_large_airports_FR = [airport['Name'] for airport in table_large_airports_FR]
liste_nom_large_airports_FR

# 3) trier des données

<div class = "alert alert-info">  


**Question**  

Créer la table `table_alt_decroissantes` des aéroports triés par ordre décroissant d'altitude.
    
Penser à faire une fonction clef de tri auparavant 
    
**Attention aux conversions de type, sinon vous allez trier par ordre alphabétique au lieu de trier par ordre numérique. Voir Mise en garde n°1 au début du notebook**

In [None]:
def clef_tri_altitude(aeroport):
    return float(aeroport['Altitude'])

table_alt_decroissantes = sorted(table_aeroports, key = clef_tri_altitude, reverse = True)

<div class = "alert alert-info">  


**Question**  

Créer la liste des `Country_Code` des 20 aéroports les plus hauts.  
    
Quel pays est le plus présent dans cette liste (ou quel code de pays si vous ne maîtrisez pas les codes de pays) ? CN (Chine)

In [None]:
[table_alt_decroissantes[i]['Country_Code'] for i in range(20)]

<div class = "alert alert-info">  


**Question**  

Créer la table `table_triee_par_lieu` des aéroports triés par ordre alphabétique de `City` croissant puis par ordre alphabétique de `Country_Code` croissant.  

Quel est le nom de l'aéroport situé à l'indice 5555 de cette table triée ?

In [None]:
def clef_tri_city(aeroport):
    return aeroport['City']

def clef_tri_country_code(aeroport):
    return aeroport['Country_Code']

table_triee_par_lieu = sorted(table_aeroports, key = clef_tri_city)
table_triee_par_lieu = sorted(table_triee_par_lieu, key = clef_tri_country_code)


table_triee_par_lieu[5555]