# Traitement des données avec le langage Python

**Objectif**: Afficher sur une carte interactive les gares de voyageur d'Indre et Loire

## Récupération et visualisation basique des données

Nous utiliserons une librairie spécialisée dans le traitement des données connu sous le nom de `pandas`

In [None]:
import pandas

Sur l'open data de la SNCF, on trouve [la liste des gares](https://data.sncf.com/explore/dataset/liste-des-gares/export) dans différents formats...

Pour cet exemple, j'ai téléchargé le fichier *fichier_gares.csv*. Lisons le avec Python et pandas:

In [None]:
gares = pandas.read_csv('fichier_gares.csv', sep=";")
gares.head()

### À faire toi-même

Dans la cellule qui suit:
- Enlève le `.head()` dans le code et exécute la cellule. Vois-tu à quoi il sert ?
- Que se passe-t-il si on change le séparateur par une virgule ?

In [None]:
# pour tester
test_gares = pandas.read_csv('fichier_gares.csv', sep=";")
test_gares.head()

## Sélection des gares pertinentes

Notre objectif est d'afficher les gares du départements sur une map (carte). Réaffichons les **descripteurs** de ces gares:

In [None]:
gares.columns

### À faire toi-même

Dans le code qui suit, il manque le descripteur pertinent dans la zone à compléter `___`: complète-le. 

**Note**: Si tu réussis, seules les gares pertinentes s'affichent (les 5 premières...)

In [None]:
mon_departement = 'INDRE-ET-LOIRE'
descripteur = ___
selection = gares[descripteur] == mon_departement
gares_mon_dpt = gares[selection]

gares_mon_dpt.head()

Pour comprendre un peu mieux le code ci-dessus, il n'est pas inutile d'inspecter les premières lignes de `selection`.

In [None]:
selection.head()

On appelle cela un **filtre**: les 5 premières gares ne respectent pas le critère: 

«le descripteur `departement` a pour valeur `INDRE-ET-LOIRE`» 

d'où les `False`. On ne conserve que les lignes où il y a `True`. 

Combien de gares y a-t-il dans mon département ?

In [None]:
len(gares_mon_dpt)

### À faire toi-même

Peux-tu compléter la première ligne du code qui suit pour conserver uniquement les gares qui prennent des voyageurs?

In [None]:
selection = gares_mon_dpt[___] == ___
gares_mon_dpt = gares_mon_dpt[selection]
gares_mon_dpt.head()

Combien en a-t-on éliminé?

In [None]:
___(gares_mon_dpt)

## Sélection des descripteurs pertinents

### À faire toi-même

Pour notre application, seuls les descripteurs précisant le **nom de la gare** et sa **position geographique** nous intéressent. 

Peux-tu compléter le code qui suit?

In [None]:
descripteurs_interessants = [___, ___]
gares_court = gares_mon_dpt[descripteurs_interessants]
gares_court.head()

## Préparation des données

Pour notre application, nous avons besoin de transformer les coordonnées géographiques de façon à avoir un couple de nombres à virgules (un `float` en Python). Le problème:

Nous disposons de (par ex.): `'47.2177935535,0.90129777732'`

Or, nous avons besoin de: `(47.2177935535, 47.2177935535)` (remarquer qu'il n'y a plus de `'`).

La solution en trois cellules:

In [None]:
noms_et_positions = [ (gare['libelle'], gare['c_geo']) for numero , gare in gares_court.iterrows()]
noms_et_positions[0:3]

In [None]:
noms_et_positions = [(nom, pos.split(',')) for nom, pos in noms_et_positions]
noms_et_positions[0:3]

In [None]:
noms_et_positions = [(nom, ( float(pos_x), float(pos_y) ) ) for nom, (pos_x, pos_y) in noms_et_positions]
noms_et_positions[0:3]

Ouf! Nos données sont prêtes à être exploitées!

## Affichage sur une carte interactive

Pour cela, nous avons besoin d'utiliser une librairie qui gère la carte, les interactions etc.

Nous utiliserons la librairie *javascript* [leaflet](https://leafletjs.com/).

Pour pouvoir l'utiliser ici, nous aurons besoin d'importer la bibliothèque *python* `ipyleaflet`.

In [None]:
from ipyleaflet import Map, Marker

# Coordonnées de Tours pour centrer la carte
tours = (47.3879206614,0.695556792192)

#L'objet carte
carte = Map(center=tours, zoom=10)
display(carte)


Il est temps d'utiliser nos données rangées dans `noms_et_positions`!

In [None]:
for nom, pos in noms_et_positions:
    marker = Marker(location=pos, title=nom, draggable=False)
    carte.add_layer(marker)