# Test unitaire - Activité 2

---
Nom : CHIBANE

Prénom :Ilies

Groupe de TP : GP-IA & IA2S

---

Le teste unitaire, `tu_Activite2.ipynb`, de l'activité consiste à mettre en place un programme qui permet de :
1. importer des données au format JSON disponibles en OpenData,
1. afficher les données sous forme d'un tableau,
1. analyser les données.
1. publier les résultats.

📂 Les données à traiter au format JSON sont celles disponibles sur le site de l'[*Open Data du service Vélib' Métropole*](https://www.velib-metropole.fr/donnees-open-data-gbfs-du-service-velib-metropole).

Ces données sont de deux types :
* des **données dites statiques** qui informent sur les caractéristiques des stations Vélib sur l'agglomération Parisienne,
* des **données dites dynamiques** qui informent en "temps réel" sur la disponibilité des stands et des vélos pour chaque station. Ces informations sont mises à jour toutes les minutes.

Il est possible de voir la structure de ces données au format JSON en cliquant sur les liens ci-dessous :

> 👁 Lien vers le JSON des [données statiques](
https://velib-metropole-opendata.smoove.pro/opendata/Velib_Metropole/station_information.json).<br/>
👁 Lien vers le JSON des [données dynamiques](https://velib-metropole-opendata.smoove.pro/opendata/Velib_Metropole/station_status.json).

## Préambule

Avant toute chose, il faut importer les bibliothèques et modules utiles :

> ⛔ ne pas modifier le code donné ci-dessous.

In [None]:
# importations et configuration
#

# installation de modules non natifs
!pip install geopandas
!pip install contextily

from google.colab import drive # pour l'accès au drive
import sys                     # pour l'accès au commandes système
import json                    # pour manipuler le format JSON
import pandas as pd            # pour extraire, calculer, publier

# montage du drive sur Colab (avec autorisation d'accès)
drive.mount('/content/drive', force_remount=True)
# cliquez sur le lien affiché dans la console afin d'obtenir votre clé d'accès
# et recopiez cette clé dans la zone de saisie de texte.

# pour inclure les fonctions "faites maison" et spécifiques
sys.path.insert(0,'/content/drive/My Drive/Colab Notebooks/SAE15/tools')
import sae15_tools as tools
import sae15_spec as spec

Collecting contextily
  Downloading contextily-1.4.0-py3-none-any.whl (16 kB)
Collecting mercantile (from contextily)
  Downloading mercantile-1.2.1-py3-none-any.whl (14 kB)
Collecting rasterio (from contextily)
  Downloading rasterio-1.3.9-cp310-cp310-manylinux2014_x86_64.whl (20.6 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m20.6/20.6 MB[0m [31m42.3 MB/s[0m eta [36m0:00:00[0m
Collecting affine (from rasterio->contextily)
  Downloading affine-2.4.0-py3-none-any.whl (15 kB)
Collecting snuggs>=1.4.1 (from rasterio->contextily)
  Downloading snuggs-1.4.7-py3-none-any.whl (5.4 kB)
Installing collected packages: snuggs, mercantile, affine, rasterio, contextily
Successfully installed affine-2.4.0 contextily-1.4.0 mercantile-1.2.1 rasterio-1.3.9 snuggs-1.4.7
Mounted at /content/drive


## Lecture des données statiques

Lire les **données statiques** au format JSON disponibles en OpenData de l'API Velib. Récupérer les informations sur les différentes stations à vélos. Convertir et afficher la structure JSON en Data Frame à l'aide de la bibiliothèque Pandas.

1. `tools.loadVelibInformation()` ➡ données statiques complètes aux format JSON
1. `tools.getVelibStations()` ➡ données sur les stations Vélib
1. `pandas.DataFrame()` ➡ mise sous forme d'un Data Frame
1. `display()` ➡ affichage amélioré


In [None]:
# chargement des données statiques Velib depuis l'OpenData
json_data = tools.loadVelibInformation()

# sélection des données des différentes stations
stations = tools.getVelibStations(json_data)

# transformation en DataFrame pour analyse
df = pd.DataFrame.from_dict(stations)

# affichage amélioré
display(df)

Unnamed: 0,station_id,name,lat,lon,capacity,stationCode,rental_methods
0,213688169,Benjamin Godard - Victor Hugo,48.865983,2.275725,35,16107,
1,653222953,Mairie de Rosny-sous-Bois,48.871257,2.486581,30,31104,[CREDITCARD]
2,17278902806,Rouget de L'isle - Watteau,48.778193,2.396302,20,44015,
3,36255,Toudouze - Clauzel,48.879296,2.337360,21,9020,[CREDITCARD]
4,37815204,Mairie du 12ème,48.840855,2.387555,30,12109,
...,...,...,...,...,...,...,...
1466,54000604,Ordener - Poissonniers,48.891214,2.351289,35,18023,[CREDITCARD]
1467,43247738,Ruisseau - Ordener,48.892995,2.340145,35,18026,[CREDITCARD]
1468,102311820,Clignancourt - Ordener,48.891458,2.348636,35,18024,[CREDITCARD]
1469,368766689,Westermeyer - Paul Vaillant-Couturier,48.819116,2.396664,25,42004,[CREDITCARD]


## Lecture des données dynamiques

Lire les **données dynamiques** au format JSON disponibles en OpenData de l'API Velib. Récupérer les informations sur les différentes stations à vélos. Convertir et afficher la structure JSON en Data Frame à l'aide de la bibiliothèque Pandas.

1. `tools.loadVelibStatus()` ➡ données dynamiques complètes aux format JSON
1. `tools.getVelibStations()` ➡ données sur les stations Vélib
1. `pandas.DataFrame()` ➡ mise sousforme de Data Frame
1. `display()` ➡ affichage amélioré

In [None]:
# chargement des données dynamiques Velib depuis l'OpenData
dynamic_json_data = tools.loadVelibStatus()
# sélection des données des différentes stations
dynamic_stations = tools.getVelibStations(dynamic_json_data)
# transformation en DataFrame pour analyse
dynamic_df = pd.DataFrame.from_dict(dynamic_stations)
# affichage amélioré
display(dynamic_df)

Unnamed: 0,stationCode,station_id,num_bikes_available,numBikesAvailable,num_bikes_available_types,num_docks_available,numDocksAvailable,is_installed,is_returning,is_renting,last_reported
0,16107,213688169,2,2,"[{'mechanical': 1}, {'ebike': 1}]",32,32,1,1,1,1700338211
1,31104,653222953,24,24,"[{'mechanical': 6}, {'ebike': 18}]",6,6,1,1,1,1700338150
2,44015,17278902806,10,10,"[{'mechanical': 3}, {'ebike': 7}]",9,9,1,1,1,1700338545
3,9020,36255,6,6,"[{'mechanical': 0}, {'ebike': 6}]",15,15,1,1,1,1700338514
4,12109,37815204,21,21,"[{'mechanical': 17}, {'ebike': 4}]",9,9,1,1,1,1700338542
...,...,...,...,...,...,...,...,...,...,...,...
1466,18023,54000604,3,3,"[{'mechanical': 3}, {'ebike': 0}]",29,29,1,1,1,1700338458
1467,18026,43247738,5,5,"[{'mechanical': 1}, {'ebike': 4}]",25,25,1,1,1,1700338407
1468,18024,102311820,4,4,"[{'mechanical': 1}, {'ebike': 3}]",31,31,1,1,1,1700337982
1469,42004,368766689,27,27,"[{'mechanical': 23}, {'ebike': 4}]",1,1,1,1,1,1700338582


## Analyse des données dynamiques

Comme on peut le voir sur l'affichage précédent, chaque station est constituée de différentes rubriques : `stationCode`, `station_id`, `num_bikes_available`,	`numBikesAvailable`, `num_bikes_available_types`, `num_docks_available`, `numDocksAvailable`, `is_installed`, `is_returning`, `is_renting`, `last_reported`.

Ici, nous nous intéresserons aux colonnes `numBikesAvailable` et  `numDocksAvailable` qui indiquent respectivement le nombre de vélos et de stands disponibles pour une station donnée.

On demande de produire des mesures qui indiquent :
1. le nombre total de stations de stands à vélos,
1. le nombre total de vélos disponibles sur l'ensemble des stations,
1. le nombre total de stands à vélos disponibles sur l'ensemble des stations,
1. le taux de disponibilité des vélos (en pourcentage) de chaque station : $taux=velos_{dispo}/(velos_{dispo}+stands_{dispo})$,
1. le taux moyen de disponibilité des vélos.

Chacune de ces mesures devra être mémorisée dans une variable numérique.

In [None]:
# analyser les données dynamiques
#
# remplacement des NaN par des 0 et calcul du taux moyen
dynamic_df['numBikesAvailable'] = dynamic_df['numBikesAvailable'].fillna(0)
dynamic_df['numDocksAvailable'] = dynamic_df['numDocksAvailable'].fillna(0)

# récupération de la colonne 'numBikesAvailable'
num_bikes_available = dynamic_df['numBikesAvailable']
# récupération de la colonne 'numDocksAvailable'
num_docks_available = dynamic_df['numDocksAvailable']
# mesures statistiques obtenues par les méthodes de Pandas
nb_stations = len(dynamic_df['stationCode'].unique())

nb_velo = num_docks_available.sum()

nb_stands = num_bikes_available.sum()

# taux de disponibilité
taux_velo_station = spec.availableBikesRate(dynamic_df)

taux_velo_station_moyen = taux_velo_station.mean()

⚠ attention : Avant de calculer le taux moyen de disponibilité, il faut remarquer que certaines stations indiquent des valeurs nulles pour `numBikesAvailable` et `numDocksAvailable`, ce qui produit une valeur du taux de disponibilité égale à `NaN` (résultat du calcul de 0/0). La velur `NaN` (pour *Not a Number*) doit donc être remplacée par 0 partout où elle apparaît avant de calculer le taux moyen.

> A cette fin, utiliser la méthode  [`pandas.fillna()`](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.fillna.html#pandas-dataframe-fillna) de la bibliothèque Pandas.

## Publication des résultats

Finalement, proposez une publication des mesures obtenues dans un format texte lisible et compréhensible. L'affichage se fait dans la console.

In [None]:
# publier les résultats
print(f"Le nombre total de stations de stands à vélos : {nb_stations}")
print(f"Le nombre total de stations de stands à vélos : {nb_velo}")
print(f"Le nombre total de vélos disponibles sur l'ensemble des stations : {nb_stands}")
print(f"Le taux moyen de disponibilité des vélos : {taux_velo_station_moyen:.2f}%")
for station, taux_velo in zip(taux_velo_station.index.tolist(), taux_velo_station.tolist()):
  print(f"Le taux de disponibilité des vélos de la station {station} : {taux_velo:.2f}%")

Le nombre total de stations de stands à vélos : 1471
Le nombre total de stations de stands à vélos : 28655
Le nombre total de vélos disponibles sur l'ensemble des stations : 15502
Le taux moyen de disponibilité des vélos : 35.40%
Le taux de disponibilité des vélos de la station 10001 : 27.12%
Le taux de disponibilité des vélos de la station 10003 : 75.00%
Le taux de disponibilité des vélos de la station 10004 : 42.55%
Le taux de disponibilité des vélos de la station 10005 : 46.67%
Le taux de disponibilité des vélos de la station 10006 : 50.00%
Le taux de disponibilité des vélos de la station 10008 : 60.00%
Le taux de disponibilité des vélos de la station 10009 : 88.24%
Le taux de disponibilité des vélos de la station 1001 : 46.15%
Le taux de disponibilité des vélos de la station 10010 : 48.39%
Le taux de disponibilité des vélos de la station 10011 : 100.00%
Le taux de disponibilité des vélos de la station 10012 : 17.39%
Le taux de disponibilité des vélos de la station 10013 : 33.90%
Le

---
🎯 Livrer ce test unitaire sur Eprel

---



