# Test unitaire - Activité 2

**texte en gras**---
Nom : Coquet

Prénom : Baptiste

Groupe de TP : rt1c2

---

Le teste unitaire, `tu_Activite2.ipynb`, de l'activité consiste à mettre en place un programme qui permet de :
1. importer des données au format JSON disponibles en OpenData,
1. afficher les données sous forme d'un tableau,
1. analyser les données.
1. publier les résultats.

📂 Les données à traiter au format JSON sont celles disponibles sur le site de l'[*Open Data du service Vélib' Métropole*](https://www.velib-metropole.fr/donnees-open-data-gbfs-du-service-velib-metropole).

Ces données sont de deux types :
* des **données dites statiques** qui informent sur les caractéristiques des stations Vélib sur l'agglomération Parisienne,
* des **données dites dynamiques** qui informent en "temps réel" sur la disponibilité des stands et des vélos pour chaque station. Ces informations sont mises à jour toutes les minutes.

Il est possible de voir la structure de ces données au format JSON en cliquant sur les liens ci-dessous :

> 👁 Lien vers le JSON des [données statiques](
https://velib-metropole-opendata.smoove.pro/opendata/Velib_Metropole/station_information.json).<br/>
👁 Lien vers le JSON des [données dynamiques](https://velib-metropole-opendata.smoove.pro/opendata/Velib_Metropole/station_status.json).

## Préambule 

Avant toute chose, il faut importer les bibliothèques et modules utiles :

> ⛔ ne pas modifier le code donné ci-dessous.

In [14]:
# importations et configuration
#

# installation de modules non natifs
!pip install geopandas
!pip install contextily

from google.colab import drive # pour l'accès au drive
import sys                     # pour l'accès au commandes système
import json                    # pour manipuler le format JSON
import pandas as pd            # pour extraire, calculer, publier

# montage du drive sur Colab (avec autorisation d'accès)
drive.mount('/content/drive', force_remount=True) #
# cliquez sur le lien affiché dans la console afin d'obtenir votre clé d'accès
# et recopiez cette clé dans la zone de saisie de texte.

# pour inclure les fonctions "faites maison" et spécifiques
sys.path.insert(0,'/content/drive/My Drive/Colab notebooks/SAE15/tools')#
import sae15_tools as tools #
import sae15_spec as spec

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Mounted at /content/drive


## Lecture des données statiques

Lire les **données statiques** au format JSON disponibles en OpenData de l'API Velib. Récupérer les informations sur les différentes stations à vélos. Convertir et afficher la structure JSON en Data Frame à l'aide de la bibiliothèque Pandas.

1. `tools.loadVelibInformation()` ➡ données statiques complètes aux format JSON
1. `tools.getVelibStations()` ➡ données sur les stations Vélib
1. `pandas.DataFrame()` ➡ mise sous forme d'un Data Frame
1. `display()` ➡ affichage amélioré


In [15]:
import urllib

# chargement des données statiques Velib depuis l'OpenData 
json_data1 = json.loads(urllib.request.urlopen('https://velib-metropole-opendata.smoove.pro/opendata/Velib_Metropole/station_status.json').read()) #
# sélection des données des différentes stations
x = tools.getVelibStations(json_data1) #
# transformation en DataFrame pour analyse
t = pd.DataFrame(json_data1['data']['stations']) #
# affichage amélioré
#display(y)
display(t)
#display(x)
display(x)

Unnamed: 0,stationCode,station_id,num_bikes_available,numBikesAvailable,num_bikes_available_types,num_docks_available,numDocksAvailable,is_installed,is_returning,is_renting,last_reported
0,16107,213688169,11,11,"[{'mechanical': 4}, {'ebike': 7}]",24,24,1,1,1,1674586910
1,31104,653222953,16,16,"[{'mechanical': 8}, {'ebike': 8}]",9,9,1,1,1,1674586996
2,11104,516709288,3,3,"[{'mechanical': 1}, {'ebike': 2}]",15,15,1,1,1,1674586739
3,9020,36255,5,5,"[{'mechanical': 2}, {'ebike': 3}]",16,16,1,1,1,1674587055
4,12109,37815204,6,6,"[{'mechanical': 5}, {'ebike': 1}]",24,24,1,1,1,1674586949
...,...,...,...,...,...,...,...,...,...,...,...
1444,18023,54000604,5,5,"[{'mechanical': 0}, {'ebike': 5}]",29,29,1,1,1,1674587111
1445,18026,43247738,15,15,"[{'mechanical': 4}, {'ebike': 11}]",18,18,1,1,1,1674587017
1446,18024,102311820,10,10,"[{'mechanical': 3}, {'ebike': 7}]",24,24,1,1,1,1674586987
1447,42004,368766689,12,12,"[{'mechanical': 9}, {'ebike': 3}]",14,14,1,1,1,1674587063


[{'stationCode': '16107',
  'station_id': 213688169,
  'num_bikes_available': 11,
  'numBikesAvailable': 11,
  'num_bikes_available_types': [{'mechanical': 4}, {'ebike': 7}],
  'num_docks_available': 24,
  'numDocksAvailable': 24,
  'is_installed': 1,
  'is_returning': 1,
  'is_renting': 1,
  'last_reported': 1674586910},
 {'stationCode': '31104',
  'station_id': 653222953,
  'num_bikes_available': 16,
  'numBikesAvailable': 16,
  'num_bikes_available_types': [{'mechanical': 8}, {'ebike': 8}],
  'num_docks_available': 9,
  'numDocksAvailable': 9,
  'is_installed': 1,
  'is_returning': 1,
  'is_renting': 1,
  'last_reported': 1674586996},
 {'stationCode': '11104',
  'station_id': 516709288,
  'num_bikes_available': 3,
  'numBikesAvailable': 3,
  'num_bikes_available_types': [{'mechanical': 1}, {'ebike': 2}],
  'num_docks_available': 15,
  'numDocksAvailable': 15,
  'is_installed': 1,
  'is_returning': 1,
  'is_renting': 1,
  'last_reported': 1674586739},
 {'stationCode': '9020',
  'stat

## Lecture des données dynamiques

Lire les **données dynamiques** au format JSON disponibles en OpenData de l'API Velib. Récupérer les informations sur les différentes stations à vélos. Convertir et afficher la structure JSON en Data Frame à l'aide de la bibiliothèque Pandas.

1. `tools.loadVelibSatus()` ➡ données dynamiques complètes aux format JSON
1. `tools.getVelibStations()` ➡ données sur les stations Vélib
1. `pandas.DataFrame()` ➡ mise sousforme de Data Frame
1. `display()` ➡ affichage amélioré

In [16]:
# chargement des données dynamiques Velib depuis l'OpenData 
json_data = json.loads(urllib.request.urlopen('https://velib-metropole-opendata.smoove.pro/opendata/Velib_Metropole/station_information.json').read()) # loading of Velib dynamic data from OpenData
# sélection des données des différentes stations
y = tools.getVelibStations(json_data) # selection of data from different stations
# transformation en DataFrame pour analyse
f = pd.DataFrame(json_data['data']['stations']) #f variable contains the stations information
# affichage amélioré
display(f)

Unnamed: 0,station_id,name,lat,lon,capacity,stationCode,rental_methods
0,213688169,Benjamin Godard - Victor Hugo,48.865983,2.275725,35,16107,
1,653222953,Mairie de Rosny-sous-Bois,48.871257,2.486581,30,31104,[CREDITCARD]
2,516709288,Charonne - Robert et Sonia Delauney,48.855908,2.392571,20,11104,
3,36255,Toudouze - Clauzel,48.879296,2.337360,21,9020,[CREDITCARD]
4,37815204,Mairie du 12ème,48.840855,2.387555,30,12109,
...,...,...,...,...,...,...,...
1444,54000604,Ordener - Poissonniers,48.891214,2.351289,35,18023,[CREDITCARD]
1445,43247738,Ruisseau - Ordener,48.892995,2.340145,35,18026,[CREDITCARD]
1446,102311820,Clignancourt - Ordener,48.891458,2.348636,35,18024,[CREDITCARD]
1447,368766689,Westermeyer - Paul Vaillant-Couturier,48.819116,2.396664,25,42004,[CREDITCARD]


## Analyse des données dynamiques

Comme on peut le voir sur l'affichage précédent, chaque station est constituée de différentes rubriques : `stationCode`, `station_id`, `num_bikes_available`,	`numBikesAvailable`, `num_bikes_available_types`, `num_docks_available`, `numDocksAvailable`, `is_installed`, `is_returning`, `is_renting`, `last_reported`.

Ici, nous nous intéresserons aux colonnes `numBikesAvailable` et  `numDocksAvailable` qui indiquent respectivement le nombre de vélos et de stands disponibles pour une station donnée.

On demande de produire des mesures qui indiquent :
1. le nombre total de stations de stands à vélos,
1. le nombre total de vélos disponibles sur l'ensemble des stations,
1. le nombre total de stands à vélos disponibles sur l'ensemble des stations,
1. le taux de disponibilité des vélos (en pourcentage) de chaque station : $taux=velos_{dispo}/(velos_{dispo}+stands_{dispo})$,
1. le taux moyen de disponibilité des vélos.

Chacune de ces mesures devra être mémorisée dans une variable numérique.

In [17]:
# analyser les données dynamiques
#
a = pd.DataFrame(tools.getVelibStations(tools.loadVelibStatus())) #analysing of the dynamic data
# récupération de la colonne 'numBikesAvailable'
b = a.numBikesAvailable #we get the colums numbikesavailable
# récupération de la colonne 'numDocksAvailable'
c = a.numDocksAvailable #we get the colums numstandavailable
# mesures statistiques obtenues par les méthodes de Pandas
tvelo=b.sum()#we make the sum of available bikes
tstand=c.sum()#we make the sum of the stands available
# taux de disponibilité
d = b / (b + c) # the rate of disponibility of bikes
print(d)

0       0.314286
1       0.640000
2       0.166667
3       0.238095
4       0.200000
          ...   
1444    0.147059
1445    0.454545
1446    0.294118
1447    0.461538
1448    0.058824
Length: 1449, dtype: float64


⚠ attention : Avant de calculer le taux moyen de disponibilité, il faut remarquer que certaines stations indiquent des valeurs nulles pour `numBikesAvailable` et `numDocksAvailable`, ce qui produit une valeur du taux de disponibilité égale à `NaN` (résultat du calcul de 0/0). La velur `NaN` (pour *Not a Number*) doit donc être remplacée par 0 partout où elle apparaît avant de calculer le taux moyen.

> A cette fin, utiliser la méthode  [`pandas.fillna()`](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.fillna.html#pandas-dataframe-fillna) de la bibliothèque Pandas.

In [20]:
# remplacement des NaN par des 0 et calcul du taux moyen
#
t = 100*d.fillna(0) # replacement of NaN by 0
t = d.mean()# calculation of the average rate
print(t)

numBikesAvailable    10.240856
numDocksAvailable    19.730159
dtype: float64


## Publication des résultats

Finalement, proposez une publication des mesures obtenues dans un format texte lisible et compréhensible. L'affichage se fait dans la console.

In [21]:
# publier les résultats
#
total_velo = pd.DataFrame(b)#we put in datatframe the sum of available bikes
total_stand = pd.DataFrame(c)#we put in datatframe the sum of the available stands
d = total_velo.combine_first(total_stand)#we combine the total of bikes and stands
display(d)

Unnamed: 0,numBikesAvailable,numDocksAvailable
0,11,24
1,16,9
2,3,15
3,5,16
4,6,24
...,...,...
1444,5,29
1445,15,18
1446,10,24
1447,12,14


---
🎯 Livrer ce test unitaire sur Eprel

---



