# Test unitaire - Activité 2


Nom : de Castro

Prénom : Kier

Groupe de TP : TP1A



Le teste unitaire, `tu_Activite2.ipynb`, de l'activité consiste à mettre en place un programme qui permet de :
1. importer des données au format JSON disponibles en OpenData,
1. afficher les données sous forme d'un tableau,
1. analyser les données.
1. publier les résultats.

📂 Les données à traiter au format JSON sont celles disponibles sur le site de l'[*Open Data du service Vélib' Métropole*](https://www.velib-metropole.fr/donnees-open-data-gbfs-du-service-velib-metropole).

Ces données sont de deux types :
* des **données dites statiques** qui informent sur les caractéristiques des stations Vélib sur l'agglomération Parisienne,
* des **données dites dynamiques** qui informent en "temps réel" sur la disponibilité des stands et des vélos pour chaque station. Ces informations sont mises à jour toutes les minutes.

Il est possible de voir la structure de ces données au format JSON en cliquant sur les liens ci-dessous :

> 👁 Lien vers le JSON des [données statiques](
https://velib-metropole-opendata.smoove.pro/opendata/Velib_Metropole/station_information.json).<br/>
👁 Lien vers le JSON des [données dynamiques](https://velib-metropole-opendata.smoove.pro/opendata/Velib_Metropole/station_status.json).

## Préambule

Avant toute chose, il faut importer les bibliothèques et modules utiles :

> ⛔ ne pas modifier le code donné ci-dessous.

In [1]:
# importations et configuration
#

# installation de modules non natifs
!pip install geopandas
!pip install contextily

from google.colab import drive # pour l'accès au drive
import sys                     # pour l'accès au commandes système
import json                    # pour manipuler le format JSON
import pandas as pd            # pour extraire, calculer, publier

# montage du drive sur Colab (avec autorisation d'accès)
drive.mount('/content/drive', force_remount=True)
# cliquez sur le lien affiché dans la console afin d'obtenir votre clé d'accès
# et recopiez cette clé dans la zone de saisie de texte.

# pour inclure les fonctions "faites maison" et spécifiques
sys.path.insert(0,'/content/drive/My Drive/Colab Notebooks/SAE15/tools')
import sae15_tools as tools
import sae15_spec as spec

Mounted at /content/drive


## Lecture des données statiques

Lire les **données statiques** au format JSON disponibles en OpenData de l'API Velib. Récupérer les informations sur les différentes stations à vélos. Convertir et afficher la structure JSON en Data Frame à l'aide de la bibiliothèque Pandas.

1. `tools.loadVelibInformation()` ➡ données statiques complètes aux format JSON
1. `tools.getVelibStations()` ➡ données sur les stations Vélib
1. `pandas.DataFrame()` ➡ mise sous forme d'un Data Frame
1. `display()` ➡ affichage amélioré


In [2]:
# chargement des données statiques Velib depuis l'OpenData
donnees_statique_Velib = tools.loadVelibInformation()

# sélection des données des différentes stations
differentes_stations = tools.getVelibStations(donnees_statique_Velib)

# transformation en DataFrame pour analyse
affichage = pd.DataFrame(differentes_stations)


# affichage amélioré
display(affichage)



Unnamed: 0,station_id,name,lat,lon,capacity,stationCode,rental_methods
0,213688169,Benjamin Godard - Victor Hugo,48.865983,2.275725,35,16107,
1,653222953,Mairie de Rosny-sous-Bois,48.871257,2.486581,30,31104,[CREDITCARD]
2,17278902806,Rouget de L'isle - Watteau,48.778193,2.396302,20,44015,
3,36255,Toudouze - Clauzel,48.879296,2.337360,21,9020,[CREDITCARD]
4,37815204,Mairie du 12ème,48.840855,2.387555,30,12109,
...,...,...,...,...,...,...,...
1466,30641281,Place de la Montagne du Goulet,48.844341,2.277384,21,15060,
1467,54000567,Montreuil - Voltaire,48.850507,2.393076,34,11012,
1468,101013666,Bercy - Villot,48.841795,2.376785,34,12105,[CREDITCARD]
1469,117480156,Enfants du Paradis - Peupliers,48.833123,2.257146,40,21021,


## Lecture des données dynamiques

Lire les **données dynamiques** au format JSON disponibles en OpenData de l'API Velib. Récupérer les informations sur les différentes stations à vélos. Convertir et afficher la structure JSON en Data Frame à l'aide de la bibiliothèque Pandas.

1. `tools.loadVelibSatus()` ➡ données dynamiques complètes aux format JSON
1. `tools.getVelibStations()` ➡ données sur les stations Vélib
1. `pandas.DataFrame()` ➡ mise sousforme de Data Frame
1. `display()` ➡ affichage amélioré

In [3]:
# chargement des données dynamiques Velib depuis l'OpenData
donnees_dynamique_Velib = tools.loadVelibStatus()
# sélection des données des différentes stations
differentes_stations = tools.getVelibStations(donnees_dynamique_Velib)
# transformation en DataFrame pour analyse
affiche = pd.DataFrame(differentes_stations)
# affichage amélioré
display(affiche)
cc = affiche['last_reported']
cc = pd.DataFrame(cc)
display(cc)

Unnamed: 0,stationCode,station_id,num_bikes_available,numBikesAvailable,num_bikes_available_types,num_docks_available,numDocksAvailable,is_installed,is_returning,is_renting,last_reported
0,16107,213688169,7,7,"[{'mechanical': 5}, {'ebike': 2}]",28,28,1,1,1,1703621067
1,31104,653222953,16,16,"[{'mechanical': 8}, {'ebike': 8}]",12,12,1,1,1,1703621253
2,44015,17278902806,8,8,"[{'mechanical': 1}, {'ebike': 7}]",12,12,1,1,1,1703621315
3,9020,36255,4,4,"[{'mechanical': 1}, {'ebike': 3}]",17,17,1,1,1,1703621309
4,12109,37815204,21,21,"[{'mechanical': 8}, {'ebike': 13}]",9,9,1,1,1,1703621445
...,...,...,...,...,...,...,...,...,...,...,...
1466,15060,30641281,13,13,"[{'mechanical': 13}, {'ebike': 0}]",8,8,1,1,1,1703621375
1467,11012,54000567,12,12,"[{'mechanical': 10}, {'ebike': 2}]",22,22,1,1,1,1703621100
1468,12105,101013666,25,25,"[{'mechanical': 15}, {'ebike': 10}]",11,11,1,1,1,1703621516
1469,21021,117480156,1,1,"[{'mechanical': 0}, {'ebike': 1}]",39,39,1,1,1,1703621114


Unnamed: 0,last_reported
0,1703621067
1,1703621253
2,1703621315
3,1703621309
4,1703621445
...,...
1466,1703621375
1467,1703621100
1468,1703621516
1469,1703621114


## Analyse des données dynamiques

Comme on peut le voir sur l'affichage précédent, chaque station est constituée de différentes rubriques : `stationCode`, `station_id`, `num_bikes_available`,	`numBikesAvailable`, `num_bikes_available_types`, `num_docks_available`, `numDocksAvailable`, `is_installed`, `is_returning`, `is_renting`, `last_reported`.

Ici, nous nous intéresserons aux colonnes `numBikesAvailable` et  `numDocksAvailable` qui indiquent respectivement le nombre de vélos et de stands disponibles pour une station donnée.

On demande de produire des mesures qui indiquent :
1. le nombre total de stations de stands à vélos,
1. le nombre total de vélos disponibles sur l'ensemble des stations,
1. le nombre total de stands à vélos disponibles sur l'ensemble des stations,
1. le taux de disponibilité des vélos (en pourcentage) de chaque station : $taux=velos_{dispo}/(velos_{dispo}+stands_{dispo})$,
1. le taux moyen de disponibilité des vélos.

Chacune de ces mesures devra être mémorisée dans une variable numérique.

In [4]:
# analyser les données dynamiques

donnees_dynamique_Velib = tools.loadVelibStatus()

differentes_stations = tools.getVelibStations(donnees_dynamique_Velib)

affiche = pd.DataFrame(differentes_stations)

# affichage amélioré
display(affiche)

# récupération de la colonne 'numBikesAvailable'
velos_valables= affiche['numBikesAvailable']

# récupération de la colonne 'numDocksAvailable'
stands_valables = affiche['numDocksAvailable']




# mesures statistiques obtenues par les méthodes de Pandas

print("nombre de stations de velo :",len(stands_valables))
print("nombre de velo valables :",velos_valables.sum())
print("nombre de stands valable :", stands_valables.sum())
b=velos_valables.sum()
c=stands_valables.sum()

'''
# taux de disponibilité des vélos pour chaque stations
taux = ((velos_valables/ (velos_valables + stands_valables))*100)
a= pd.DataFrame(taux)
a.columns =["taux de chaque station en %"]
display(a)
# taux moyen de disponibilité des velos
print("On a un taux moyen de disponibilité des velo de :",taux.mean(),"%")'''

Unnamed: 0,stationCode,station_id,num_bikes_available,numBikesAvailable,num_bikes_available_types,num_docks_available,numDocksAvailable,is_installed,is_returning,is_renting,last_reported
0,16107,213688169,7,7,"[{'mechanical': 5}, {'ebike': 2}]",28,28,1,1,1,1703621067
1,31104,653222953,16,16,"[{'mechanical': 8}, {'ebike': 8}]",12,12,1,1,1,1703621253
2,44015,17278902806,8,8,"[{'mechanical': 1}, {'ebike': 7}]",12,12,1,1,1,1703621315
3,9020,36255,4,4,"[{'mechanical': 1}, {'ebike': 3}]",17,17,1,1,1,1703621309
4,12109,37815204,21,21,"[{'mechanical': 8}, {'ebike': 13}]",9,9,1,1,1,1703621445
...,...,...,...,...,...,...,...,...,...,...,...
1466,15060,30641281,13,13,"[{'mechanical': 13}, {'ebike': 0}]",8,8,1,1,1,1703621375
1467,11012,54000567,12,12,"[{'mechanical': 10}, {'ebike': 2}]",22,22,1,1,1,1703621100
1468,12105,101013666,25,25,"[{'mechanical': 15}, {'ebike': 10}]",11,11,1,1,1,1703621516
1469,21021,117480156,1,1,"[{'mechanical': 0}, {'ebike': 1}]",39,39,1,1,1,1703621114


nombre de stations de velo : 1471
nombre de velo valables : 17284
nombre de stands valable : 27218


'\n# taux de disponibilité des vélos pour chaque stations\ntaux = ((velos_valables/ (velos_valables + stands_valables))*100)\na= pd.DataFrame(taux)\na.columns =["taux de chaque station en %"]\ndisplay(a)\n# taux moyen de disponibilité des velos\nprint("On a un taux moyen de disponibilité des velo de :",taux.mean(),"%")'

⚠ attention : Avant de calculer le taux moyen de disponibilité, il faut remarquer que certaines stations indiquent des valeurs nulles pour `numBikesAvailable` et `numDocksAvailable`, ce qui produit une valeur du taux de disponibilité égale à `NaN` (résultat du calcul de 0/0). La velur `NaN` (pour *Not a Number*) doit donc être remplacée par 0 partout où elle apparaît avant de calculer le taux moyen.

> A cette fin, utiliser la méthode  [`pandas.fillna()`](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.fillna.html#pandas-dataframe-fillna) de la bibliothèque Pandas.

In [5]:
# remplacement des NaN par des 0 et calcul du taux moyen
velos_valables.fillna(0)
stands_valables.fillna(0)
taux = ((velos_valables/ (velos_valables + stands_valables))*100)
print(taux.mean())

39.089499533419925


## Publication des résultats

Finalement, proposez une publication des mesures obtenues dans un format texte lisible et compréhensible. L'affichage se fait dans la console.

In [6]:
# publier les résultats

print("nombre de stations de velo :",len(stands_valables))
print("nombre de velo valables :",velos_valables.sum())
print("nombre de stands valable :", stands_valables.sum())
taux = ((velos_valables/ (velos_valables + stands_valables))*100)
a= pd.DataFrame(taux)
a.columns =["taux de chaque station en %"]
display(a)
print("On a un taux moyen de disponibilité des velo de :",taux.mean(),"%")


nombre de stations de velo : 1471
nombre de velo valables : 17284
nombre de stands valable : 27218


Unnamed: 0,taux de chaque station en %
0,20.000000
1,57.142857
2,40.000000
3,19.047619
4,70.000000
...,...
1466,61.904762
1467,35.294118
1468,69.444444
1469,2.500000


On a un taux moyen de disponibilité des velo de : 39.089499533419925 %


---
🎯 Livrer ce test unitaire sur Eprel

---





In [9]:
donnees_dynamique_Velib = tools.loadVelibStatus()

differentes_stations = tools.getVelibStations(donnees_dynamique_Velib)

dd = pd.DataFrame(differentes_stations)

print(spec.getLatestDate(dd))


display(spec.stationStatistics(dd['numDocksAvailable']))


1703621574


Unnamed: 0,tot,min
0,27221,0
