# Projet 2 - Interaction avec des APIs

Ce projet vise à introduire au requêtage d’API et à la manipulation de
données qui en sont issues, en utilisant des fonctions afin de faciliter
la reproductibilité des analyses.

## Contexte du projet

Il y a certains jours où l’on serait bien resté en télétravail.. Parmi
ceux-là, ces jours à la fois humides et venteux où il est impossible de
maintenir une coiffure décente, malgré tous ses efforts. Pourrait-on
utiliser `Python` pour prédire ce que les anglo-saxons nomment des *bad
hair day* (“mauvais jour de cheveux”) ?

L’objectif du projet est de construire un *bad hair index* (“indice de
mauvais jour de cheveux”) à partir des données météorologiques et de
représenter graphiquement l’évolution de cette indice afin de déterminer
à l’avance les jours où l’on ferait mieux de rester bien au chaud. Afin
d’obtenir les données adéquates, nous allons requêter des APIs.

Une API (Interface de Programmation d’Application) est un ensemble de
règles et de spécifications que les applications suivent pour
communiquer entre elles. Elle permet à votre code d’**accéder à des
fonctionnalités externes ou à des données**, comme celles de bases de
données météorologiques ou de services de localisation. Lorsqu’on parle
de requêtage d’une API, cela se fait généralement via le **protocole
HTTP**, qui est le même protocole utilisé pour charger des pages web.
Dans ce tutoriel, nous utiliserons le package
[requests](https://fr.python-requests.org/en/latest/), qui simplifie le
processus de requêtage et de gestion de réponses HTTP.

Les APIs que nous allons utiliser sont :

-   [Nominatim](https://nominatim.org/release-docs/latest/api/Overview/)
    : une API de géocodage proposée par **OpenStreetMap** qui nous
    permet de convertir un nom de lieu en coordonnées géographiques.
-   [Open-Meteo Weather Forecast](https://open-meteo.com/en/docs) : une
    API qui fournit des prévisions météorologiques détaillées.

Commençons par importer les packages dont nous aurons besoin au cours de
ce projet.

In [1]:
import requests
import pandas
import seaborn as sns
import matplotlib.pyplot as plt

import solutions

## Partie 1 : récupération des coordonnées géographiques pour une localisation donnée

L’API de prédiction d’open-meteo prend en entrée les coordonnées
géographiques (latitude, longitude) du lieu où seront réalisées les
prédictions. On pourrait récupérer manuellement les coordonnées du lieu
qui nous intéresse, mais cela limiterait la reproductibilité de nos
analyses avec d’autres lieux que celui choisi. On va donc utiliser une
seconde API, `Nominatim`, pour obtenir ces coordonnées pour un lieu
donné.

Lorsque l’on travaille à partir d’une API, la première étape est
toujours de lire sa documentation. C’est elle qui indique à quelle
adresse nous devons envoyer nos requêtes, sous quel format, et ce que va
nous répondre l’API. Dans notre cas, la docuemntation de `Nominatim` se
trouve à [cette
adresse](https://nominatim.org/release-docs/develop/api/Overview/).
N’hésitez pas à la parcourir rapidement pour évaluer les possibilités de
l’API.

### Question 1

La première caractéristique essentielle d’une API est le *endpoint*,
c’est à dire l’URL à laquelle on va envoyer des requêtes. Dans notre
cas, on va utiliser le endpoint `/search` dans la mesure où l’on veut
trouver un objet géographique (des coordonnées) à partir d’un nom de
localisation. La [page de
documentation](%5B/search%5D(https://nominatim.org/release-docs/develop/api/Search/))
associée à ce endpoint nous donne toutes les informations dont nous
avons besoin : - le format d’une requête est
`https://nominatim.openstreetmap.org/search?<params>` où `<params>` doit
être remplacé par les paramètres de la requête, séparés par le symbole
`&` - dans la section [Structured
Query](https://nominatim.org/release-docs/develop/api/Search/#structured-query),
on voit que l’API admet comme paramètres `country` (pays) et `city`
(ville), que l’on va utiliser pour paramétrer notre requête.

Définissez une fonction `build_request_nominatim` qui construit le lien
de la requête pour un pays et une ville donnée.

#### Résultat attendu

In [2]:
url_request = solutions.build_request_nominatim("France", "Montrouge")
url_request

#### À vous de jouer !

In [3]:
def build_request_nominatim(country, city):
    # Votre code ici
    return url_request

### Question 2

La prochaine étape est d’envoyer notre requête paramétrisée à l’API.
Pour la tester au préalable, on peut simplement mettre l’adresse dans un
navigateur et voir ce que nous renvoie l’API. Si les résultats ont l’air
cohérent, on peut continuer. Si l’API nous renvoie un code d’erreur, il
y a sûrement une erreur à trouver dans la requête.

Pour effectuer cette requête à partir de `Python` afin d’en récupérer
les résultats, on utilise la fonction `requests.get()` à laquelle on
fournit comme seul paramètre l’URL de la requête. On obtient en retour
un objet “réponse”, dont on peut extraire le contenu `JSON` sous forme
d’un dictionnaire `Python` en lui appliquant la méthode `.json()`. Il
faut alors parcourir le dictionnaire pour en extraire les informations
pertinentes ; dans notre cas : la latitude et la longitude.

Définissez une fonction `get_lat_long` qui récupère la latitude et la
longitude (centrale) pour un pays et une ville donnée.

#### Résultat attendu

In [4]:
lat, long = solutions.get_lat_long("France", "Montrouge")
print(lat, long)

#### À vous de jouer !

In [5]:
def get_lat_long(country, city):
    # Votre code ici
    return latitude, longitude

## Partie 2 : récupération des prévisions météorologiques

Maintenant que nous avons nos coordonnées, nous pouvons requêter l’API
open-meteo.com pour obtenir les données météo.

Exécutons cette fonction pour obtenir les données météo prévisionnelles
de la semaine à venir.

In [6]:
LOCALISATION = "Montrouge"
LAT, LONG = renvoie_lat_long(LOCALISATION)

data = fetch_meteo_data(LAT, LONG, START_DATE, END_DATE)

Afin de bien comprendre la structure des données que nous avons
récupérées, explorons les différents niveaux et types des clés et des
valeurs.

In [7]:
# Exploration des données
print(type(data))
print(data.keys())
print(type(data["hourly"]))
print(data["hourly"].keys())
print(type(data["hourly"]["time"]))

In [8]:
# Afficher les données
print(data['hourly']["time"][:5])
print(data['hourly']["time"][-5:])
print()
print(data['hourly']["relativehumidity_2m"][:5])
print(data['hourly']["windspeed_10m"][:5])

## Partie 3 : construction et visualisation d’un *bad hair index*

`Pandas` est une bibliothèque puissante pour la manipulation de données.
Elle facilite la gestion, la transformation et l’analyse des données.

In [9]:
data_dict = {
    'time': data['hourly']["time"],
    'humidity': data['hourly']["relativehumidity_2m"],
    'wind_speed': data['hourly']["windspeed_10m"]
}

df = pd.DataFrame(data_dict)
df['time'] = pd.to_datetime(df['time'])  # Convertir la colonne time en objet datetime
df.head()

Nous définissons cet indice comme le produit de l’humidité relative et
de la vitesse du vent. Il s’agit d’une mesure ludique de la probabilité
d’avoir une “mauvaise coiffure” en raison des conditions
météorologiques.

In [10]:
df['bad_hair_index'] = df['humidity'] * df['wind_speed']

df.head()

In [11]:
df['day'] = df['time'].dt.day
df_daily_mean = df.groupby('day').agg({'bad_hair_index': 'mean'}).reset_index()
df_daily_mean.head()

In [12]:
sns.lineplot(x='day', y='bad_hair_index', data=df_daily_mean)
plt.title("Évolution du Bad Hair Index moyen sur 7 jours")
plt.xlabel('Jour')
plt.ylabel('Bad Hair Index moyen')

In [13]:
df['hour'] = df['time'].dt.hour
df_hourly_mean = df.groupby('hour').agg({'bad_hair_index': 'mean'}).reset_index()
df_hourly_mean.head()

In [14]:
sns.lineplot(x='hour', y='bad_hair_index', data=df_hourly_mean)
plt.title("Moyenne du Bad Hair Index heure par heure sur 7 jours")
plt.xlabel('Heure')
plt.ylabel('Bad Hair Index Moyen')