<a href="https://colab.research.google.com/github/lugsantistebanji/WCS-IA/blob/main/WCS_IA_Dojo_API.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# __Mini-Projet de Groupe : "Voyage Virtuel - Explorer le Monde en JSON"__

## __Objectif du Projet__

Vous allez explorer et manipuler des fichiers JSON, utiliser des APIs de géocodage et visualiser des données géographiques. Vous devrez transformer des données brutes eninformations exploitables en structurant des données en JSON et en les affichant sous forme de tableau et de carte interactive.

## __Compétences utilisées :__

JSON, Pandas, API REST, GeoCoding

## __Rappels Théoriques__

___

### __1. Le format JSON__

Le JSON (JavaScript Object Notation) est un format de fichier utilisé pour stocker et échanger des données. Il est structuré en paires clé-valeur et peut contenir des tableaux et des objets imbriqués.

Exemple d’un fichier JSON :
```json
{
    "city": {
        "name": "Tokyo",
        "country": "Japan",
        "population": 13929286,
        "coordinates": {
            "latitude": 35.682839,
            "longitude": 139.759455
            },
        "main_attractions": ["Shibuya Crossing", "Tokyo Tower", "Akihabara"]
    }
}
```
Principales caractéristiques : Les clés sont toujours des chaînes de caractères
Les valeurs peuvent être des nombres, chaînes, booléens, tableaux ou objets imbriqués
Utilisé dans les APIs, les bases de données NoSQL, et la communication entre services web.

__Question 1__ :

Quelle est la différence entre un dictionnaire Python et un JSON ?

__R//__  Un dictionnaire est une structure de données propre à Python, tandis que JSON est un format standard utilisé pour échanger des informations entre systèmes

__Question 2__ :

Comment représenter une liste d’objets dans un fichier JSON ?

__R//__ On peut représenter un objet en JSON en utilisant la structure `clé:valeur`, et une liste d'objets sous forme d'un tableau (array) contenant plusieurs objets.

___

### __2. Manipulation du JSON en Python__

Pour travailler avec des fichiers JSON en Python, on utilise le module json.

Lire un fichier JSON :

```python
import json

# Charger un fichier JSON

with open("data.json", "r", encoding="utf-8") as file:
data = json.load(file)
Accéder aux données :
print(data["city"]["name"]) # Tokyo
print(data["city"]["coordinates"]["latitude"]) # 35.682839
Écrire dans un fichier JSON :
new_data = {"name": "Paris", "country": "France"}
with open("new_data.json", "w", encoding="utf-8") as file:
json.dump(new_data, file, indent=4)

```

__Question 3__ :

Quelle est la différence entre json.load() et json.loads() ?

__R//__ `json.load()` est utilisé pour charger un fichier JSON directement depuis un fichier ouvert. `json.loads()` est utilisé pour charger une chaîne de caractères (str, bytes ou bytearray) contenant un JSON.

__Question 4__ :

Comment ajouter une nouvelle ville dans un fichier JSON existant ?

__R//__ En utilisant `with open()`, on charge le fichier JSON en tant que dictionnaire Python, on ajoute la nouvelle ville, puis on réécrit le fichier

___

### __3. Transformer un JSON en DataFrame Pandas__

Lorsqu'on récupère des données en JSON, il est souvent utile de les convertir en DataFrame pour mieux les analyser avec pandas.

Convertir un JSON en DataFrame :

```python
import pandas as pd
df = pd.json_normalize(data["city"])
print(df)
```

Cela permet d'obtenir une table avec les différentes colonnes correspondant aux données JSON.


__Question 5__ : Pourquoi pd.json_normalize() est-il utile pour manipuler les JSON imbriqués ?

__R//__ il permet de transformer une JSON imbriquré en un DataFrame, avec lignes et colonnes.

__Question 6__ : Que se passe-t-il si un JSON a des niveaux d’imbrication trop profonds ?

__R//__ certaines données resteront sous forme de dictionnaires ou de listes au lieu d’être transformées en colonnes distinctes.

___

### __4. Utilisation d’une API REST__

Une API REST permet de récupérer des informations dynamiques via le web. Vous pouvez interroger une API pour obtenir des informations sur une ville (exemple : météo, géolocalisation).

Exemple de requête vers une API de géocodage :

```python
import requests

city = "Tokyo"
api_url = f"https://nominatim.openstreetmap.org/search?city={city}&format=json"
response = requests.get(api_url)
data = response.json()
print(data[0]) # Affichage des infos de la ville
```

Les données récupérées sont souvent en format JSON, que vous pouvez analyser et
structurer.

__Question 7__ :

Comment récupérer la latitude et la longitude d’une ville via une API REST ?

__R//__ Utilisant les clés `lat` et `lon`

__Question 8__ :

Quelle est la différence entre requests.get().json() et json.loads(requests.get().text) ?

__R//__ `requests.get().json()` et `json.loads(request.get().text()` on le méme propos, c'est donner un objet de type `dic` à partir d'une requete a une url.

In [23]:
import requests

city = "Tokyo"
api_url = f"https://nominatim.openstreetmap.org/search?city={city}&format=json&limit=1"
headers = {
    'user-agent' : 'Mozilla/5.0 (X11; Linux x86_64; rv:128.0) Gecko/20100101 Firefox/128.0'
}
response = requests.get(api_url ,headers=headers)
data = response.json()
print(data[0]) # Affichage des infos de la ville

{'place_id': 243209120, 'licence': 'Data © OpenStreetMap contributors, ODbL 1.0. http://osm.org/copyright', 'osm_type': 'relation', 'osm_id': 1543125, 'lat': '35.6768601', 'lon': '139.7638947', 'class': 'boundary', 'type': 'administrative', 'place_rank': 8, 'importance': 0.82108616521785, 'addresstype': 'province', 'name': '東京都', 'display_name': '東京都, 日本', 'boundingbox': ['20.2145811', '35.8984245', '135.8536855', '154.2055410']}


___

### __5. Visualisation des villes sur une carte avec Folium__

Pour afficher les villes sur une carte, on peut utiliser la bibliothèque folium.

Créer une carte et ajouter un marqueur :

```python
import folium
# Créer une carte centrée sur Paris
map = folium.Map(location=[48.8566, 2.3522], zoom_start=5)
# Ajouter un marqueur pour Tokyo
folium.Marker(location=[35.682839, 139.759455], popup="Tokyo").add_to(map)
# Sauvegarder la carte
map.save("map.html")
```

Cela permet d’obtenir une carte interactive affichant les villes sélectionnées.

__Question 9__ :

Comment ajouter plusieurs marqueurs sur une carte avec Folium ?

__R//__ On peut ajouter plusieurs marqueurs à une carte en utilisant une boucle et la méthode `folium.Marker().add_to()` pour chaque point. Cela permet d’ajouter dynamiquement des marqueurs à partir d'une liste de coordonnées ou de données.

__Question 10__ :

Quelle est l’utilité du paramètre popup dans folium.Marker() ?

__R//__ Le paramètre popup permet d'afficher de l'information (texte, images, etc.) lorsqu'un utilisateur clique sur un marqueur sur la carte. Cela permet d'ajouter des détails supplémentaires au marqueur, comme des descriptions, des liens ou des images.

___

## __Exercices à Réaliser__

___

### __1. Création d’un Fichier JSON__

#### __Objectif__ :

Créer un fichier cities.json contenant au moins 5 villes avec les
informations suivantes :

- Nom de la ville
- Pays
- Coordonnées géographiques (latitude & longitude)
- Attractions principales
- Spécialités culinaires

Exemple attendu :
```json
{
    "cities": [
        {
            "name": "Tokyo",
            "country": "Japan",
            "latitude": 35.682839,
            "longitude": 139.759455,
            "main_attractions": ["Shibuya Crossing", "Tokyo Tower"],
            "food_specialties": ["Sushi", "Ramen"]
        }
    ]
}
```

#### __Critère de validation :__

Le fichier JSON doit être lisible, bien structuré et complet.

In [15]:
import json

In [16]:
cities = {
    "cities": [
        {
            "name": "Bogotá",
            "country": "Colombia",
            "latitude": 4.7110,
            "longitude": -74.0721,
            "main_attractions": ["Monserrate", "La Candelaria", "Museo del Oro"],
            "food_specialties": ["Ajiaco", "Tamales", "Arepas"]
        },
        {
            "name": "Barcelona",
            "country": "Spain",
            "latitude": 41.3874,
            "longitude": 2.1686,
            "main_attractions": ["Sagrada Familia", "Parc Güell", "La Rambla"],
            "food_specialties": ["Paella", "Tapas", "Pan con tomate"]
        },
        {
            "name": "New York",
            "country": "United States",
            "latitude": 40.7128,
            "longitude": -74.0060,
            "main_attractions": ["Statue of Liberty", "Times Square", "Central Park"],
            "food_specialties": ["Pizza", "Bagels", "Hot Dogs"]
        },
        {
            "name": "Londres",
            "country": "United Kingdom",
            "latitude": 51.5074,
            "longitude": -0.1278,
            "main_attractions": ["Big Ben", "Buckingham Palace", "Tower of London"],
            "food_specialties": ["Fish and Chips", "Full English Breakfast", "Sunday Roast"]
        },
        {
            "name": "Paris",
            "country": "France",
            "latitude": 48.8566,
            "longitude": 2.3522,
            "main_attractions": ["Eiffel Tower", "Louvre Museum", "Notre-Dame Cathedral"],
            "food_specialties": ["Croissants", "Baguettes", "Escargots"]
        }
    ]
}

In [17]:
with open("cities.json", "w") as file:
    json.dump(cities, file, indent = 4)

___

### __2. Charger et Analyser le JSON avec Pandas__

#### __Objectif :__

Convertir le JSON en DataFrame, afficher les villes sous forme de tableau, et
récupérer certaines informations spécifiques.

Tâches à réaliser :

1. Charger le fichier cities.json dans Python.
2. Convertir le JSON en DataFrame pandas.
3. Afficher uniquement les noms des villes et leur pays.
4. Extraire et afficher uniquement les attractions touristiques de chaque ville.

#### __Critère de validation :__

Affichage correct des villes sous forme de tableau.

In [18]:
import pandas as pd
import json

In [22]:
data = {}
with open('cities.json', 'r') as file:
    data = json.load(file)
df = pd.json_normalize(data, record_path='cities')
df.head()

Unnamed: 0,name,country,latitude,longitude,main_attractions,food_specialties
0,Bogotá,Colombia,4.711,-74.0721,"[Monserrate, La Candelaria, Museo del Oro]","[Ajiaco, Tamales, Arepas]"
1,Barcelona,Spain,41.3874,2.1686,"[Sagrada Familia, Parc Güell, La Rambla]","[Paella, Tapas, Pan con tomate]"
2,New York,United States,40.7128,-74.006,"[Statue of Liberty, Times Square, Central Park]","[Pizza, Bagels, Hot Dogs]"
3,Londres,United Kingdom,51.5074,-0.1278,"[Big Ben, Buckingham Palace, Tower of London]","[Fish and Chips, Full English Breakfast, Sunda..."
4,Paris,France,48.8566,2.3522,"[Eiffel Tower, Louvre Museum, Notre-Dame Cathe...","[Croissants, Baguettes, Escargots]"


___

### __3. Récupérer des Coordonnées Géographiques via une API__

#### __ObObjectifjectif :__

Utiliser une API de géocodage pour enrichir le JSON avec des informations
supplémentaires.

#### __Tâches à réaliser :__

1. Faire une requête API pour récupérer les coordonnées d’une ville donnée.
2. Ajouter les coordonnées géographiques manquantes au JSON existant.
3. Stocker le résultat dans un nouveau fichier JSON enrichi.

#### __Critère de validation :__

Affichage correct des villes avec leurs coordonnées GPS.

In [None]:
import requests

In [24]:
def get_coordinates(city: str) -> tuple :
    api_url = f"https://nominatim.openstreetmap.org/search?city={city}&format=json&limit=1"
    headers = {
    'user-agent' : 'Mozilla/5.0 (X11; Linux x86_64; rv:128.0) Gecko/20100101 Firefox/128.0'
    }

    coordinates = []

    response = requests.get(api_url , headers=headers)

    if response.status_code == 200:
        data = response.json()
        coordinates = (data[0]['lon'], data[0]['lat'])
    else:
        print(response.status_code)

    return tuple(coordinates)

In [27]:
df['longitude']= df['name'].apply(lambda x : get_coordinates(x)[0])
df['latitude']= df['name'].apply(lambda x : get_coordinates(x)[1])

In [28]:
df

Unnamed: 0,name,country,latitude,longitude,main_attractions,food_specialties
0,Bogotá,Colombia,4.6533816,-74.0836333,"[Monserrate, La Candelaria, Museo del Oro]","[Ajiaco, Tamales, Arepas]"
1,Barcelona,Spain,41.3828939,2.1774322,"[Sagrada Familia, Parc Güell, La Rambla]","[Paella, Tapas, Pan con tomate]"
2,New York,United States,40.7127281,-74.0060152,"[Statue of Liberty, Times Square, Central Park]","[Pizza, Bagels, Hot Dogs]"
3,Londres,United Kingdom,51.5074456,-0.1277653,"[Big Ben, Buckingham Palace, Tower of London]","[Fish and Chips, Full English Breakfast, Sunda..."
4,Paris,France,48.8534951,2.3483915,"[Eiffel Tower, Louvre Museum, Notre-Dame Cathe...","[Croissants, Baguettes, Escargots]"


___

### __4. Visualiser les Villes sur une Carte avec Folium__

#### __Objectif :__

Créer une carte interactive affichant toutes les villes du JSON avec des
marqueurs.

#### __Tâches à réaliser :__

1. Créer une carte centrée sur l’Europe.
2. Ajouter toutes les villes du JSON en tant que marqueurs sur la carte.
3. Ajouter un popup avec le nom de la ville et son pays.

#### __Critère de validation :__

La carte interactive doit afficher toutes les villes avec des
marqueurs et leurs informations.

In [38]:
import folium

map = folium.Map(location=[0, 0], zoom_start=2)

for index, city in df.iterrows():
    folium.Marker(location=[city['latitude'],city['longitude']], popup=city['name']).add_to(map)

map

___