# JSON

## Introduction

https://www.w3schools.com/python/python_json.asp

JSON (JavaScript Object Notation) est un format permettant de transcrire des données en texte. Ce format est de plus en plus utilisé par les développeurs. Les données sont classées en objets et sous la forme d'une structure arborescente :

une racine a une clé (le nom de l'objet)
ses branches ont des clés et des valeurs (les attributs de l'objet)


Voici à quoi ressemble un objet JSON :

In [None]:
{
    "nom": "Alice",
    "age": 30,
    "ville": "Paris",
    "estEtudiant": false,
    "hobbies": ["lecture", "voyage", "musique"],
    "adresse": {
        "rue": "123 Rue de la Paix",
        "codePostal": "75001",
        "pays": "France"
    }
}

Un fichier JSON, comme un fichier CSV, est un fichier texte. L'extension du nom de fichier nous sert simplement à savoir comment l'interpréter.
Tu peux utiliser la bibliothèque json pour interpréter (on dit "parser") ce texte par python.

In [None]:
import json

text = """{
    "key1": "value1",
    "key2": "value2"
     }"""

data = json.loads(text)

Ce texte est alors interprété par python comme des dictionnaires et des listes imbriqués. Tu peux donc maintenant t'en servir comme tu as l'habitude :



```
data['key2']
>>> 'value2'
```

Il faut donc jongler entre les listes et les dictionnaires imbriqués. Sur le premier exemple en haut de cette page, si on veut afficher chacun des hobbies, il faut donc faire :



```
for hobby in data['student']['hobbies']:
  print(hobby)

>>> World of Warcraft
>>> Tacos
>>> Drink tears
```



## Charger un fichier JSON

In [None]:
with open("complex_data.json", "r") as file:
    data = json.load(file)

In [None]:
import json
import requests

link = "https://raw.githubusercontent.com/murpi/wilddata/master/quests/monthlySalesbyCategoryMultiple.json"

# récupère le contenu du fichier à partir de l'url
r = requests.get(link)


# acceder au contenu texte avec cette fonction
r.text
# charger le fichier
data = json.loads( r.text)
data

## JSON pandas

In [1]:
import pandas as pd
from pandas import json_normalize

In [2]:
data = [
    {
        "id": 1,
        "nom": "Alice",
        "adresse": {
            "ville": "Paris",
            "codePostal": "75001"
        },
        "hobbies": ["lecture", "voyage"]
    },
    {
        "id": 2,
        "nom": "Bob",
        "adresse": {
            "ville": "Lyon",
            "codePostal": "69001"
        },
        "hobbies": ["musique", "sport"]
    }
]

In [3]:
df = json_normalize(data)
print(df)

   id    nom            hobbies adresse.ville adresse.codePostal
0   1  Alice  [lecture, voyage]         Paris              75001
1   2    Bob   [musique, sport]          Lyon              69001


json_normalize offre plusieurs options pour personnaliser le processus d'aplatissement :

**record_path** : Si tu as des tableaux imbriqués, tu peux spécifier le chemin vers ces tableaux.

**meta** : Tu peux inclure des champs supplémentaires qui ne sont pas dans le tableau principal.

Le paramètre **record_path** est utilisé pour spécifier le chemin vers les enregistrements que tu souhaites aplatir. Cela est particulièrement utile lorsque tu as des tableaux imbriqués dans ton JSON. En utilisant record_path, tu peux indiquer à json_normalize où trouver les données que tu veux extraire.

In [7]:
import pandas as pd
from pandas import json_normalize

data = {
    "utilisateurs": [
        {
            "id": 1,
            "nom": "Alice",
            "commandes": [
                {"id": 101, "produit": "Livre"},
                {"id": 102, "produit": "Stylo"}
            ]
        },
        {
            "id": 2,
            "nom": "Bob",
            "commandes": [
                {"id": 103, "produit": "Cahier"}
            ]
        }
    ]
}

# Utilisation de json_normalize avec record_path
df = json_normalize(data, record_path=['utilisateurs', 'commandes'])
print(df)

    id produit
0  101   Livre
1  102   Stylo
2  103  Cahier


Le paramètre meta te permet d'inclure des informations supplémentaires provenant de la structure JSON d'origine dans le DataFrame résultant. Cela est utile lorsque tu veux conserver des informations contextuelles qui ne sont pas directement dans le tableau que tu es en train d'aplatir.

In [10]:
import pandas as pd
from pandas import json_normalize

data = {
    "utilisateurs": [
        {
            "id_": 1,
            "nom": "Alice",
            "commandes": [
                {"id": 101, "produit": "Livre"},
                {"id": 102, "produit": "Stylo"}
            ]
        },
        {
            "id_": 2,
            "nom": "Bob",
            "commandes": [
                {"id": 103, "produit": "Cahier"}
            ]
        }
    ]
}

# Utilisation de json_normalize avec record_path et meta
df = json_normalize(
    data['utilisateurs'],
    record_path='commandes',
    meta=['id_', 'nom']
)

print(df)

    id produit id_    nom
0  101   Livre   1  Alice
1  102   Stylo   1  Alice
2  103  Cahier   2    Bob


- **record_prefix** : Ajoute un préfixe aux colonnes qui proviennent des enregistrements spécifiés par record_path. Cela aide à identifier facilement les colonnes des enregistrements.

- **meta_prefix** : Ajoute un préfixe aux colonnes qui proviennent des métadonnées spécifiées par meta. Cela permet d'éviter les conflits de noms entre les colonnes des enregistrements et celles des métadonnées.

Le paramètre **record_prefix** te permet d'ajouter un préfixe aux colonnes qui proviennent des enregistrements spécifiés par record_path. Cela aide à identifier facilement les colonnes qui proviennent de cette partie de la structure JSON.

In [11]:
import pandas as pd
from pandas import json_normalize

data = {
    "utilisateurs": [
        {
            "id": 1,
            "nom": "Alice",
            "commandes": [
                {"id": 101, "produit": "Livre"},
                {"id": 102, "produit": "Stylo"}
            ]
        },
        {
            "id": 2,
            "nom": "Bob",
            "commandes": [
                {"id": 103, "produit": "Cahier"}
            ]
        }
    ]
}

# Utilisation de json_normalize avec record_prefix
df = json_normalize(
    data['utilisateurs'],
    record_path='commandes',
    meta=['id', 'nom'],
    record_prefix='commande_'
)

print(df)

   commande_id commande_produit id    nom
0          101            Livre  1  Alice
1          102            Stylo  1  Alice
2          103           Cahier  2    Bob


Le paramètre **meta_prefix** fonctionne de manière similaire, mais il est utilisé pour ajouter un préfixe aux colonnes qui proviennent des métadonnées spécifiées par le paramètre meta. Cela est utile lorsque tu veux éviter les conflits de noms entre les colonnes provenant des enregistrements et celles provenant des métadonnées.

In [12]:
df = json_normalize(
    data['utilisateurs'],
    record_path='commandes',
    meta=['id', 'nom'],
    record_prefix='commande_',
    meta_prefix='utilisateur_'
)

print(df)

   commande_id commande_produit utilisateur_id utilisateur_nom
0          101            Livre              1           Alice
1          102            Stylo              1           Alice
2          103           Cahier              2             Bob


# API

## API REST

Une API est une interface d'échange entre plusieurs langages. Une RESTful API, ou API REST, est une API avec un formalisme spécifique, notamment :

La requête s'effectue avec le protocole HTTP (le même que dans un navigateur web)
Le résultat est sous forme de JSON, donc de listes et de de dictionnaires imbriqués.

In [13]:
import requests
link = 'https://api.chucknorris.io/jokes/random'
r = requests.get(link)
print(r)

<Response [200]>


Le résultat est un code 200, cela signifie que le protocole HTTP a bien transféré des données

Pour accéder au contenu, tu peux utiliser la méthode .json() :

In [14]:
import requests
link = 'https://api.chucknorris.io/jokes/random'
r = requests.get(link)
print(r.json())

{'categories': [], 'created_at': '2020-01-05 13:42:21.179347', 'icon_url': 'https://api.chucknorris.io/img/avatar/chuck-norris.png', 'id': '2b-cx_sQT_yy3LlU7s71og', 'updated_at': '2020-01-05 13:42:21.179347', 'url': 'https://api.chucknorris.io/jokes/2b-cx_sQT_yy3LlU7s71og', 'value': 'Chuck Norris can make a virgin go ass-to-mouth on a first date.'}


In [15]:
import pprint

pprint.pprint(r.json())

{'categories': [],
 'created_at': '2020-01-05 13:42:21.179347',
 'icon_url': 'https://api.chucknorris.io/img/avatar/chuck-norris.png',
 'id': '2b-cx_sQT_yy3LlU7s71og',
 'updated_at': '2020-01-05 13:42:21.179347',
 'url': 'https://api.chucknorris.io/jokes/2b-cx_sQT_yy3LlU7s71og',
 'value': 'Chuck Norris can make a virgin go ass-to-mouth on a first date.'}


Exemple avec un clef

In [None]:
import requests
link = "https://nominatim.openstreetmap.org/?q=54+Via+Pietro+Mascagni,Catania,Italy&format=json"
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:91.0) Gecko/20100101 Firefox/91.0',
    'Referer': 'https://www.example.com'
}
r = requests.get(link, headers=headers).json()
r

# GEOCODING

https://colab.research.google.com/drive/1JWmAQsTBHmdCe4jikEB1v61HcE5gCZMF?usp=sharing

In [None]:
import folium

# Carte avec le cadre Français

map_fr = folium.Map()
map_fr.fit_bounds(
    bounds =[
            [41.2611155, -5.4517733],
            [51.3055721, 9.8282225]
    ]
)

# Ajouter les élèves
# Faites un boucle pour associer une localisation à chaque ligne employé
for i,row in df.iterrows() :
   folium.Marker(
        location= row['coordonnees'],
        popup= row["employé"]
        ).add_to(map_fr)


# Ajout le pt de rencontre
icon_rencontre = folium.Icon(color='red')
popup_rencontre = folium.Popup(f'le point de rencontre se trouve à {region_rencontre}')

folium.Marker(
   location = pt_rencontre,
   popup= "lieu rencontre",
   icon= icon_rencontre).add_to(map_fr)


map_fr