<br>
<div align="right">Enseignant : Aric Wizenberg</div>
<div align="right">E-mail : icarwiz@yahoo.fr</div>
<div align="right">Année : 2018/2019</div><br><br><br>
<div align="center"><span style="font-family:Lucida Caligraphy;font-size:32px;color:darkgreen">Master 2 MASERATI - Cours de Python</span></div><br><br>
<div align="center"><span style="font-family:Lucida Caligraphy;font-size:24px;color:#e60000">Introduction aux formats récursifs et objets JSON</span></div><br><br>
<hr>

# Introduction aux formats récursifs

On peut désigner par **formats récursifs** une catégorie très importante de formats qui concernent :
- les **graphs et réseaux** qui sont un sujet trop complexe pour qu'on le traite dans le cadre de ce cours. Mais sachez qu'il existe un module très puissant pour cela (et installé par défaut avec Anaconda) : **networkx** 

<div class="alert alert-block alert-info"><b><i>Pour aller plus loin :</i></b>
<a href=https://networkx.github.io/documentation/stable/>Doc officielle de <b>networkx</b></a>
</div>

- les structures de type **arbres** (arbres de décisions, structures hiérarchiques...), nous allons les traiter dans le suite de cette section

On les retrouve par exemple beaucoup dans l'univers du Web. En effet trois langages sont essentiels pour cet univers, et les trois ont une dimension intrinsèquement récursive :
- le **HTML** (Hypertext Markup Language) est le langage servant à coder les pages web, et c'est un format récursif
- le **Javascript** est le langage servant à coder des possibilités nouvelles sur une page web, est intimement lié au format JSON (JavaScript Object Notation) qui est un autre format récursif (ce qui participe d'ailleurs du fait qu'on trouve aussi fréquemment des données dans ce format sur internet).
- le format **CSS** (Cascading Style Sheets) est le "langage" dans lequel est écrit l'ensemble des styles et détails esthétiques d'une page web, c'est un format reposant sur des relations fortes d'héritage, un autre format récursif à sa manière (il ne sera pas abordé dans ce cours)

# Présentation du format JSON

## Le JSON, une manière de représenter des données

Le format **JSON** (Javascript Object Notation) est extrêmement pratique, il est constitué comme un **dict** Python (ou comme un **objet sans méthode sous Javascript**, comme son nom l'indique)

C'est aussi un format récursif, mais plus optimal que les formats ML en termes de taille

Plusieurs formats spécifiques fonctionnent sur le principe du JSON, entre autres : 
- **TOPOJSON** et **GEOJSON** qui sont deux formats SIG (contenant des objets cartographiques)
- **BSON** qui est un format d'échange
- **JSON-LD** qui est un format JSON amélioré (cf. Web sémantique)
- Les **Notebooks de Jupyter**

Le **JSON** reproduit ci-dessous est d'ailleurs la représentation d'un Notebook extrêmement épurée pour ne pas être trop longue

In [None]:
mini_notebook = \
'''{
    "cells": [
        {
            "cell_type": "markdown",
            "metadata": {},
            "source": [
                "<div align=\\"center\\"><span style=\\"font-family:Comic Sans MS;font-size:32px;color:blue\\">Cours de Python</span></div>"
            ]
        },
        {
            "cell_type": "markdown",
            "metadata": {},
            "source": [
                "<div align=\\"right\\">Enseignant : *Aric Wizenberg*</div>"
            ]
        }
    ],
    "metadata": {
        "kernelspec": {
            "display_name": "Python 3",
            "language": "python",
            "name": "python3"
        },
        "language_info": {
            "codemirror_mode": {
            "name": "ipython",
            "version": 3
        },
        "file_extension": ".py",
        "mimetype": "text/x-python",
        "name": "python",
        "nbconvert_exporter": "python",
        "pygments_lexer": "ipython3",
        "version": "3.6.1"
        }
    },
    "nbformat": 4,
    "nbformat_minor": 2
}'''

# Definio una cheine de caractere con el objet json

Miramos en C:\Users\lucia\PyBooks\PyParis_XII_M2\data\MarineTraffic.json el formato json.

Contrairement aux **dict** à 1 niveau étudiés dans la première partie du cours, un **dict** issu d'une chaine de caractères en **json** est généralement constitué par une hiérarchie complète de dictionnaires et de listes imbriquées.

## Le JSON en Python

Il n'existe pas à proprement parler de type **json** en Python, il existe :
- Soit des **chaines de caractères** contenant de manière écrite un contenu en **json** (par exemple enregistré dans un fichier ou sur une page web), on les appelera **json str**, c'est le cas de la variable mini_notebook (cf.ci-dessus)
- Soit des **dictionnaires issus de chaines de caractères en json** (après affectation à une variable sous Python), qu'on peut appeler par commodité **json dict**.

En termes de typage, il n'y a aucune différence entre un **json dict** et un **dict** normal. En revanche, tous les objets / dictionnaires Python ne peuvent nécessairement être transformés en JSON (certains types ne peuvent être transformés).

Tout **json dict** est un **dict**, mais la réciproque n'est pas vraie.

Il existe un module de la bibliothèque standard de Python parfaitement adaptée, permettant de passé de l'un à l'autre, nommé **json**

In [None]:
import json

# Conversions entre json dict et json str

## json str -> json dict

Pour transformer une chaine de caractères avec du contenu **json** en **dict**, et donc l'affecter à une variable, on utilise la fonction **json.loads()** (charger)

In [None]:
mon_json = json.loads(mini_notebook)

In [None]:
type(mon_json)

**NB** : Le **__s__** final du nom de fonction **json.loads()** vient de **str**

## json dict -> json str

### Ecrire un dict en json str

On peut facilement écrire un dict en json en utilisant la fonction **json.dumps()** (jeter à la poubelle... ?)

In [None]:
ma_json_str = json.dumps(mon_json)

**NB** : Le **__s__** final du nom de fonction **json.dumps()** vient de **str**

### Ecrire les membres d'un objet en json str

On peut écrire l'ensemble des attributs d'un objet de notre classe Deplacement en utilisant la fonction native **vars(objet)**. 

Ajoutons d'abord l'objet que nous avions créé dans la section [Classes et objets](B.3.4_Classes.ipynb) à notre fichier modules/transport.py

In [None]:
from modules.transport import Deplacement

mon_deplacement = Deplacement('Paris', 'Marseille', '2016-03-15T15:30:00', '2016-03-15T22:05:00')

ma_json_str = json.dumps(vars(mon_deplacement))
ma_json_str

# Parcourir un json dict

On peut commencer par regarder quelles sont les clés de la racine du **dict** (on parle de racine pour distinguer le premier niveau de hiérarchie des niveaux inférieurs)

In [None]:
mon_json.keys()

On peut ensuite explorer le contenu de la clé *cells* de ce **json**

In [None]:
mon_json['cells']

Et ainsi de suite...

In [None]:
mon_json['cells'][0]

Jusqu'à arriver...

In [None]:
mon_json['cells'][0]['source']

A la donnée finale (le contenu d'une **feuille** de l'**arbre** que représente le dictionnaire)

In [None]:
mon_json['cells'][0]['source'][0]

Bien sûr toutes les sections d'un json dict sont modifiables simplement par affectation, comme les dict classiques

In [None]:
mon_json['cells'][0]['source'][0] = '<div align="center">Cours de Python / Introduction au Web-scraping</div>'

# Lecture et écriture de fichier json

## Ouvrir un fichier

In [None]:
with open('../data/MarineTraffic.json', encoding='utf-8') as fichier_nb:
    json_mt = json.load(fichier_nb)

In [None]:
json_mt.keys()

In [None]:
len(json_mt['ships'])

In [None]:
json_mt['ships'][0]

## Ecrire le json dans un fichier

On peut écrire un fichier json directement à partir de la chaine de caractère json

In [None]:
with open('../output/example.json', 'w', encoding='utf-8') as fichier:
    fichier.write(ma_json_str)

Ou encore plus directement, grâce à la fonction **json.dump()**.

In [None]:
with open('../output/example.json', 'w', encoding='utf-8') as fichier:
    json.dump(vars(mon_deplacement), fichier)

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://docs.python.org/3/library/json.html> Doc officielle du <b>module json</b></a></div>