# <center> Chapitre 6 : Structures imbriquées</center>

Il existe en python deux types de structures de données permettant de regrouper des informations : les listes et les dictionnaires. Ces structures de données peuvent contenir des informations de différents types : entiers, flottants, booléens, chaînes de caractères voire d'autres structures (tableaux ou dictionnaires). On parle alors de structures imbriquées (structures de données dans d'autres structures de données).

Si on a une structure imbriquée dans une autre (tableau dans un tableau, dictionnaire dans un dictionnaire, dictionnaire dans tableau ou tableau dans un dictionnaire), on parle d'une structure imbriquée de niveau 2.

Si on a une structure imbriquée dans une autre structure, elle-même imbriquée dans une autre structure, on parle d'une structure imbriquée de niveau 3.

Théoriquement, on peut avoir autant d'imbrication que l'on souhaite (structure imbriquée de niveau $k$, $k \ge 1$) mais dans la pratique, on dépasse rarement le niveau 2 ou 3. 


Les structures de données imbriquées permettent de stocker des informations de manière structurée.

## Exemple

On peut regrouper les informations d'un lauréat du prix nobel (nom et prénom, année du prix nobel, domaine) dans un dictionnaire. Par exemple : 

In [1]:
np2018 = {
    "nom"     : "Donna Strickland",
    "année"   : 2018,
    "domaine" : "Physique"
}

Si l'on souhaite regrouper dans une variable l'ensemble des prix nobels, alors cette variable est un tableau de prix nobels. Autrement dit, on a un tableau dont chaque case contient un prix nobel, c'est-à-dire un dictionnaire.

Comme on a un tableau contenant un dictionnaire, on a une structure imbriquée. Par exemple, voici un tableau contenant les 5 derniers prix nobels attribués à des femmes :

In [None]:
nobels_femmes = [
    {
        "nom"     : "Donna Strickland",
        "année"   : 2018,
        "domaine" : "Physique"
    },
    {
        "nom"     : "Frances Arnold",
        "année"   : 2018,
        "domaine" : "Chimie"
    },
    {
        "nom"     : "Nadia Murad",
        "année"   : 2018,
        "domaine" : "Paix"
    },
    {
        "nom"     : "Tu Youyou",
        "année"   : 2015,
        "domaine" : "Physiologie ou médecine"
    },
    {
        "nom"     : "Svetlana Aleksievitch",
        "année"   : 2015,
        "domaine" : "Littérature"
    } 
]

On a une structure de niveau 2. Plus précisément, on a un tableau de 5 cases, chaque case contenant un dictionnaire possédant 3 entrées (couples clés/valeurs).

## Accès aux informations d'une structure imbriquée

 Pour accéder aux informations d'une structure de données imbriquée, on va du plus général (structure de données contenant les autres) au plus précis.
 
 Par exemple, l'exemple suivant permet d'afficher le domaine du prix nobel de la dernière case : 

In [None]:
nobel = nobels_femmes[4] #nobel correspond au prix nobel reçu par Svetlana Aleksievitch en 2015 en Littérature

#nobel est donc un dictionnaire

print(nobel["domaine"])


Pour accéder à l'information, on a utilisé une variable temporaire `nobel` qui est égal à (ie, c'est un alias) `nobels_femme[4]`. On peut accéder à cette information sans passer par une variable temporaire : 

In [None]:
print(nobels_femmes[4]["domaine"])

Pour accéder directement à une information stockée dans une structure de données de niveau 2, on utilise alors `variable[...][...]`.

Pour accéder directement à une information stockée dans une structure de données de niveau 3, on utilise alors `variable[...][...][...]`.


* **Sur ce thème :** Exercice 1, TD 6

## Copie d'une structure imbriquée

Lorsque l'on manipule des structures de données, les variables contiennent des alias sur les structures. Ainsi, dans le code suivant : 

In [None]:
tab = [1, 2, 3, 4, 5]
tab2 = tab

il n'y a qu'un tableau en mémoire et deux alias `tab` et `tab2` qui renvoient au même tableau. Si l'on change une case de `tab`, cela modifie aussi `tab2`.

In [None]:
tab[0] = 18
print(tab)
print(tab2)

Pour créer une copie et avoir deux tableaux différents, il faut utiliser `S.copy()` où `S` est une structure de données (liste ou dictionnaire).

In [None]:
tab2 = tab.copy()
tab[0] = 42
print(tab)
print(tab2)

**Remarque :** Ceci est identique pour les dictionnaires.

Si l'on a une structure de données imbriquée, la fonction `S.copy()` créera une nouvelle structure mais les données à l'intérieur seront des alias plutôt que des copies de structures. 

In [None]:
tab2 = nobels_femmes.copy()
tab2.append("une nouvelle valeur")

print("taille = ", len(nobels_femmes))
print("taille = ", len(tab2))

nobels_femmes[4]["domaine"] = "mathématique"
print(tab2[4])


Pour faire une vraie copie, il faut alors utiliser `deepcopy(S)` du module `copy`. Dans ce cas, toutes les structures de données (la principale et toutes celles contenues dedans) sont recopiées.

In [None]:
from copy import *

tab3 = deepcopy(nobels_femmes)
nobels_femmes[4]["domaine"] = "linguistique"
print(tab3[4])


**Attention :** La copie via `deepcopy` recopie tous les objets de la structure de données, ce qui peut faire beaucoup ! Il faut donc l'utiliser uniquement quand cela est nécessaire (quand on souhaite vraiment une vraie copie).

## Parcours de structures imbriquées

Si une structure de données a une forme spécifique (un tableau dont chaque case contient un tableau par exemple), on peut alors parcourir toutes les données de la structure en utilisant des boucles imbriquées.

In [None]:
matrice = [
    [2,3,4],
    [4,3,2],
    [7,8,9]
]

# Faire la somme des nomres de la matrice

somme = 0
ligne = 0
while ligne < 3:
    colonne = 0
    while colonne < 3:
        somme += matrice[ligne][colonne]
        colonne += 1
    ligne += 1
print("somme = ", somme)


* **Sur ce thème :** Exercices 2 et 3, TD 6

## Structures imbriquées et format JSON

(*Issu de wikipédia*) Le format JSON est un format de données textuelles. Il permet de représenter de l’information structurée comme le permet XML par exemple. Un document JSON ne comprend que deux types d'éléments structurels :

* des ensembles de paires « nom » (alias « clé ») / « valeur » ;

* des listes ordonnées de valeurs.

Ces mêmes éléments représentent trois types de données :

* des dictionnaires ;

* des tableaux ;

* des valeurs de type booléen (`true` et `false`), nombre, chaîne ou `null`.



Le format JSON est indépendant du langage Python mais celui-ci peut facilement créer, à partir d'une structure de données imbriquée, une chaîne de caractères au format JSON représentant cette structure de données (fonction `dumps`). Python peut également, à partir d'une chaîne au format JSON, créer une variable (structure de données imbriquées) contenant les informations de la chaîne (fonction `loads`).

Les fonctions `dumps` et `loads` sont dans le module `json`

In [None]:
from json import dumps, loads

s = dumps(nobels_femmes) # s est une chaîne de caractères contenant les informations de nobels_femmes

print(s)

test = loads(s) # test est une variable contenant les informations de s. 
                # C'est donc une copie (deepcopy) de nobels_femmes

print(len(test))

Le format JSON est utile pour : 

- communiquer avec d'autres programmes (communication au format JSON)

- la lecture et l'écriture dans des fichiers

In [None]:
# Ecriture des informations de nobels_femmes dans le fichier nobels.txt
f = open("nobels.txt", "w") # Ouverture du fichier nobels.txt en écriture
f.write(s) # On écrit dans le fichier la chaîne s contenant toutes les informations (format JSON)
f.close() # On ferme le fichier


# Création d'une variable à partir des informations contenues dans nobels.txt
f = open("nobels.txt", "r") # Ouverture du fichier nobels.txt en lecture
chaine = f.read() # On lit dans le fichier toutes les informations et on retourne la chaîne au format JSON
f.close() # On ferme le fichier

data = loads(chaine)
print(data)