# A5 - Structures arborescentes

Nous avons déjà défini et travaillé aves les arbres binaires dans lesquels chaque noeud non-vide possède exécatement deux fils. On peut parfaitement concevoir des arbre plus généraux dans lesquels les noeuds ont un nombre quelconque de fils.

## 1 - Implémentation en python, fonctions de bases

Redéfinissons une classe `Noeud` de sorte de ne plus stocker des sous-arbres gauche et droit mais plutôt un tableau (éventuellement vide) de sous arbres.


In [1]:
class Noeud:
    """Arbres généraux"""
    def __init__(self, v, f = []):
        self.valeur = v
        self.fils = f
        
def taille(a):
    """renvoie le nombre de valeurs de l'arbre a, à compléter"""
    if a is None:
        return 0
    else:
        res = 1
        for f in a.fils:
            res+=taille(f)
        return res

def hauteur(a):
    """renvoie la hauteur de l'arbre"""
    if a is None:
        return 0
    elif a.fils == []:
        return 1
    else: 
        res = hauteur(a.fils[0])
        for i in range(1, len(a.fils)):
            h = hauteur(a.fils[i])
            if h>res:
                res=h
        return res+1
        
        
def parcours_prefixe(a):
    """affiche les valeurs de a dans l'ordre préfixe, à compléter"""
    if a is not None:
        print(a.valeur)
        for f in a.fils:
            parcours_prefixe(f)
       
def somme(a):
    """Renvoie la somme des éléments de a, à compléter"""
    if a is None:
        return 0
    else: 
        res = a.valeur
        for f in a.fils:
            res += somme(f)
        return res 

def recherche(a,v):
    """teste si la valeur v se trouve dans a, à compléter"""
    if a is None:
        return False
    elif a.valeur == v:
        return True 
    else:
        for f in a.fils: 
            if recherche(f, v):
                return True 
        return False
    
    
def minimum(a):
    """renvoie la plus petite valeur de a"""
    if a is None :
        raise IndexError
    else:
        return min([a.valeur]+[minimum(f) for f in a.fils])
        #remarque : cette façon de faire (en utlisant les tableaux créés par compréhention est utilisable dans les autres questions également)
    
        

#tests 
a = Noeud(1, [Noeud(2), Noeud(3, [Noeud(5, [Noeud(8), Noeud(9)]), Noeud(6, [])]), Noeud(4, [Noeud(7)])])
#tester vos fonctions 
print(taille(a))
print(hauteur(a))
parcours_prefixe(a)
print(somme(a))
print(recherche(a,9))
print(recherche(a,42))
print(minimum(a))


9
4
1
2
3
5
8
9
6
4
7
45
True
False
1


## 2 - Simulateur de terminal, système de fichiers

Sur les systèmes Linux, il est possible d'explorer et de gérer les fichiers et les dossiers directement dans un terminal. Les commandes principales sont les suivantes :

- ``ls`` (***l**i**s**t*) affiche les fichiers et dossiers du dossier courant ;
- ``cd <dossier>`` (*change directory*) permet de changer de dossier (``..`` pouvant faire référence au dossier parent) ;
- ``touch <nouveau_fichier>`` permet de créer un fichier vide ;
- ``mkdir <nouveau_dossier>`` (*make directory*) permet de créer un dossier vide. 




**A FAIRE :**
**tester ces commandes dans un terminal**



Le dossier courant est toujours affiché au début de la ligne :

``<utilisateur>@<machine> <chemin du dossier>``

On trouve souvent le symbole ``~`` pour désigner le dossier ``/home/<votre dossier personnel>``. 

Vous pouvez trouver plus de détails sur l'arborescence des fichiers Linux <a href = "https://www.malekal.com/les-repertoires-systemes-arborescence-linux/">ici</a>. 


### Activité

On se propose de recréer un Python un système d'arborescence de fichiers proposant des commande similaires


In [3]:
class Directory:
    """
    La classe dossier, similaire à Noeud mais comportant en plus une référence au dossier parent
    childs représente ce que contient le dossier, c'est un tableau de dossiers ou de fichiers
    """
    def __init__(self, name, parent):
        self.name = name
        self.parent = parent
        self.children = []
        
class File:
    """La classe fichier, définie par un nom, un dossier parent et un contenu"""
    def __init__(self, name, parent):
        self.name = name
        self.parent = parent
        self.content = ""
        
def is_dir(c):
    """Teste si c est un dossier"""
    return str(type(c)) == "<class '__main__.Directory'>"

def is_file(c):
    """Teste si c est un fichier"""
    return str(type(c)) == "<class '__main__.File'>"


ROOT = Directory("", None) #la racine de l'arborescence
DIR = ROOT #le dossier courant, modifié par la commande cd

def ls():
    """
    Affiche la liste des noms des dossiers et fichiers du dossier courant 
    """
    for c in DIR.children:
        print(c.name)

def cd(name):
    """
    change le dossier courant
    name doit être le nom d'un dossier contenu dans le dossier courant ou .. pour faire référence au parent
    """
    global DIR 
    if name == "..":
        DIR = DIR.parent
    else:
        for c in DIR.children: 
            if is_dir(c) and c.name == name: 
                DIR = c 
                break
    

def mkdir(name):
    """
    créer un nouveau dossier dans le dossier courant
    le nom name ne doit pas être déjà utilisé dans le dossier courant 
    """
    if name in [f.name for f in DIR.children]+[".."]:
        print("dossier ou fichier existant !")
    else:
        DIR.children.append(Directory(name, DIR))

def touch(name): 
    """
    créer un nouveau fichier dans le dossier courant
    le nom name ne doit pas être déjà utilisé dans le dossier courant 
    """
    if name in [f.name for f in DIR.children]+[".."]:
        print("dossier ou fichier existant !")
    else:
        DIR.children.append(File(name, DIR))

def edit(name, content):
    """
    modifie le contenu du fichier 
    """
    for c in DIR.children: 
        if c.name == name and is_file(c):
            c.content = content 
            break
        
def path(): 
    """renvoie le chemin de la racine vers le dossier courant sous la forme /dir1/dir2/..."""
    t = []
    r = DIR
    while r != ROOT:
        t.append(r.name)
        r = r.parent
    res = "/"
    for i in range(len(t)):
        res+=t[-1-i]
        if i!=len(t)-1:
            res+="/"
    return res

def python3(name):
    """exécute un fichier python"""
    for c in DIR.children: 
        if c.name == name and is_file(c):
            exec(c.content) 
            break
    

mkdir("dos1")
mkdir("dos2")
touch("config.txt")
cd("dos1")
mkdir("Documents")
cd("..")
ls()
cd("dos1")
cd("Documents")
print(path())

dos1
dos2
config.txt
/dos1/Documents


Une fois ces fonctions codées, créer une petite arborescence contenant à partir de la racine :
- un dossier ``programmes`` ;
- un dossier ``perso`` contenant des sous-dossiers ``Documents``, ``Images``, etc.

In [5]:
# pour réhinitialiser la simulation 
ROOT = Directory("", None) 
DIR = ROOT 

mkdir("perso")
mkdir("programmes")
cd("perso")
mkdir("Documents")
cd("Documents")
touch("la_liste_de_mes_mdp.txt")
touch("mon_dm_de_maths.tex")
cd("..")
mkdir("Images")
cd("Images")
mkdir("Vacances_a_ibiza")
mkdir("Scans_parfaitement_legaux")
cd("..")
mkdir("Vidéos")
cd("Vidéos")
mkdir("Compilations_de_mes_meilleurs_snap")
mkdir("Projet_de_chaine_youtube")
cd("..")
cd("..")
cd("programmes")
touch("mon_projet_de_NSI.py")
edit("mon_projet_de_NSI.py", "for i in range(5):\n    print('coucou')")
cd("..")
cd("programmes")
python3("mon_projet_de_NSI.py")


coucou
coucou
coucou
coucou
coucou


## 3 - Le format XML 

Le format XML est un format de stockage d'informations arborescentes. Comme le langage HTML, il repose sur l'utilisation de balises <> mais en laissant une liberté quasi totale pour les noms et les attributs de celles-ci.

Prenons un exemple de fichier XML

Un document est composé de **balises ouvrantes** comme ``<recette difficulté = "facile">`` et des **balises fermantes** correspondantes comme ``</recette>``. Ici ``recette`` est le **nom** de la balise et ``difficulté"`` en est un **attribut** dont la **valeur** est ``"facile"``. 

Pour être bien formé, un document XML doit respecter un certain nombre de contraintes : 
- les balises doivent être bien parenthésées (on considère que chaque nom de balise constitue une parethèse d'un type différent) ;
- les balises sont sensible à la casse (``recette`` diférent de ``rEcEtTe``) ;
- tout le documents est placé dans une unique **balise racine** ;
- les valeurs d'attributs sont données et délimitées par des guillemets ;
- il ne peut pas y avoir deux attributs du même nom dans une même balise ;
- pour utiliser les caractères ``<``,``>``,``'`` et ``"`` on utilise leur version échapée ``&lt;``,``&gt;``,``&amp;``, et ``&quot;`` ;
- n'importe quel caractère unicode peut être échapé avec la syntaxe ``&#code`` où ``code`` est remplacé par son code unicode en base 10. 

On se rend compte que le format xml est en fait une structure d'arbre. 

*schéma arbre fichier xml*

On utilise un standard appelé DOM (*Document Object Model*) pour définir une classe abstraite qui sera adaptée selon le langage de programmation et ayant une structure arborescente. En voici les attributs : 

- **Type** : un noeud peur être un texte, un noeud ou un noeud document (racine).
- **Nom** : le nom du nom, par exemple recette. Un texte à pour nom ``"#text"``, le noeud document a pour nom ``"#document"``.
- **Valeur** : pour les noeuds textes, il s'agît du texte les composant, par exemple ``"ajouter le lait"``.
- **fils** : chaque noeud non-texte a une liste (éventuellement vide) de noeud fils. 
- **parent**: chaque noeud non-document a un unique noeud parent. 

Voyons comment ces informations se manipulent en Python : 

In [6]:
#attention, téléchargez localement ou réécrivez le fichier recette.xml pour que ce code marche 
import xml.dom.minidom as dom

#création d'un arbre : 
doc1 = dom.parse("recette.xml") #pour importer un fichier xml 
doc2 = dom.parseString("<a><b>coucou</b></a>") #pour transformer une chaîne de caractère bien formée



**À faire :**

- En vous aidant de la fiche distribuée (méthode et attributs des objets DOM), affichez les informations contenues dans doc1.
- Ajouter un ingrédient à la recette ;
- Écrire une fonction récursive multiplier_quantite(node, k) multiplant les quantité de la recette ;
- Modifier certaines informations de ``doc1``, par exemple démultiplier les quantités.

In [33]:
import xml.dom.minidom as dom

def remove_whitespace(node):
    #pour dégager les noeuds remplis de rien 
    rem = []
    for c in node.childNodes:
        if c.nodeType == dom.Node.TEXT_NODE:
            if c.nodeValue.strip(' \n') == "":
                rem.append(c)
    for c in rem:
        node.removeChild(c)
    for c in node.childNodes:
        remove_whitespace(c)


def multiplier_quantite(node, k):
    #multiplie les valeurs (suppposées convertibles en int des attribus q par k)
    if node.nodeType == dom.Node.ELEMENT_NODE and node.hasAttribute("q"):
        q = node.getAttribute("q")
        node.setAttribute("q", str(int(q)*k))
    for c in node.childNodes:
        multiplier_quantite(c, k)


#import du xml
doc = dom.parse("recette.xml")     
remove_whitespace(doc)

#ajout d'un nouvel ingrédient
a = doc.createElement("i")
b = doc.createTextNode("sirop d erable")
a.setAttribute("q", "10")
a.setAttribute("u", "mL")
a.appendChild(b)
doc.childNodes[0].childNodes[3].appendChild(a)

#multiplication des quantités
multiplier_quantite(doc, 3)

#affichage du xml
print(doc.toprettyxml())

#export du xml 
f = open("recette_modifiee.xml", 'w')
f.write(doc.toprettyxml())
f.close()


<?xml version="1.0" ?>
<recette difficulte="facile">
	<titre>Crepes sucrees</titre>
	<temps>1h</temps>
	<note>pour 10 personnes</note>
	<ingredients>
		<i q="600" u="g">farine</i>
		<i q="120" u="g">sucre</i>
		<i q="6" u="">oeufs</i>
		<i q="120" u="cL">lait</i>
		<i q="30" u="mL">sirop d erable</i>
	</ingredients>
	<etapes>
		<e>melanger les ingredients solides</e>
		<e>ajouter le lait</e>
		<e>laisser reposer </e>
		<e>cuire sur une poele beuree</e>
	</etapes>
</recette>



## 4 - Le format JSON

### Description du format 

Le format JSON (*JavaScript Object Notation*) est un autre format arborescent très utilisé sur le web, plus compact et plus flexible que le xml. Voici notre recette, écrite en JSON : 


Comme on le voit, le format JSON est assez proche de la synatxe des dictionnaires Python. Détaillons un peu. On a quatre types simples utilisable en tant que valeurs : 
- ``null`` (absence de valeur) ;
- les booléens ``true`` ou ``false`` ;
- les nombres entiers ``42`` ou flottants ``3.14`` ;
- les chaînes de caractères  ``"toto``.

On agrège ensuite ces valeurs dans : 
- des tableaux dont les valeurs sont d'un des quatre types simple, ou des tableaux, ou des objets ;
- des objets, correpondant à des dictionnaires Python de sorte que 
    - les clés soient toujours des chaînes de caractères ;
    - les valeurs sont d'un des quatre types simple, ou des tableaux, ou des objets. 
    
**Remarque 1** : La possibilité de donner comme valeur d'un tableau ou d'un objet un autre tableau ou un autre objet donne au format JSON une structure arborscente. 

**Remarque 2** : Un fichier JSON n'a pas nécessairement de noeud racine. 



### JSON et Python

L'import et l'export de fichier JSON se fait en Python à l'aide du module ``json``. On a alors accès aux fonctions :

- ``load(f)`` charge le fichier ``f`` (JSON) dans un dictionnaire Python ;  
- ``dump(d, f)`` sauvegarde le dictionnaire ``d`` au format JSON dans le fichier ``f`` ;
- ``dumps(d)`` renvoie la chaîne de caractère correspondant au fichier JSON issu du dictionnaire ``d``.

Les fonctions ``dump`` et ``dumps`` acceptents les paramètres ``indent = 4`` et ``sort_keys = True`` permettant respectivement d'imprimer les fichiers avec une indentation et en triant les clés des dictionnaires par ordre alphabétique.

Pour travailler en Python sur un fichier JSON, il suffit donc de svaoir travailler avec un dictionnaire !


In [47]:
import json



# import du fichier dans un dictionnaire Python
f = open("recette.json")
recette = json.load(f)
f.close()

# modification du dictionnaire
recette["titre"] = "titre modifie"



# affichage du fichier JSON correspondant 
print(json.dumps(recette, indent = 4, sort_keys = True))

# export du JSON dans un nouveau fichier 
f = open("recette_modifiée.json", "w")
json.dump(recette, f, indent = 4, sort_keys = True)
f.close()

{
    "difficulte": "facile",
    "etapes": [
        "melanger les ingredients solides",
        "ajouter le lait",
        "laisser reposer",
        "cuire sur une poele beuree"
    ],
    "ingredients": [
        {
            "nom": "farine",
            "q": {
                "unite": "g",
                "valeur": 200
            }
        },
        {
            "nom": "sucre",
            "q": {
                "unite": "g",
                "valeur": 200
            }
        },
        {
            "nom": "oeuf",
            "q": {
                "unite": "",
                "valeur": 2
            }
        },
        {
            "nom": "lait",
            "q": {
                "unite": "cL",
                "valeur": 40
            }
        }
    ],
    "note": "pour 10 crepes",
    "temps": {
        "unite": "min",
        "valeur": 1
    },
    "titre": "titre modifie"
}


Si on veut écrire des fonctions récursives sur dictionnaire issu d'un fichier JSON, on devra pour les appels récursifs tester le type des enfants. On peut le faire avec la fonction ``isinstance(objet, type)`` testant si ``objet`` est de type ``type``. 

In [44]:
def multiplier_quantité(d, k):
    # si le noeud est un dictionnaire, on modifie les valeurs associées à la clé "q" et on appelle récursivement pour les autres
    if isinstance(d, dict):
        for att in d: 
            if att == "q": 
                d[att]["valeur"] *= k
            else: 
                multiplier_quantité(d[att], k)
    if isinstance(d, list):
        # si c'est une liste, on appelle recursivement
        for val in d: 
            multiplier_quantité(val, k)
    #pour les types simples, rien ne se passe 
    
# import du fichier dans un dictionnaire Python
f = open("recette.json")
recette = json.load(f)
f.close()

#test

multiplier_quantité(recette, 7)
print(json.dumps(recette, indent = 4))

{
    "titre": "Crepes sucrees",
    "difficulte": "facile",
    "temps": {
        "unite": "min",
        "valeur": 1
    },
    "note": "pour 10 crepes",
    "ingredients": [
        {
            "nom": "farine",
            "q": {
                "unite": "g",
                "valeur": 1400
            }
        },
        {
            "nom": "sucre",
            "q": {
                "unite": "g",
                "valeur": 1400
            }
        },
        {
            "nom": "oeuf",
            "q": {
                "unite": "",
                "valeur": 14
            }
        },
        {
            "nom": "lait",
            "q": {
                "unite": "cL",
                "valeur": 280
            }
        }
    ],
    "etapes": [
        "melanger les ingredients solides",
        "ajouter le lait",
        "laisser reposer",
        "cuire sur une poele beuree"
    ]
}
