# Arbres

<img src="data/banniere.png" width='70%' />

<img src="data/prog.png" width='70%' />

## 1. Terminologie

### 1.1 Vocabulaire
Un arbre est une structure hiérarchique de données, composée de nœuds. Si on adopte le vocabulaire des graphes (qui seront vus plus tard dans l'année), un arbre est un graphe non orienté, connexe, sans cycle, et dans lequel un nœud joue le rôle de racine.

![](data/term.png) 


- Chaque **nœud** a exactement un seul **nœud père**, à l'exception du nœud **racine** qui est le seul nœud à ne pas avoir de père. (oui, **la** racine d'une arbre est **en haut**)
<img src="data/real_tree.png" width='30%' />
- Chaque nœud peut avoir un nombre quelconque de **fils**, dont il est le père.
- Les nœuds qui n'ont pas de fils sont appelés les **feuilles** (ou nœuds externes).
- Les nœuds qui ne sont pas des feuilles sont des **nœuds internes**.
- Le nom de chaque nœud est appelé son **étiquette**.

**Exemples :**
dans l'arbre ci-dessus,
- C est la racine, E, Z A et G sont les feuilles.
- K est le père de A et G.
- F est le père de Z.
- C est le père de B et K
- B est le père de E et F.

### 1.2 Exemples d'arbres

#### 1.2.1 La famille royale britannique
<img src="data/windsor.png" width='60%' />

Redessinez de manière plus schématique cet arbre. Pour quelle raison cet arbre a-t-il été modifié par rapport à sa version orginale (voir [ici](https://i.pinimg.com/originals/e8/d1/c7/e8d1c7b2834ce2c368848cf7fc91a057.jpg ) ), qui laissait apparaître les parents de chaque enfant ?

#### 1.2.2 Le DOM d'une page web
DOM : Document Object Model
<img src="data/dom.svg" width='40%' />

#### 1.2.3 L'arborescence d'un disque dur
Les systèmes Unix (MacOS ou GNU/Linux) organisent leur disque dur suivant l'arborescence ci-dessous :
<img src="data/arbo-unix.gif" width='40%' />

#### 1.2.4 Exercice
Quelque part à l'intérieur des dossiers contenus dans l'archive [dossiers.zip](data/dossiers.zip) se trouve un fichier ```tresor.txt```. Quel secret renferme-t-il ?

Attention, cette recherche est à faire uniquement en ligne de commande :
- ```ls``` : pour lister les dossiers et fichiers d'un répertoire
- ```cd Dossier``` : pour se rendre dans le repértoire ```Dossier```
- ```cd ..``` : pour remonter d'un niveau dans l'arborescence
- ```unzip monarchive.zip``` : pour décompresser une archive
- ```tree``` : pour afficher l'arborescence du répertoire courant
- ```sudo apt install monprog``` : pour installer le programme ```monprog``` si celui-ci est manquant.

### 1.3 Caractéristiques d'un arbre

#### 1.3.1 Outils numériques de description

![](data/carac.png)



- la **taille** d'un arbre est son nombre total de nœuds. Ici, elle vaut 8.


- l'**arité** d'un nœud est son nombre de fils. Ici, l'arité de B vaut 2, celle de F vaut 1, celle de Z vaut 0.


- la **profondeur** d'un nœud est le nombre de nœuds de son chemin le plus court vers la racine. 
Ici, la profondeur de G est 3 (G-K-C), la profondeur de B est 2 (B-C), la profondeur de Z est 4 (Z-F-B-C), la profondeur de C est 1.


- la **hauteur** d'un arbre est la profondeur de son nœud le plus profond. 
Ici, la hauteur de l'arbre est 4.
Nous prendrons comme **convention** que :
- si un arbre est réduit à **un seul nœud-racine**, sa hauteur sera **1**.
- si un arbre est **vide**, sa hauteur est **0**.

*Cette convention est celle adoptée dans le sujet 0 publié le 15/12/2020. Attention, dans certains ouvrages, l'arbre vide a pour hauteur -1, et donc l'arbre réduit à un seul nœud a pour hauteur 0, donc notre arbre a une hauteur 3.*

### 1.4 Encore du vocabulaire

#### 1.4.2 Arbres binaires
Un arbre binaire est un arbre dont chaque nœud possède **au plus** deux fils.

L'arbre généalogique de la famille royale britannique n'est pas un arbre binaire. 

L'arbre ci-dessous est lui un arbre binaire.

![](data/carac3.png)

#### 1.4.1 Sous-arbres  d'un arbre binaire

Chaque nœud d'un arbre binaire ne pouvant pas avoir plus de 2 fils, il est possible de séparer le «dessous» de chaque nœud en deux sous-arbres (éventuellement vides) : le **sous-arbre gauche** et le **sous-arbre droit**.

![](data/sousarbres.png)


- Les deux sous-arbres représentés ici sont les sous-arbres du nœud-racine T. 
- Le nœud O admet comme sous-arbre gauche le nœud H et comme sous-arbre droit le nœud N.
- Les feuilles P, H et N ont pour sous-arbre gauche et pour sous-arbre droit l'**arbre vide**.



## 2. Parcours d'arbres
Les arbres étant une structure hiérarchique, leur utilisation implique la nécessité d'un **parcours** des valeurs stockées. Par exemple pour toutes les récupérer dans un certain ordre, ou bien pour en chercher une en particulier.  

Il existe plusieurs manières de parcourir un arbre.


### 2.1 Parcours en largeur d'abord (BFS)
*BFS : Breadth First Search*

Le parcours en largeur d'abord est un parcours étage par étage (de haut en bas) et de gauche à droite.

![](data/BFS.png)

L'ordre des lettres parcourues est donc T-Y-O-P-H-N.

Les trois parcours que nous allons voir maintenant sont des parcours en **profondeur d'abord**, ou **DPS** (*Depth First Search*). Ce qui signifie qu'un des deux sous-arbres sera totalement parcouru avant que l'exploration du deuxième ne commence. 

### 2.2 Parcours préfixe
Le parcours **préfixe** est un parcours **en profondeur d'abord**. 

**Méthode du parcours préfixe :** (parfois aussi appelé *préordre*)
- Chaque nœud est visité avant que ses fils le soient.
- On part de la racine, puis on visite son fils gauche (et éventuellement le fils gauche de celui-ci, etc.) avant de remonter et de redescendre vers le fils droit.

![](data/prefixe.png)

L'ordre des lettres parcourues est donc T-Y-P-O-H-N.

### 2.3 Parcours infixe
Le parcours **infixe** est aussi un parcours en profondeur d'abord.

**Méthode du parcours infixe :** (parfois aussi appelé *en ordre*)
- Chaque nœud est visité **après son fils gauche mais avant son fils droit**.
- On part donc de la feuille la plus à gauche et on remonte par vagues sucessives. Un nœud ne peut pas être visité si son fils gauche ne l'a pas été.

![](data/infixe.png)

L'ordre des lettres parcourues est donc P-Y-T-H-O-N.

### 2.3 Parcours postfixe
Le parcours **postfixe** est aussi un parcours en profondeur d'abord.

**Méthode du parcours postfixe :** (parfois aussi appelé *post ordre*)
- Chaque nœud est visité **après ses fils les soient**.
- On part donc de la feuille la plus à gauche, et on ne remonte à un nœud père que si ses fils ont tous été visités. 

![](data/postfixe.png)

L'ordre des lettres parcourues est donc P-Y-H-N-O-T.

### 2.4 Comment ne pas se mélanger entre le pré / in / post fixe ?
- *pré* veut dire *avant*
- *in* veut dire *au milieu*
- *post* veut dire *après*

Ces trois mots-clés parlent de la place du **père** par rapport à ses fils. 
Ensuite, il faut toujours se souvenir qu'on traite le fils gauche avant le fils droit.

- préfixe : le père doit être le premier par rapport à ses fils.
- infixe : le père doit être entre son fils gauche (traité en premier) et son fils droit.
- postfixe : le père ne doit être traité que quand ses deux fils (gauche d'abord, droite ensuite) l'ont été.

Un parcours préfixe commencera toujours par la racine, alors qu'un parcours postfixe finira toujours par la racine. Dans un parcours infixe, la racine sera «au milieu» (pas nécessairement parfaitement).

### 2.5 Exercice 1

![](data/exo_parcours.png)

Donner le rendu de chaque parcours :
1. Parcours en largeur 
2. Parcours préfixe
3. Parcours infixe
4. Parcours postfixe

[Correction](https://gist.github.com/glassus/031901b09dbb9d780247beb5db69eda2)


### 2.6 Exercice 2

![](data/exo_2.png)

Donner le rendu de chaque parcours :
1. Parcours en largeur 
2. Parcours préfixe
3. Parcours infixe
4. Parcours postfixe

[Correction](https://gist.github.com/glassus/05aeb20012b01bbaa170aa78c6959a0e)


## 3. Implémentations d'un arbre binaire
### 3.1 En utilisant la Programmation Orientée Objet
Le but est d'obtenir l'interface suivante :

In [None]:
a = Arbre(4) # pour créer l'arbre dont le nœud a pour valeur 4,
             # et dont les sous-arbres gauche et droit sont None

In [None]:
a.set_left(Arbre(3)) # pour donner la valeur 3 au nœud du sous-arbre gauche de a

In [None]:
a.set_right(Arbre(1)) # pour donner la valeur 1 au nœud du sous-arbre droit de a

In [None]:
a.get_right() # pour accéder au sous-arbre droit de a

In [None]:
a.get_left() # pour accéder au sous-arbre gauche de a

In [None]:
a.get_data() # pour accéder à la valeur du nœud de l'arbre a

**Exercice :** Dessinez l'arbre créé par les instructions suivantes :

In [None]:
a = Arbre(4)
a.set_left(Arbre(3))
a.set_right(Arbre(1))
a.get_right().set_left(Arbre(2))
a.get_right().set_right(Arbre(7))
a.get_left().set_left(Arbre(6))
a.get_right().get_right().set_left(Arbre(9))

[correction](data/exo_imp.png)

**Implémentation**

⯈ **Principe** : nous allons créer une classe ```Arbre```, qui contiendra 3 attributs : 
- ```data``` : la valeur du nœud (de type ```Int```)
- ```left``` : le sous-arbre gauche (de type ```Arbre```)
- ```right``` : le sous-arbre droit (de type ```Arbre```).

Par défaut, les attributs ```left ``` et ```right``` seront à ```None```, qui représentera l'arbre vide (ce qui n'est pas très rigoureux, car ```None``` n'est pas de type ```Arbre```...).

⯈ **Parti-pris** : afin de respecter le paradigme de la Programmation Orientée Objet, nous allons (pour une fois) jouer totalement le jeu de l'**encapsulation** en nous refusant d'accéder directement aux attributs.

Nous allons donc construire des méthodes permettant d'accéder à ces attributs (avec des **getters**, ou **accesseurs** en français) ou de les modifier (avec des **setters**, ou **mutateurs** en français) .

dans certains langage (Java, C#...) , l'encapsulation est vivement encouragée : il est possible de limiter concrètement la visibilité des attributs (par les mots-clés ```private``` ou ```protected```).


In [None]:
class Arbre:
    def __init__(self, data):
        self.data = data
        self.left = None
        self.right = None

    def set_left(self, sousarbre):
        self.left = sousarbre

    def set_right(self, sousarbre):
        self.right = sousarbre  

    def get_left(self):
        return self.left

    def get_right(self):
        return self.right

    def get_data(self):
        return self.data

L'implémentation précédente permet d'utiliser les instructions de l'exercice précédent et de vérifier que l'arbre a bien été créé.

In [16]:
a = Arbre(4)
a.set_left(Arbre(3))
a.set_right(Arbre(1))
a.get_right().set_left(Arbre(2))
a.get_right().set_right(Arbre(7))
a.get_left().set_left(Arbre(6))
a.get_right().get_right().set_left(Arbre(9))

In [17]:
a

<__main__.Arbre at 0x7f0100361f40>

In [18]:
a.get_right().get_left().get_data()

2

### 3.2 Implémentation à partir de tuples imbriqués

Considérons qu'un arbre peut se représenter par le tuple ```(valeur, sous-arbre gauche, sous-arbre droit)```.

L'arbre ci-dessous :
![](data/imp_tuple.png)
peut alors être représenté par le tuple :

In [17]:
a = (2, (8, (6,(),()), (9,(),())), (1, (7, (),()), ()))

Le sous-arbre gauche est alors ```a[1]``` et le sous-arbre droit est ```a[2]```.

In [18]:
a[1]

(8, (6, (), ()), (9, (), ()))

In [19]:
a[2]

(1, (7, (), ()), ())

### 3.3 Implémentation à partir d'une «simple» liste
De manière plus surprenante, il existe une méthode pour implémenter un arbre binaire (qui est une structure hiérarchique) avec une liste (qui est une structure linéaire). 
Ceci peut se faire par le biais d'une astuce sur les indices :

**Les fils du nœud d'indice i sont placés aux indice 2i et 2i+1**

In [15]:
def taille(arbre):
    print(arbre)
    if len(arbre) == 0:
        return 0
    else:
        return 1 + taille(arbre[1]) + taille(arbre[2])

In [16]:
taille(a)

(2, (8, (6, (), ()), (9, (), ())), (1, (7, (), ()), ()))
(8, (6, (), ()), (9, (), ()))
(6, (), ())
()
()
(9, (), ())
()
()
(1, (7, (), ()), ())
(7, (), ())
()
()
()


6

## 4. Utilisation de l'implémentation
Construire une fonction ```prefixe(arbre)``` qui affichera le parcours préfixe de l'arbre passé en paramètre.



---
## Bibliographie
- Numérique et Sciences Informatiques, Terminale, T. BALABONSKI, S. CONCHON, J.-C. FILLIATRE, K. NGUYEN, éditions ELLIPSES.



---

![](../../../ccbysa.png "image") G.Lassus, Lycée François Mauriac --  Bordeaux  
