[Accueil](../../../index.ipynb) > [Sommaire de Terminale](../../index.ipynb)

# Structure de données : les arbres

<img style="width: 25%" src="img/real_tree.png" title="Un vrai arbre">


En informatique les arbres sont des structures de données. Contrairement à la file et à la pile, cette structure n'est pas linéaire mais **hiérarchique**.

Ces structures sont très présentes en informatique car 

- elles permettent de représenter une organisation hiérarchique.
- elles permettent de stockers des données volumineuses avec un accès rapide.

## Quelques exemples
<img style="float: right; width: 50%" src="img/linux_tree.gv.svg" title="Arborescence type Unix">

- Le DOM (Document object Model) représente la structure hiérarchique d'une page html
- Les systèmes de fichiers
- Un arbre généalogique
- Un tournoi
- [L'évolution de la distribution Debian](https://upload.wikimedia.org/wikipedia/commons/1/1b/Linux_Distribution_Timeline.svg)
- la classification des espèces
- etc etc...

## Composition d'un arbre

<img style="float: right; width: 25%" src="img/tree.gv.svg" title="Arborescence type Unix">

- Chaque élément de l'arbre est appelé **noeud**. Dans l'exemple ci-dessous A, B, C, D..., G sont des **noeuds** de l'arbre.
- Une **arête**, ou **arc**, relie deux noeuds.
- Le noeud initial est appelé **racine** (ici A).
- Le **chemin** d'un noeud est la suite de noeuds qu'il faut passer pour aller de la racine à ce noeud. Le chemin de E est (A, B, E).
- Il faut cependant ajouter comme contrainte qu'**il ne peut y avoir de cycle dans un arbre**, sinon on obtient un graphe.

Un arbre peut être conçu **récursivement** comme étant un **noeud** dont les **arêtes** sont reliées à zéro ou plusieurs **arbres**.

### Généalogie

<img style="float: right; width: 25%" src="img/sub-tree.gv.svg">

- Les noeuds B, C et D sont les **enfants**, ou **fils**, du noeud A, ou le noeud A est le **parent** de B, C et D.
- Un noeud sans fils est un **noeud externe** ou **feuille**. Ici E, F, G et D sont des **feuilles** de l'arbre.
- Un **noeud interne** est un noeud ayant au moins un enfant.
- Des noeuds ayant le même parent sont des **frères**. B, C et D sont des frères.
- Un **sous-arbre** est la partie de l'arbre contenant un noeud et tous ces descendants.


## Quelques mesures
- La **taille d'un arbre** est le nombre de noeuds de l'arbre.

<img style="float: right; width: 33%" src="img/heigh_depth.gv.svg">

- La **profondeur d'un noeud** est le nombre d'arêtes que l'on traverse depuis la racine à ce noeud.
  - La profondeur du noeud G est 2
  - La profondeur de la racine est 0
- La **hauteur de l'arbre** est la profondeur maximale des feuilles de l'arbre.
- La **hauteur d'un noeud** est la hauteur de l'arbre - la profondeur du noeud.

<div class="alert alert-info">Pour n'importe quel noeud N de l'arbre A, on a toujours : P(N)+H(N)=H(A) </div>

<div class="alert alert-warning">Il existe plusieurs conventions pour la profondeur d'un noeud. Parfois la profondeur du noeud racine commence à 1. Dans ce cours nous considérons que la profondeur du noeud racine est 0.</div>


- L'**arité** d'un noeud est le nombre d'enfants de ce noeud
- L'**arité** d'un arbre est le maximum de l'arité des noeuds de l'arbre.

## Etiquettes

Afin de 'porter' des données, chaque noeud peut être identifié par une **étiquette**. Souvent l'étiquette représente la valeur du noeud.

Un arbre dont tous les noeuds sont nommés est dit **étiqueté**.

# Les arbres binaires

<div class="alert alert-info">
    <u>Définition</u>

Un arbre binaire est :
<ul>
    <li>soit vide</li>
    <li>soit composé d'une <b>étiquette</b> (ou clé) et d'une paire d'arbres binaires appelés <b>fils gauche</b> et <b>fils droit</b>.</li>
</ul>
</div>

## Quelques exemples d'arbres binaires

- L'arbre généalogique de vos ascendants
- Un tournoi de pétanque
- Une expression mathématiques

## Quelques types particuliers d'arbres binaires

Un arbre binaire **strict** (ou localement complet) est un arbre dont tous les noeuds possèdent 0 ou 2 fils.
<img style="width: 10%" src="img/full_binary_tree.gv.svg" title="Un arbre binaire strict"/>
<hr>

Un arbre binaire **parfait** est un arbre binaire dans lequel tous les niveaux sont remplis. Autrement dit toutes les feuilles sont à la même profondeur.
<img style="width: 20%" src="img/perfect_binary_tree.gv.svg" title="Un arbre binaire parfait"/>
<hr>

Un arbre binaire **dégénéré** est un arbre binaire dans lequel chaque noeud parent a un seul enfant. Autrement dit l'arbre ne possède qu'une feuille.
Un arbre dégénéré équivaut donc à une liste chaînée.
<img style="width: 5%" src="img/degenerated_binary_tree.gv.svg" title="Un arbre binaire dégénéré"/>
<hr>

## Encadrement de la taille

Si un arbre a une hauteur $h$:

- sa taille maximale est celle d'un arbre dégénéré, soit $h+1$.
- sa taille minimale est celle d'un arbre parfait soit 1+2+4+8+....c'est donc la somme des termes d'une suite géométrique de raison 2 avec le premier terme valant 1.

On a donc $n=\frac{2^{h+1}-1}{2-1} \Leftrightarrow n = 2^{h+1} -1 $

Un encadrement de la taille $n$ est donc :
<div class="alert alert-info">
  $h+1\leqslant n\leqslant 2^{h+1} -1$  
</div>

## Encadrement de la hauteur

Réciproquement, si on connait la taille $n$,

La hauteur d'un arbre dégénéré de taille $n$ est égale à n-1.

- En Physique/Chimie pour se 'débarasser' d'une puissance de 10 on utilise le $\log_{10}$. **exemple** : $10^n = 3$ donc $n = \log_{10}(3)$
- En Maths, pour se 'débarasser' de exponentielle, on utilise le logarithme népérien. **exemple** : $e^x = 3$ donc $x = \ln(3)$
- En informatique, les puissances de 2 sont monnaies courantes. On utilise donc le logarithme de 2

$n = 2^{h+1}-1\Leftrightarrow 2^{h+1}= n+1 \Leftrightarrow h+1=\log_{2}(n+1) \Leftrightarrow h = \log_{2}(n+1)-1$

Un encadrement de la hauteur $h$ est donc :
<div class="alert alert-info">
$\log_{2}(n+1)-1\leqslant h\leqslant n-1$.
</div>

### Exemples

- Donner un encadrement de la hauteur d'un arbre de taille 255.

In [1]:
from math import log2
mini = log2(255+1)-1
mini

7.0

On obtient donc $7\leqslant h\leqslant 254$

- Donner un encadrement de la hauteur d'un arbre de taille 4095.

## Exercices

<div id="arbre_calcul"></div>

### Arbre de calcul

<img style="width: 40%; float: right" src="img/math_expression_tree.gv.svg" title="une expression sous forme d'arbre binaire"/>

Soit l'expression mathématique suivante : $A=(2+9)\times3-4\times7+1$

La construction d'un arbre à partir de cette expression est la suivante : 

- on repère l'opération de **moins forte priorité** (celle qui sera faite en dernier) ce sera la racine.
- On réitère l'opération avec l'expression restante de gauche
- puis l'expression restante de droite.

Les **opérandes** représentent les **feuilles** de l'arbre, les **opérateurs** sont les noeuds **internes**.

On obtient donc l'arbre binaire suivant:
Questions:

1. Quelle est la taille de cet arbre?
2. Quelle est la hauteur de l'arbre?
3. Quelle est la hauteur du noeud $3$ ? 
4. Quelle est sa profondeur du noeud $3$ ?
5. Quel est le chemin du noeud $3$ ?
6. Qui sont les ancêtres de $4$?
7. Quel est le type de cet arbre binaire?

Construire l'arbre binaire de calcul de cette expression mathématique $B=3-2e^x+max(4;x)$

### Un peu de réflexion

- Combien d'arêtes comporte un arbre binaire de taille t ?
- Combien de feuilles, au minimum, comporte un arbre de hauteur h? et au maximum ?

<div id="parcours"></div>

# Parcours d'arbre

## Parcours d'arbre en profondeur

Nous allons découvrir 3 parcours en profondeur d'un arbre.

<div id="NLR"></div>

### 1. Le parcours préfixe (Pre-order : NLR)
<img style="float: left; width: 25%" src="img/1024px-Sorted_binary_tree_ALL.svg.png">

Dans ce parcours chaque noeud est affiché puis chacun de ces fils.

**Méthode** : Dès qu'on passe à <b style="color : red">gauche d'un noeud</b>, on note son étiquette.
#### Mise en oeuvre de l'algorithme.

<table>
    <tr>
        <td>Parcours préfixe de l'arbre total</td>
        <td><b>F,</b></td>
        <td>B, A, D, C, E,</td>
        <td>G, I, H,</td>
    </tr>
    <tr>
        <td>Parcours préfixe du sous-arbre gauche</td>
        <td></td>
        <td>B, A, D, C, E,</td>
        <td></td>
    </tr>
    <tr>
        <td>Parcours préfixe du sous-arbre droit</td>
        <td></td>
        <td></td>
        <td>G, I, H,</td>
    </tr>
</table>

Quelle semble être l'expression du cas général ?

Comment écrire le cas d'arrêt ?

#### Usage du parcours préfixe

Ce parcours permet d'obtenir une liste triée de façon **topologique**, en effet chaque parent apparait avant ses enfants.

Ce parcours peut être utilisé pour la copie d'un arbre.

<div class="alert alert-info">
/!\ des arbres différents peuvent avoir le même résultat de parcours préfixe.

Par exemple A, B, C peut représenter deux arbres différents. On sait juste que A est la racine et que B et C sont ses descendants.
</div>

#### Exercice
<img style="float: left; width: 25%" src="img/math_expression_tree.gv.svg">

<a href = "https://fr.wikipedia.org/wiki/Jan_%C5%81ukasiewicz"><img style="float: right; width: 15%; border:1px solid black" src="https://upload.wikimedia.org/wikipedia/commons/thumb/d/d2/Jan_%C5%81ukasiewicz.jpg/220px-Jan_%C5%81ukasiewicz.jpg"/></a>

Effectuer le parcours préfixe de cet arbre de calcul.

La notation obtenue s'appelle la **notation polonaise**, inventée en 1924 par le mathématicien polonais Jan Łukasiewicz.

Voir [wikipédia](https://fr.wikipedia.org/wiki/Notations_infix%C3%A9e,_pr%C3%A9fix%C3%A9e,_polonaise_et_postfix%C3%A9e)

<div id="LNR"></div>

### 2. Le parcours infixe (In-order : LNR)

<img style="float: left; width: 25%" src="img/1024px-Sorted_binary_tree_ALL.svg.png">

Dans ce parcours le fils gauche est affiché puis le noeud puis le fils droit (en jaune sur le schéma).

**Méthode**:Dès qu'on passe <b style="color:#cccc00">sous un noeud</b>, on note son étiquette.

#### Mise en oeuvre de l'algorithme.

Même principe que précédemment.

<table>
    <tr>
        <td>Parcours infixe de l'arbre total</td>
        <td>A, B, C, D, E</td>
        <td><b>F</b></td>
        <td> G, H, I</td>
    </tr>
    <tr>
        <td>Parcours infixe du sous-arbre gauche</td>
        <td>A, B, C, D, E</td>
        <td></td>
        <td></td>
    </tr>
    <tr>
        <td>Parcours infixe du sous-arbre droit</td>
        <td></td>
        <td></td>
        <td>G, H, I</td>
    </tr>
</table>

#### Usage du parcours préfixe

Ce parcours est utilisé dans les arbres binaires de recherche (Binary Search Tree : BST)

#### exercice
<img style="float: left; width: 25%" src="img/math_expression_tree.gv.svg">

Effectuer le parcours infixe de l'arbre binaire ci-contre.

- Quelle expression obtient-on ?
- Le résultat obtenu est-il correct ?

En mathématiques, on utilise la natation **infixée** pourtant celle-ci possède de nombreux inconvénients:

- il faut connaitre les priorités des opérateurs;
- il est nécessaire d'utiliser des parenthèses si la lecture de gauche à droite ne respecte pas les priorités des opérateurs;
- certains opérateurs fonctionnent de gauche à droite ( + et / ), d'autres dans les deux sens ( + * ) d'autres de droite à gauche ( les puissances )...

Cela fait énormément de règles à connaitre et à assimiler avant de 'lire' une expression mathématique.

<div id="LRN"></div>

### 3. Le parcours suffixe (Post-order : LRN)

<img style="float: left; width: 25%" src="img/1024px-Sorted_binary_tree_ALL.svg.png">

Dans ce parcours les fils (gauche puis droit) sont affichés puis le noeud.

**Méthode**:Dès qu'on passe à <b style="color: green">droite d'un noeud</b>, on note son étiquette.
#### Mise en oeuvre de l'algorithme.

<table>
    <tr>
        <td>Parcours suffixe arbre total</td>
        <td>A, C, E, D, B,</td>
        <td>H, I, G,</td>
        <td><b>F</b></td>
    </tr>
    <tr><td>Parcours suffixe sous-arbre gauche</td>
        <td>A, C, E, D, B,</td>
        <td></td>
        <td></td>
    </tr>
    <tr>
        <td>Parcours suffixe sous-arbre droit</td>
        <td></td>
        <td>H, I, G,</td>
        <td></td>
    </tr>
</table>

Pour implémenter l'algorithme, on s'inspire dont fortement de celui du parcours préfixe.

#### Usage du parcours suffixe

Ce parcours peut être utilisé pour supprimer un arbre (on supprime les enfants avant le parent)

#### exercice
<img style="float: right; width: 25%" src="img/math_expression_tree.gv.svg">

Effectuer le parcours suffixe de l'arbre binaire ci-contre.

Entrer l'expression obtenue sur [ce site](https://wisdomsky.github.io/reverse-polish-notation-js-parser/).

Cette notation est appelée, la **n**otation **p**olanaise **i**nversée :NPI  (**r**everse **p**olish **n**otation : RPI).

<img style="float: left; width: 25%" src="https://upload.wikimedia.org/wikipedia/commons/thumb/5/53/CPT-RPN-example1.svg/220px-CPT-RPN-example1.svg.png">

Elle possède de nombreux avantages:
- L'ordre des opérateurs est préservée;
- Les calculs se font en lisant de gauche à droite.
- L'expression est compacte (aucune parenthèse nécessaire)


On peut essayer une calculatrice RPN [ici](http://www.ac-grenoble.fr/ugine/m/docs/calculatrice_rpn.html).

Source : [wikipedia](https://fr.wikipedia.org/wiki/Notation_polonaise_inverse)

<div id="BFST"></div>

## Le parcours en largeur (BFST : Breadth First Search for Tree)

<img style="float: right; width: 25%" src="img/1024px-Sorted_binary_tree_ALL.svg.png">

Dans ce parcours, les noeuds sont parcourus, étage par étage.

Dans l'illustration ci contre, le parcours en largeur donne donc :

F, B, G, A, D, I, C, E, H.

## Algorithmes sur les arbres binaires

- [6.1 Algorithmes sur les arbres binaires](../../6_Algorithmique/6.1_BT_BST/binary_tree.ipynb)
- [Algorithme de Huffman](./marmottes.ipynb)

# Les arbres binaires de recherche

<div class="alert alert-info">
    <b>Définition</b>
Un arbre binaire de recherche est un arbre binaire dans lequel toutes les valeurs dans le sous-arbre gauche d'un noeud sont inférieures à la valeur du noeud et toutes les valeurs dans le sous arbre droit sont supérieures et la valeur du noeud.
</div>

Les arbres binaires de recherche sont souvent nommées ABR (BST en anglais).

Les ABR sont des structures de données qui permettent de réprésenter un ensemble de valeurs ordonnées :
- nombres
- lettres classés par ordre alphabétiques
- mots
- ...

## Exemples et contre-exemples

Indiquer quels sont les arbres binaires de recherche.
 
 ![3 arbres binaires 1](img/abr-or-not-1.png)
 ![3 arbres binaires 2](img/abr-or-not-2.png)
 
## Questions

- Dans quel nœud d’un arbre binaire de recherche se trouve la plus petite étiquette ? La plus grande ?
- Lequel des parcours d’arbres binaires permet de visiter les nœuds d’un ABR dans l’ordre des étiquettes ?

## Opérations sur les arbres binaires

Les **opérations** caractéristiques sur les ABR sont:

- la recherche d'une valeur
- l'insertion d'une valeur
- la suppression d'une valeur
- de réquilibrage ( hors programme, voir les [AVL](https://fr.wikipedia.org/wiki/Arbre_AVL) )

## Coûts des opérations

La recherche, l'ajout et la suppression ont le même coût.

Chacun des 3 algorithmes nécessite, au pire, de parcourir l'arbre de sa racine jusqu'à une feuille en comparant l'étiquette de chaque noeud avec une valeur. Le nombre de comparaisons est, au pire, égal à la hauteur de l'arbre.

Dans le meilleur des cas, si l'ABR de taille n est équilibré, sa hauteur est log2(n), **le coût des opérations est donc logarithmique**.

Dans le pire des cas, si l'ABR de taille n est dégénéré, sa hauteur est n-1, le **coût des opérations est donc linéaire**.

**A retenir**

La complexité des algorithmes de recherche, insertion, et suppression d’une valeur dans un arbre binaire de recherche est

- en moyenne logarithmique,
- au pire linéaire.

Le coût de ces opérations est au pire logarithmique dans le cas d’**arbres de recherche équilibrés**.

## Algorithmes sur les ABR

Allez sur [6.1 Algorithme sur les BST](../../6_Algorithmique/6.1_BT_BST/binary_search_tree.ipynb)


<table style="width:100%">
    <tr>
        <td style="text-align:left;"></td>
        <td style="text-align:right;"><a href="../Graphe/Graphes.ipynb">5. Graphe >></a></td>
    </tr>
</table>

[Accueil](../../../index.ipynb) > [Sommaire de Terminale](../../index.ipynb)