# Structure hiérarchique de donnée

# Introduction

Les piles, les files et les listes sont des structures de données linéaires. Chaque valeur est liée à la précédente et à la suivante.

Il existe une autre structure de donnée dite **hiérarchique**. Les structures arborescentes ou plus simplement **arbre** sont hiérarchiques. La hiérarchie de cette structure est semblable aux liens de parenté d'une famille que l'on retrouve dans un arbre généalogique.

On peut définir un **arbre** par sa description hiérarchique :

- Au départ, on a un **noeud racine** qui possède plusieurs noeuds fils. Le noeud racine est alors le père des noeuds fils.
- Les fils sont reliés au noeud père par des **arêtes** ou des **branches**. Les noeuds fils ont eux-mêmes des noeuds fils

Si un noeud n'a pas de fils, alors c'est une **feuille**.

![arbre1.png](attachment:arbre1.png)

# Arbre binaire

## Définition

Un **arbre binaire** est un arbre dont chaque nœud a **au plus** deux fils.

On peut définir **récursivement** un arbre binaire:

- soit c'est un nœud sans fils (feuille);
- soit c'est un nœud racine qui a deux fils: un fils gauche et un fils droit qui sont eux-mêmes des arbres binaires.
 
### Exemple

![ex1_arbre.png](attachment:ex1_arbre.png)

- Le nœud racine contient la valeur entière 5. Son fils gauche est un arbre dont la racine contient la valeur 7 et son fils droit est un arbre dont la racine a pour valeur 8.
- L'arbre binaire possède 3 feuilles qui ont les valeurs 1, 6 et 4.
- L'arbre binaire qui contient les valeurs 8, 6 et 4 est le sous-arbre droit de la racine 8.
- Le sous-arbre gauche de la racine contient les nœuds 7 et 1.

## Vocabulaire

1. Le nombre de nœuds (intermédiaires et feuilles) que possède un arbre s'appelle la **taille**.
2. La **profondeur** d'un nœud correspond à sa position dans l'arbre. La valeur attribuée à la profondeur d'un nœud dépend de la profondeur attribuée à la racine:

- Soit la racine est de profondeur 0 et cela signifie que la profondeur d'un nœud correspond au nombre de branches le séparant de la racine.
- Soit la racine est de profondeur 1 et cela signifie que la profondeur d'un nœud correspond au nombre de nœuds jusqu'à la racine.

3. Les nœuds d'un arbre qui ont la même profondeur **p** sont au même **niveau p** dans l'arbre.
4. La **profondeur maximale** d'un nœud de l'arbre s'appelle la **hauteur** de l'arbre.

### Exemple

On reprend l'arbre de l'exemple précédent en posant la profondeur du nœud racine égale à 0.

![ex1_arbre.png](attachment:ex1_arbre.png)

- L'arbre possède 6 noeuds donc sa **taille** est 6.
- Le nœud contenant la valeur 6 a une **profondeur** de 2. Il y a 2 arêtes entre la racine et ce nœud
- Le niveau 2 contient les nœuds de valeur 1, 6 et 4; ce sont des feuilles.
- La hauteur de l'arbre est 2 puisque la profondeur maximale d'un nœud est 2.

## Arbres binaires particuliers

On convient que la racine est de profondeur $0$ et donc de hauteur $0$.

1. Un arbre binaire $h$ est **filiforme** si chaque nœud a exactement 1 fils. Il ne contient qu'un seul nœud à chaque **niveau** de l'arbre.

- Chaque niveau de profondeur $p$ telle que $0 \leqslant p \leqslant h$ contient 1 nœud.
- L'arbre a une taille $n=h+1$ nœuds.

### Exemple

L'arbre est filiforme, de hauteur $h=2$.

![arbre_filiforme.png](attachment:arbre_filiforme.png)

La taille de cet arbre est donc $n=3$.

2. Un arbre binaire de hauteur $h$ est **complet** si chaque nœud a exactement 2 fils. C'est un arbre binaire sans trous. 

- Chaque niveau de profondeur $p$ telle que $0 \leqslant p \leqslant h$ contient $2^{p}$ nœuds.
- L'arbre a une taille $n=2^{h+1}-1$ nœuds.

### Exemple

L'arbre est complet de hauteur $h=2$

![arbre_complet.png](attachment:arbre_complet.png)

La taille de cet arbre est $n=2^{3}-1=7$ nœuds.

3. Un arbre binaire de hauteur $h$ est **bien tassé** si chaque nœud a exactement 2 fils sauf sur le dernier niveau où il manque des feuilles les plus à droite.

- Chaque niveau de profondeur $p$ telle que $0 \leqslant p \leqslant h-1$ contient $2^{p}$ nœuds.
- L'arbre a une taille $n$ comprise entre la taille d'un arbre complet de hauteur $h-1$ ($h \geqslant 1$) et un arbre complet de hauteur $h$:

$$2^{h}-1 \leqslant n \leqslant 2^{h+1}-1$$

### Exemple

L'arbre est bien tassé de hauteur $h=2$

![arbre_tasse.png](attachment:arbre_tasse.png)

La taille $n$ de cet arbre est comprise entre la taille de l'arbre complet de hauteur $h-1$ et l'arbre complet de hauteur $h$ soit : 

$$2^{2}-1 \leqslant n \leqslant 2^{3}-1 \Longleftrightarrow 3 \leqslant n \leqslant 7$$.

Ici on compte que l'arbre bien tassé a une taille $n=6$ nœuds.

# Logarithme en base 2

## Définition

Le **logarithme en base 2** d'un nombre entier $n$ est le nombre $k$ tel que l'on a $2^{k} = n$.

On note $k=\log_{2}(n)$.

### Remarque

Pour tout nombre entier positif $k$ : $\log_{2}(2^{k}) = k$

### Exemple

- $\log_{2}(8) = \log_{2}(2^{3}) = 3$
- $\log_{2}(16) = \log_{2}(2^{4}) = 4$
- Qu'en est-il d'un nombre strictement compris entre 8 et 16 ?    
par exemple : $\log_{2}(10) \approx 3,322$ mais avec cette valeur approchée on a $2^{3,322} \approx 10,0005$.

### Propriété

Le logarithme en base 2 d'un entier $n$ est compris entre les valeurs entières $p$ et $p-1$ où $p$ est le nombre minimal de bits nécessaires à l'écriture binaire du nombre $n$.


### Exemple

Logarithme en base 2 de l'entier $47$ : $\log_{2}(47) \approx 5,55$

**Méthode mathématique:**

Comme $2^{5}=32$ et $2^{6}=64$ donc :
$$2^{5} < 47 < 2^{6} \Longleftrightarrow \log_{2}(2^{5}) < \log_{2}(47) < \log_{2}(2^{6}) \Longleftrightarrow 5 < \log_{2}(47) < 6$$

**Méthode informatique:**

Le nombre $47$ s'écrit en binaire $101111_{2}$.

Il faut $p=6$ bits au minimum pour l'écrire en binaire, donc :

$$6-1 \leqslant \log_{2}(47) \leqslant 6 \Longleftrightarrow 5 < \log_{2}(47) < 6$$

# Taille et hauteur d'un arbre binaire

On suppose que la racine de l'arbre est de profondeur 0.

## Arbre de hauteur *h* connue

Un arbre de hauteur $h$ a une taille $n$ telle que: $\boxed{h+1 \leqslant n \leqslant 2^{h+1}-1}$

### Preuve

- Au minimum, l'arbre est **filiforme** donc a un seul noeud à chaque niveau et alors $n=h+1$ nœuds pour être de hauteur $h$;
- Au maximum, si l'arbre est **complet**, on a $2^{p}$ nœuds à chaque niveau $p$ et donc $2^{h}$ nœuds sur le niveau de profondeur $h$. Le nombre de nœuds à chaque niveau est le terme d'une suite géométrique de raison $2$ dont la somme de tous les termes vaut $2^{h+1}-1$.


## Arbre de taille *n* connue

Un arbre de taille $n$ fixée a une hauteur $h$ telle que: $\boxed{\log_{2}(n+1)-1 \leqslant h \leqslant n-1}$

### Preuve

- Au maximum, l'arbre est **filiforme** de $n$ nœuds a une hauteur $h=n-1$;
- Au minimum, si l'arbre est **bien tassé** alors le nombre de nœuds $n$ est compris entre $2^{h}-1$ et $2^{h+1}-1$.
\begin{align*}
& 2^{h}-1 \leqslant n \leqslant 2^{h+1}-1\\
\Longleftrightarrow ~& 2^{h} \leqslant n+1 \leqslant 2^{h+1}\\
\Longleftrightarrow ~& \log_{2}(2^{h}) \leqslant \log_{2}(n+1) \leqslant \log_{2}(2^{h+1})\\
\Longleftrightarrow ~& h \leqslant \log_{2}(n+1) \leqslant h+1\\
\Longleftrightarrow ~& h-1 \leqslant \log_{2}(n+1)-1 \leqslant h
\end{align*}

### Exemple

Un arbre a une taille $n=17$. Selon la forme de cet arbre, sa hauteur varie. 

D'après l'encadrement donné ci-dessus, on a une hauteur $h$ comprise entre $\log_{2}(18)-1$ et $17-1$.

Or $18$ s'écrit $10010_{2}$ en binaire donc il faut 5 bits au minimum donc $\log_{2}(18)$ est compris entre $4$ et $5$, ce qui permet d'affirmer que la hauteur $h$ est comprise entre $4$ (*h* est une valeur entière supérieure) et $16$

- Un arbre complet de hauteur $3$ a une taille $n=2^{4}-1=15$ noeuds donc avec 2 nœuds supplémentaires, la hauteur de l'arbre sera suppérieure à ou égale à $4$.
- un arbre filiforme de taille $17$ a 17 niveaux et en commençant à 0, le dernier niveau est 16 soit une hauteur maximale $h=16$.

## En supplément

Le module math de Python possède une fonction qui calcule le logarithme d'un nombre en base 2 notée `log2`.

In [5]:
from math import log2

log2(18)

In [6]:
2**4.169925001442312