## Arbres binaires

In [None]:
# pour pourvoir importer les modules du dossier 'code'
import sys
if not 'code' in sys.path[0]:
    sys.path = [sys.path[0] + '/code'] + sys.path

### Ex1 - dessiner/observer

Dessiner tous les arbres binaires contenant respectivement 3 et 4 noeuds.

#### Solution

Il y 5 arbres binaires a trois noeuds ...

et 14 pour quatre noeuds.

### Ex2 - dénombrer

Sachant qu'il y a 1 arbre binaire vide, 1 arbre binaire contenant 1 noeud, 2 arbres binaires contenant 2 noeuds, 5 contenant 3 noeuds et 14 contenant 4 noeuds, *calculer le nombre d'arbres binaires contenant cinq noeuds*. On ne cherchera pas à les construire tous mais seulement à les dénombrer.

#### Solution

Pour dénombrer les arbres binaires a cinq noeuds, on peut les *classer* selon le nombre de noeuds des sous-arbres de la racine: ils doivent en contenir quatre au total (tous sauf la racine):

- *4 à gauche, 0 à droite*; cela donne autant de possibilités que d'arbre binaires a 4 noeuds soit **14**,
- *3 à gauche, 1 à droite*; soit autant de possibilité que d'arbres binaires a 5 noeud: **5**
- *2 à gauche, 2 à droite*; les possibilités «se multiplient» $2\times 2$ soit **4**,
- *1 à gauche, 3 à droite*: **5** («symétrique» du deuxième cas),
- *0 à gauche, 4 à droite*: **14** («symétrique du premier cas).

Ainsi, on totalise $14+5+4+5+14={\bf 42}$ arbres binaires a 5 noeuds.

Prenons un peut de «recul». Si on note $N(n)$ le nombre d'arbres binaires a $n$ noeuds alors l'énoncé nous apprend que $$N(0)=N(1)=1, N(2)=2, N(3)=5, N(4)=14$$

et, en réinterprétant le calcul ci-dessus, on obtient (en faisant apparaître les facteurs égaux à 1):
$$N(5)=\overbrace{14}^{N(4)}\times \overbrace{1}^{N(0)}
+\overbrace{5}^{N(3)}\times \overbrace{1}^{N(1)}
+\overbrace{2}^{N(2)}\times \overbrace{2}^{N(2)}
+\overbrace{1}^{N(1)}\times \overbrace{5}^{N(3)}
+\overbrace{1}^{N(0)}\times \overbrace{14}^{N(4)}
$$

ce qu'on généralise assez facilement par:

$$N(n)=N(n-1)\times N(0)+N(n-2)\times N(1)+\cdots +N(0)\times N(n-1)$$

ou, de façon plus condensée (pour les matheux): $$N(k)=\sum_{k=0}^{n-1}N(k)\times N(n-1-k)\quad\text{pour } n\geqslant 1$$

Observe2 que si on dispose ces nombres dans un tableau `N`:

            [N(0), N(1), ...., N(n-1)]

Il est facile de calculer l'élément suivant de celui-ci:

        initialiser i à 0
        S = 0
        Tant que i < n:
            ajouter N[i]*N[n-1-i] à S
            incrémenter i
        Ajouter S au tableau N (à la position n)

Voici une façon de calculer $N(n)$ «efficacement» en utilisant une variable globale:

In [None]:
N = []
def nb_arbres_binaires(nb_noeuds):
    n = nb_noeuds # pour raccourcir
    global N # pour stocker les résultats intermédiaires
    
    # ne pas recalculer si possible...
    if n < len(N):
        return N[n]
    
    # récursivité
    # cas de base
    if n == 0:
        N.append(1)
        return 1
    # appels récursifs et recomposition
    i = 0infixe
    S = 0
    while i < n:
        S += nb_arbres_binaires(i) * nb_arbres_binaires(n-1-i)
        i += 1
    N.append(S)
    return S

nb_arbres_binaires(5)

### Ex3 - parcours et «sérialisation» d'un arbre binaire

Écrire une fonction `affiche(a)` qui imprime un arbre binaire sous la forme suivante:
- pour un arbre vide, on n'affiche rien,
- pour un noeud on imprime:
    - une parenthèse ouvrante `(`,
    - son sous-arbre gauche (récursivement),
    - sa valeur,
    - son sous-arbre droit et
    - une parenthèse fermante `)`. 

Ainsi pour l'arbre:

                A
               / \
              B   D
               \
                C

on doit afficher `"((B(C))A(D))"`. 

#### Solution

En repartant de «zéro»

In [None]:
class N:
    def __init__(self, v, g=None, d=None):
        self.v = v
        self.g = g
        self.d = d

def affiche(a):
    print('(', end="")
    if a.g is not None:
        affiche(a.g)
    print(a.v, end="")
    if a.d is not None:
        affiche(a.d)
    print(')', end="")

test = N('A', N('B', None, N('C')), N('D'))
affiche(test)

En réutilisant `NoeudBin` et sa méthode `parcours_main_gauche(t1, t2, t3)`...

In [None]:
# si on veut réutiliser NoeudBin et sa méthode générale parcours_main_gauche
import sys
if not 'code' in sys.path[0]:
    sys.path[0] += '/code'

from noeud_bin_p2 import NoeudBin

In [None]:
N = NoeudBin
test = N('A', N('B', None, N('C')), N('D'))
test.parcours_main_gauche(
    lambda _: print('(', end=""),
    lambda n: print(n.valeur, end=""),
    lambda _: print(')', end=""),
)

### Ex4 - retrouver l'arbre d'après sa «sérialisation»

Dessiner l'arbre binaire pour lequel la fonction précédente affiche `"(1((2)3))"`. D'une manière générale expliquer comment retrouver l'arbre dont l'affichage est donné.

#### Solution

### Ex5 - égalité...

Ajouter à la classe `Noeud` une méthode `__eq__` permettant de tester l'égalité de deux arbres binaires à l'aide de l'opérateur `==`. Attention, il y a un piège.

In [None]:
class Noeud:
    def __init__(self, v, g=None, d=None):
        self.v = v
        self.g = g
        self.d = d

#### Solution

Il faut être très attentif aux cas limites (notamment au cas des noeuds feuilles)

In [None]:
## Égalité si on a les mêmes valeurs aux mêmes noeuds.
## ATTENTION aux cas des sous-arbres vides!
## Note: On pourrait aussi tester l'égalité au sens de la **disposition relative** des noeuds
## (indépendamment des valeurs qu'ils portent...)

def __eq__(self, autre):
    if autre is None or self.v != autre.v: # self ne peut pas valoir None...
        return False
    
    # ici, 1. autre n'est pas None et 
    # 2. self et autre portent la même valeur
    
    # Comparaison de leur sous-arbres gauches
    eq_g = False
    if self.g is not None:
        # appel récursif
        eq_g = self.g == autre.g
    elif autre.g is None: # ici les deux sous-arbres gauches sont vides et donc égaux
        eq_g = True
    if not eq_g:
        return False
    
    # puis de leurs sous-arbres droits
    eq_d = False
    if self.d is not None:
        eq_d = self.d == autre.d
    elif autre.d is None:
        eq_d = True
    if not eq_d:
        return False
    
    # ici eq_g et eq_d sont à True donc
    return True

Noeud.__eq__ = __eq__
del __eq__

### Ex6 - arbres binaires «limites»

Écrire la fonction indiquée qui prend un entier `h` supérieur ou égal à 0 en argument:
1. `complet(h)` qui renvoie un arbre binaire parfait - dont tous les noeuds internes sont doubles - de hauteur `h`,
2. `peigne_droit(h)` qui renvoie un peigne de hauteur `h`: arbre binaire filiforme (sans points doubles) où chaque noeud a un sous-arbre gauche vide.

#### Solution

In [None]:
def complet(h):
    if h == 0:
        return None
    return Noeud('', complet(h-1), complet(h-1))

In [None]:
def peigne_droit(h):
    if h == 0:
        return None
    return Noeud('', None, peigne_gauche(h-1))

### Ex7 - parcours...

Donner cinq arbres de taille 3 dont les noeuds contiennent les valeurs 1, 2, 3 et pour lesquels un *parcours infixe* produirait l'affichage: 

    1 2 3

#### Solution

Il suffit de considérer les cinqs arbres binaires de taille 3 puis de placer les valeurs sur les noeuds adéquats.

Note: Ajouter des noeuds $\emptyset$ peut aider à bien comprendre.

## Arbres binaires de recherche

In [None]:
# pour réutilisation...
from noeud_bin2 import NoeudBin2
from abr import ABR

### Ex1 - dessiner

Donner tous les ABR formés de trois noeuds et contenant les entiers 1, 2, 3.

#### Solution

### Ex2 - minimum

Dans un ABR, où se trouve le plus petit élément? En déduire une fonction `minimum(a)` qui renvoie le plus plus petit élément de l'ABR `a` ou `None` si `a` est vide.

#### Solution

Dans un ABR non vide, un tel élément est:
- la racine si celle-ci n'a pas d'enfant gauche,
- ou dans le sous-ABR gauche de la racine.

Par suite, on obtient le minimum en suivant les «liens gauches» tant qu'il y en a.


In [None]:
def minimum(a):
    if a is None:
        return None
    n = a
    while n.g is not None:
        n = n.g
    return n.v

### Ex3 - ABR sans doublons

Écrire une variante de la méthode `ABR.inserer(x)` qui n'ajoute pas l'élément `x` si l'arbre le contient déjà.

#### Solution

In [None]:
def inserer_bis(self, x): # self représente l'ABR et non un noeud!
    n_ins = NoeudBin2(x)
    if len(self) == 0:
        self.racine = n_ins
        self.taille += 1
        return
    
    # localisons le parent du noeud à insérer et le côté 
    g = False
    n = None
    n_ = self.racine
    while n_ is not None:
        n = n_
        c_ins = self.cle(n_ins)
        c_n_ = self.cle(n_)
        if c_ins == c_n_:
            return
        elif c_ins < c_n_:
            n_ = n_.gauche
            g = True
        else:
            n_ = n_.droit
            g = False

    # n est le parent de n_ins
    self.taille += 1
    n_ins.parent = n
    if g:
        n.gauche = n_ins
    else:
        n.droit = n_ins
        
ABR.inserer_bis = inserer_bis
del inserer_bis

In [None]:
# simple test
from random import randint
valeurs = [randint(1, 10) for _ in range(100)]

abr = ABR()
for v in valeurs:
    abr.inserer_bis(v)

assert len(abr) == len(set(valeurs)) # un ensemble ne peut pas contenir deux fois la même valeur...

### Ex4 - compter

Écrire une méthode `ABR.compte(x)` qui renvoie le nombre d'apparition de `x` dans l'ABR. On s'évertuera à ne pas descendre dans les sous-arbres dans lesquels on est certain que la valeur `x` ne peut apparaître.

#### Solution

In [None]:
def compte(self, x):
    if self.taille == 0:
        return 0
    compteur = 0
    cx = self.cle(NoeudBin2(x))
    n = self.racine
    while n is not None:
        cn = self.cle(n)
        if cx == cn:
            # deux valeurs ayant une même clé ne sont pas nécessairement identiques
            if n.valeur == x:
                compteur +=1
            # se souvenir que les valeur du sous-arbre gauche sont inférieures ou égales
            # du noeud courant pour cet ABR, donc:
            n = n.gauche
        elif cx < cn:
            n = n.gauche
        else:
            n = n.droit
    return compteur

ABR.compte = compte
del compte

In [None]:
# simple test
from random import randint
valeurs = [randint(1, 10) for _ in range(100)]

abr = ABR()
for v in valeurs:
    abr.inserer(v)

assert abr.compte(5) == valeurs.count(5)

### Ex5 - retour sur le tri

Écrire une méthode `ABR.remplir(t)` qui ajoute tous les éléments de l'ABR dans le tableau `t` dans l'ordre *infixe*. Ajouter ensuite une méthode `ABR.lister()` qui renvoie un nouveau tableau contenant tous les éléments par ordre croissant. En déduire une fonction `trier(t)` qui reçoit en argument un tableau d'entiers et renvoie un tableau trié contenant les mêmes éléments.

Quelle est l'efficacité de ce tri?

#### Solution

In [None]:
def remplir1(self, t): # self est un NoeudBin2
    if self.gauche:
        self.gauche.remplir(t)
    t.append(self.valeur)
    if self.droit:
        self.droit.remplir(t)

def remplir2(self, t): # self est un ABR
    if len(self) == 0:
        return
    self.racine.remplir(t)
    
NoeudBin2.remplir = remplir1
del remplir1
ABR.remplir = remplir2
del remplir2

In [None]:
def lister(self):
    tab = []
    self.remplir(tab)
    return tab

ABR.lister = lister
del lister

In [None]:
def trier(t):
    abr = ABR()
    # il vaudrait mieux randomiser les éléments de t
    # pour qu'en moyenne, l'abr soit approximativement «équilibré»
    for x in t:
        abr.inserer(x)
    return abr.lister()

In [None]:
from random import randint
trier([randint(0, 100) for _ in range(10)])

In [None]:
from time import time
listes = [
    [randint(0, 10**n) for _ in range(10**n)]
    for n in range(3, 7)
]
for l in listes:
    _t = time()
    trier(l)
    t_ = time()
    print(f"taille: {len(l)}, duree du tri (en s): {t_ - _t}")
    

Malgré l'expérience encouragente du test précédent - qui fait penser que l'algorithme est quasi-linéaire $O(n\lg n)$:
1. le tri est très long pour une petite liste (comparez avec `sorted`),
2. l'efficacité relative du tri vient du fait que les données sont randomisées.

En fait, l'insertion est en O(h) où h est la hauteur de l'arbre. Si la liste de départ est déjà triée, l'ABR va être en forme de «peigne» (filiforme) et la création de l'arbre coûte dans ce cas:

$$1+2+\cdots +n\qquad\text{qui est de l'ordre de }\qquad n^2$$

L'ordre de grandeur de ce coût «domine» celui de l'opération «lister» qui est $O(n)$ car l'appel récursif se produit une fois et une seule pour chaque noeud de l'arbre.

Ainsi ce tri est $O(n^2)$ comme on peut le vérifier (quoi qu'on va se frotter aux limites imposées par Python en terme de récursion): 

In [None]:
from time import time
listes = [
    sorted([randint(0, 10**n) for _ in range(10**n)])
    for n in range(2, 5)
]
for l in listes:
    _t = time()
    trier(l)
    t_ = time()
    print(f"taille: {len(l)}, duree du tri (en s): {t_ - _t}")
# note: comme la limite de récursion de Python est 1000, on aura jamais le dernier temps (vu que l'ABR est filiforme de longueur 10000)