# Projet Huffman

In [10]:
def apparition_par_charactere(texte):
    """
    string -> dict
    retourne le dictionnaire du nombre d'apparitions de chaque caractère
    """
    # Dictionnaire de départ
    _apc = {}
    
    # Pour chaque caractère, on regarde s'il est dans le dictionnaire. 
    # Si oui, on augmente sa valeur
    # Si non, on l'initialise à 1
    for caractère in texte:
        if caractère in _apc:
            _apc[caractère] += 1
        else:
            _apc[caractère] = 1
    return _apc

assert apparition_par_charactere('') == {}
assert apparition_par_charactere('Hello World') == {'H': 1, 'e': 1, 'l': 3, 'o': 2, ' ': 1, 'W': 1, 'r': 1, 'd': 1}
assert apparition_par_charactere('aaabbbcccddd') == {'a': 3, 'b' : 3, 'c': 3, 'd': 3}

## Classe Arbre

Pour répondre au problème, il nous faut un arbre binaire. Mais ici, la structure de l'arbre diffère de celle du cours. En effet, un arbre de Huffman a pour feuilles les lettres du texte auxquelles est associé leur poids. Les autres noeuds parents sont constitués de la somme des poids de leurs enfants.

### Partie théorique : explications

#### Structure

Notre classe Arbre devra donc contenir les attributs suivants :

- Gauche : le fils gauche (ou None)
- Droit : le fils droit (ou None)
- Lettre : Pour une feuille, la lettre représentée ; pour les autres noeuds, les lettres de ses enfants (nous reviendrons par la suite sur ce point)
- Poids : Pour une feuille, le nombre d'apparitions de la lettre ; pour les autres noeuds, la somme du poids de ses enfants.

#### Utilisation et définitions

Voyons maintenant comment utiliser notre arbre, avec l'exemple ci-dessous qui décompose le texte : 'Hello'.

Pour construire un arbre de Huffman, nous devons d'abord partir des feuilles qui sont les différentes lettres, ici : e, o, H, l. Comme ce sont des feuilles, les noeuds représentant ces lettres ont leurs fils à None, et leur poids est leur nombre d'apparitions.

La suite de l'abre est très simple : les deux noeuds aux plus petits poids sont assemblés dans un nouveau noeud. Ici, les deux plus petits noeud sont le 'e' et le 'o'. Ils sont donc rassemblés en tant que fils gauche (le plus fréquent, mais ici leurs poiids sont égaux) et fils droit.

Le nouveau noeud créer à donc ses fils d'assigné. Mais nous ne préciserons pas, lors de sa création, sa lettre et son poids, car ces valeurs seront calculées automatiquement selon l'idée suivante : le poids est calculé en faisant la somme du poids des deux fils ; la lettre se compose de la concaténation des lettres du fils gauche et du fils droit.

Voici un exemple des étapes pour comprendre (toujours avec l'arbre ci-dessous) : 

1. Les noeuds 'e' et 'o' sont assemblés dans un noeud parent.
2. Ce noeud parent se voit attribuer le poids 2 (la somme des poids de 'e' et 'o'.
3. Le noeud parent concatène les lettres de ses fils, et sa lettre devient : 'eo'.
4. On répète ce processus jusqu'à avoir un seul noeud.

#### Exemple : arbre du mot 'Hello'

![Arbre Huffman Exemple](arbre_exemple_Hello.png)

### Partie pratique : implémentation en python

Nous pouvons maintenant créer notre classe python Arbre. Le paramètre l (pour lettre) et p (pour poids) auront une valer par défaut. Ainsi, nous les renseigneront s'il s'agit d'une feuille, autrement ils seront calculés automatiquement. Voici la classe Arbre :

In [12]:
class Arbre:
    
    # Le construceur : 
    # En paramètre (nom complet) : gauche, droite, lettre ('' si non renseigné), poids (-1 si non renseigné)
    # Les attributs sont les même qu'énnoncé plus haut.
    def __init__(self, g, d,  l='', p=-1):
        self.gauche = g
        self.lettre = l
        self.droit = d
        self.poids = p
        
        # Si le poids vaut -1 c'est qu'il n'a pas été renseigné, il faut donc le calculer.
        if p == -1:
            self.calculer_poids()
            
        # Si la lettre faut '' c'est qu'elle n'a pas été renseignée, il faut donc calculer sa valeur.
        if l == '':
            self.calculer_lettres()

    def enfant_gauche(self):
        """
        -> Arbre
        Retourne l'enfant gauche
        """
        return self.gauche

    def enfant_droit(self):
        """
        -> Arbre
        Retourne l'enfant droit
        """
        return self.droit

    def calculer_poids(self):
        """Calcule le poids d'un noeud (non feuille)"""
        self.poids = 0
        if self.gauche is not None:
            self.poids += self.gauche.poids

        if self.droit is not None:
            self.poids += self.droit.poids

    def calculer_lettres(self):
        """Calcule la valeur de la lettre du noeud"""
        if self.enfant_gauche() is not None:
            self.lettre += self.enfant_gauche().donnee()
        if self.enfant_droit() is not None:
            self.lettre += self.enfant_droit().donnee()

    def donne_poids(self):
        """
        -> int
        Retourne le poids du noeud
        """
        return self.poids

    def donnee(self):
        """
        -> string
        Retourne la lettre du noeud
        """
        return self.lettre

    def __str__(self):
        """
        -> string
        Retourne une chaîne de caractère pour afficher l'arbre à partir de ce noeud
        """
        if self is None:
            return 'None'
        return '(' + str(self.gauche) + ',' + self.lettre + ',' + str(self.poids) + ',' + str(self.droit) + ')'