In [11]:
# Codage Huffman pour un texte donné par l'utilisateur

# Noeud de l'arbre de Huffman
class Noeud:
  def __init__(self, prob, symbole, gauche=None, droite=None):
    # Probabilité du symbole
    self.prob = prob

    # Symbole 
    self.symbole = symbole

    # Noeud gauche
    self.gauche = gauche

    # Noeud droite
    self.droite = droite

    # Direction de l'arbre (0/1)
    self.code = ''

# Fonction d'aide pour avoir les codes binaires des symboles en parcourant l'arbre de Huffman
codes = dict()

def Calcul_Codes(noeud, val=''):
  # Code Huffman pour le noeud actuel
  nouvVal = val + str(noeud.code)

  if(noeud.gauche):
      Calcul_Codes(noeud.gauche, nouvVal)
  if(noeud.droite):
      Calcul_Codes(noeud.droite, nouvVal)

  if (noeud.gauche is None and noeud.droite is None):
# if(not node.left and not node.right):
      codes[noeud.symbole] = nouvVal
         
  return codes        

# Fonction d'aide pour calculer les probabilités de symboles d'un texte donné
def Calcul_Proba(data):
  symboles = dict()
  for caract in data:
      if symboles.get(caract) == None:
          symboles[caract] = 1
      else: 
          symboles[caract] += 1     
  return symboles

# Fonction pour obtenir la sortie codée
def Sortie_Encode(data, codee):
  encode_sortie = []
  for j in data:
      #  print(coding[c], end = '')
    encode_sortie.append(codee[j])
        
  string = ''.join([str(item) for item in encode_sortie])    
  return string
        
# Fonction pour calculer la différence d'espace entre les données compressées et non compressées 
def Total_Gain(data, codee):
  avant_compression = len(data) * 8 # Espace binaire total pour stocker les données avant la compression
  apres_compression = 0
  symboles = codee.keys()
  for symbole in symboles:
    count = data.count(symbole)
    apres_compression += count * len(codee[symbole]) # Calcul le nombre de bits nécessaires pour le symbole au total
  print("Nombre de bits utilisés avant la compression :", avant_compression)    
  print("Nombre de bits utilisées après la compresison :",  apres_compression)           

def Huffman_Encode(data):
  symbole_avec_proba = Calcul_Proba(data)
  symboles = symbole_avec_proba.keys()
  probabilite = symbole_avec_proba.values()
  print("Les caractères : ", symboles)
  print("Les fréquences d'apparition des caractères : ", probabilite)
    
  noeuds = []
    
  # Conversion des symboles et les probabilités en noeuds d'arbre de Huffman
  for symbole in symboles:
    noeuds.append(Noeud(symbole_avec_proba.get(symbole), symbole))
    
  while len(noeuds) > 1:
    # Trie de tous les noeuds dans l'ordre croissant en fonction de la probabilité
    noeuds = sorted(noeuds, key=lambda f: f.prob)
    
    # Choix des 2 plus petits noeuds
    droite = noeuds[0]
    gauche = noeuds[1]
    
    gauche.code = 0
    droite.code = 1
    
    # Combinaison des 2 plus petits noeuds pour créer un nouveau noeud
    nouvNoeud = Noeud(gauche.prob+droite.prob, gauche.symbole+droite.symbole, gauche, droite)
    
    noeuds.remove(gauche)
    noeuds.remove(droite)
    noeuds.append(nouvNoeud)
            
  huffman_encode = Calcul_Codes(noeuds[0])
  print("Les caractères avec les codes Huffman :", huffman_encode)
  Total_Gain(data, huffman_encode)
  encode_sortie = Sortie_Encode(data,huffman_encode)
  return encode_sortie, noeuds[0]  
     
def Huffman_Decode(encodee_data, huffman_arbre):
  arbre_racine = huffman_arbre
  decodee_sortie = []
  for y in encodee_data:
    if y == '1':
        huffman_arbre = huffman_arbre.droite   
    elif y == '0':
        huffman_arbre = huffman_arbre.gauche
    try:
      if huffman_arbre.gauche.symbole == None and huffman_arbre.droite.symbole == None:
        return
    except AttributeError:
      decodee_sortie.append(huffman_arbre.symbole)
      huffman_arbre = arbre_racine
        
  string = ''.join([str(item) for item in decodee_sortie])
  return string        

# First Test
data = input("Ecrivez un texte :")
print("Phrase ou mot :", data)
encode, arbre = Huffman_Encode(data)
print("Sortie encodée :", encode)
print("Sortie décodée :", Huffman_Decode(encode,arbre))

Ecrivez un texte :546534876
Phrase ou mot : 546534876
Les caractères :  dict_keys(['5', '4', '6', '3', '8', '7'])
Les fréquences d'apparition des caractères :  dict_values([2, 2, 2, 1, 1, 1])
Les caractères avec les codes Huffman : {'5': '000', '7': '001', '8': '010', '3': '011', '6': '10', '4': '11'}
Nombre de bits utilisés avant la compression : 72
Nombre de bits utilisées après la compresison : 23
Sortie encodée : 00011100000111101000110
Sortie décodée : 546534876
