In [1]:
from collections import Counter
from heapq import heappush, heappop

def construire_arbre_huffman(texte):
    # Compte la fréquence de chaque caractère
    freq = Counter(texte)

    # Crée une file de priorité
    pq = []
    for char, f in freq.items():
        heappush(pq, (f, 0, char))  # (fréquence, compteur, caractère)

    count = 1
    while len(pq) > 1:
        f1, _, c1 = heappop(pq)
        f2, _, c2 = heappop(pq)
        heappush(pq, (f1 + f2, count, (c1, c2)))
        count += 1

    return pq[0][2]

def generer_codes_huffman(arbre, prefix="", codes=None):
    if codes is None:
        codes = {}

    if isinstance(arbre, str):
        codes[arbre] = prefix
    else:
        gauche, droite = arbre
        generer_codes_huffman(gauche, prefix + "0", codes)
        generer_codes_huffman(droite, prefix + "1", codes)
    return codes

def compresser_huffman(texte):
    arbre = construire_arbre_huffman(texte)
    codes = generer_codes_huffman(arbre)
    return ''.join(codes[char] for char in texte), arbre

def decompresser_huffman(texte_compresse, arbre):
    resultat = []
    noeud_courant = arbre

    for bit in texte_compresse:
        if isinstance(noeud_courant, str):
            resultat.append(noeud_courant)
            noeud_courant = arbre

        if bit == '0':
            noeud_courant = noeud_courant[0]
        else:
            noeud_courant = noeud_courant[1]

    if isinstance(noeud_courant, str):
        resultat.append(noeud_courant)

    return ''.join(resultat)

# Exemple d'utilisation
if __name__ == "__main__":
    texte = "BIDABI 2025"
    print(f"Texte original: {texte}")

    # Compression
    compresse, arbre = compresser_huffman(texte)
    print(f"Texte compressé: {compresse}")

    # Décompression
    decompresse = decompresser_huffman(compresse, arbre)
    print(f"Texte décompressé: {decompresse}")

    # Calcul du taux de compression
    taux = (len(compresse) / 8) / len(texte) * 100
    print(f"Taux de compression: {taux:.2f}%")

Texte original: BIDABI 2025
Texte compressé: 110111100011110111000101001101010
Texte décompressé: BIDABI 2025
Taux de compression: 37.50%
