Для строки "abracadabra":

Частоты: a=5, b=2, r=2, c=1, d=1

Дерево
Кодбук: {'a': '0', 'b': '10', 'r': '110', 'c': '1110', 'd': '1111'}

Закодированная строка: "01011001110011110101100" (исходные 11 байт → ~3 байта в сжатом виде).

In [2]:
import heapq
from collections import defaultdict
"""      (11)
     /    \
  a(5)    (6)
         /    \
       b(2)   (4)
             /    \
           r(2)   (2)
                 /    \
               c(1)  d(1)"""
class HuffmanNode:
    def __init__(self, char=None, freq=0, left=None, right=None):
        self.char = char    # Символ (если лист)
        self.freq = freq    # Частота
        self.left = left    # Левый потомок
        self.right = right # Правый потомок

    # Для сравнения в очереди с приоритетом
    def __lt__(self, other):
        return self.freq < other.freq

def build_frequency_table(data):
    freq = defaultdict(int)
    for char in data:
        freq[char] += 1
    return freq

def build_huffman_tree(freq):
    heap = []
    for char, count in freq.items():
        heapq.heappush(heap, HuffmanNode(char=char, freq=count))

    while len(heap) > 1:
        left = heapq.heappop(heap)
        right = heapq.heappop(heap)
        merged = HuffmanNode(freq=left.freq + right.freq, left=left, right=right)
        heapq.heappush(heap, merged)

    return heapq.heappop(heap)  # Корень дерева

def build_codebook(root, current_code="", codebook={}):
    if root is None:
        return
    if root.char is not None:  # Лист
        codebook[root.char] = current_code
        return
    build_codebook(root.left, current_code + "0", codebook)
    build_codebook(root.right, current_code + "1", codebook)
    return codebook

def huffman_encode(data):
    if not data:
        return "", {}
    freq = build_frequency_table(data)
    root = build_huffman_tree(freq)
    codebook = build_codebook(root)
    encoded = "".join([codebook[char] for char in data])
    return encoded, codebook

def huffman_decode(encoded, root):
    if not encoded:
        return ""
    current = root
    decoded = []
    for bit in encoded:
        if bit == '0':
            current = current.left
        else:
            current = current.right
        if current.char is not None:  # Дошли до листа
            decoded.append(current.char)
            current = root
    return "".join(decoded)

# Пример использования
data = "Hello world"
encoded, codebook = huffman_encode(data)
print(f"Закодированные данные: {encoded}")
print(f"Кодбук: {codebook}")

# Декодирование (требуется передать дерево или кодбук)
decoded = huffman_decode(encoded, build_huffman_tree(build_frequency_table(data)))
print(f"Раскодированные данные: {decoded}")

Закодированные данные: 01011111010110000011110111010001
Кодбук: {' ': '000', 'd': '001', 'H': '010', 'w': '011', 'l': '10', 'o': '110', 'r': '1110', 'e': '1111'}
Раскодированные данные: Hello world
