## Реализовать алгоритм кодирования Хаффмана.

 Создание класса Node для представления узла в двоичном дереве

In [2]:
# У класса Node есть следующие атрибуты:
#    - value: значение узла.
#    - frequency: частота встречаемости значения.
#    - left: указатель на левого потомка узла.
#    - right: указатель на правого потомка узла.

# 2. Метод __init__(self, value, frequency) является конструктором класса Node, 
# который инициализирует новый объект узла с заданным значением и частотой. 

# 3. Метод lt(self, other) сравнивает текущий узел с другим узлом other по их частотам (frequency). 
# Если частота текущего узла меньше частоты другого узла, метод вернет True, в противном случае - False.


class Node:
    def __init__(self, value, frequency):
        self.value = value
        self.frequency = frequency
        self.left = None
        self.right = None

    def __lt__(self, other):
        return self.frequency < other.frequency

Создание функции для построения дерева Хаффмана

In [3]:
# Функция huffman_tree принимает словарь freq_dict, в котором ключами являются символы, а значениями - их частоты в тексте. 

# Сначала создается список heap, содержащий узлы (Node) для каждого символа из freq_dict. 
# Затем этот список преобразуется в min-кучу с помощью heapq.heapify.

# Далее происходит итеративное соединение двух наименьших узлов, пока в куче не останется один узел. 
# Для этого извлекаются два минимальных узла, создается новый узел, который объединяет их и добавляется обратно в кучу. 
# Это продолжается до тех пор, пока список не станет пустым, кроме одного элемента - корня дерева Хаффмана.


import heapq

def huffman_tree(freq_dict):
    heap = [Node(key, freq) for key, freq in freq_dict.items()]
    heapq.heapify(heap)

    while len(heap) > 1:
        node1 = heapq.heappop(heap)
        node2 = heapq.heappop(heap)

        new_node = Node(None, node1.frequency + node2.frequency)
        new_node.left = node1
        new_node.right = node2

        heapq.heappush(heap, new_node)

    return heap[0]

Создание функции для генерации кодов символов на основе дерева Хаффмана

In [4]:
# Внутри функции определена вспомогательная функция traverse, которая рекурсивно обходит дерево, 
# начиная с корня node, и строит коды Хаффмана для каждого узла. Если узел имеет значение (node.value), 
# то его код добавляется в словарь codes с ключом, равным значению узла. В противном случае рекурсивно вызываются функции 
# для узлов левого и правого поддеревьев с добавлением '0' и '1' к текущему коду.

# После выполнения обхода всего дерева, функция traverse вызывается с корнем и пустым начальным кодом ''. 
# Затем, по завершении обхода, возвращается словарь codes, содержащий коды Хаффмана для значений узлов дерева.


def huffman_codes(root):
    codes = {}

    def traverse(node, code):
        if node.value:
            codes[node.value] = code
        else:
            traverse(node.left, code + '0')
            traverse(node.right, code + '1')

    traverse(root, '')
    return codes

Пример использования

In [5]:
text = "hello"
freq_dict = {char: text.count(char) for char in set(text)}

root = huffman_tree(freq_dict)
codes = huffman_codes(root)

for char, code in codes.items():
    print(f'{char}: {code}')

e: 00
h: 01
o: 10
l: 11


Пишем unittest для проверки нашей программы 

In [8]:
import unittest

class TestHuffman(unittest.TestCase):

    def huffman_algorithm(self):
        text = "hello"
        freq_dict = {char: text.count(char) for char in set(text)}

        root = huffman_tree(freq_dict)
        codes = huffman_codes(root)

        expected_codes = {'e': '00', 'h': '01', 'o': '10', 'l': '11'}

        for char, code in expected_codes.items():
            self.assertEqual(codes[char], code)

if __name__ == '__main__':
    unittest.main()

E
ERROR: C:\Users\1\AppData\Roaming\jupyter\runtime\kernel-6429e29f-062f-4801-8657-5916b4199352 (unittest.loader._FailedTest)
----------------------------------------------------------------------
AttributeError: module '__main__' has no attribute 'C:\Users\1\AppData\Roaming\jupyter\runtime\kernel-6429e29f-062f-4801-8657-5916b4199352'

----------------------------------------------------------------------
Ran 1 test in 0.001s

FAILED (errors=1)


SystemExit: True

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)
