In [10]:
# 2. Закодируйте любую строку по алгоритму Хаффмана
# ----------------------------------------------------------------------------------------------------------------------

import collections

class Leaf:  # вспомогательный класс по листьям дерева
    
    def __init__(self, key: str, value: int):
        self.key = key   # буквы кодируемой строки
        self.value = value    # частота буквы
        

class Node:  # вспомогательный класс по узлам дерева
    
    def __init__(self, value, left, right):
        self.value = value
        self.left = left
        self.right = right
        

class Haffman:  # основной класс: сжимает и восстанавливает строки
    _data = list
    
    def __init__(self):
        self.code_table = dict()    # таблица кодирования, где key - буква, value - двоичный код
        self._data = []             # список для преобразования строки в дерево
        self.real_string = ''       # строка для кодирования
        
    
    def make_list(self, real_string):        # создание списка упорядоченных объектов Leaf
        counter = dict(collections.Counter(real_string))
        counter = collections.OrderedDict(sorted(counter.items(), key=lambda k: k[1], reverse=True))
        for key, value in counter.items():
            self._data.append(Leaf(key, value))
        return True
    
    def _haffman_tree(self):
        while len(self._data) > 2:                          # пока в списке больше 2х листов,..
            b, a = self._data.pop(), self._data.pop()        # с его конца берутся два листа a и b
            spam = Node(a.value + b.value, a, b)   # они будут узлом (их значения складываются в value, сами становятся ветвями)
            if spam.value > self._data[0].value:   # если значение больше самого первого в списке (он упорядочен по убыванию),..
                self._data.insert(0, spam)          # этот узел будет первым в списке
            elif spam.value < self._data[-1].value:  # а ли оно меньше последнего,..
                self._data.append(spam)              # то узел идет в конец списка
            else:                                    # или идет на свое место в списке по значению
                for i in range(1, len(self._data)):
                    if self._data[i - 1].value >= spam.value > self._data[i].value:
                        self._data.insert(i, spam)
                        break
        self._data = Node(self._data[0].value + self._data[1].value, self._data[0], self._data[1])
            
        
    def _haffman_recursion(self, data: Node, code=''):
        # метод рекурсивного обхода дерева и построения таблицы кодирования
        if isinstance(data, Node):  # если объект узел, то вызов рекурсии для обеих ветвей с добавлением 0 или 1
            self._haffman_recursion(data.left, code=code + '0')
            self._haffman_recursion(data.right, code=code + '1')
        elif isinstance(data, Leaf):    # сли объект Лист то формируется таблица (code_table)
            self.code_table[data.key] = code
            
    def _encode(self):  # функция преобразования строки в двоичный код 
        result = []
        for char in self.real_string:
            result.append(self.code_table[char])
        return ''.join(result)

    def encode(self, real_string):
        # основной метод преобразования строки в код:
        # на вход подается строка real_string 
        # создается таблица для кодировки code_table,
        # на выходе закодированная строка code_string
        
        self.__init__()
        self.real_string = real_string
        self.make_list(real_string)
        self._haffman_tree()
        self._haffman_recursion(self._data)
        code_string = self._encode()
        return code_string
    
    
    def decode(self, code_string, code_table=None):
             # декодирование строки из двоичного кода на основе таблицы кодирования
             # если code_table не передана в функцию, используется полученная ранее
        if code_table:
            self.code_table = code_table
        decode_table = {value: key for key, value in self.code_table.items()}
        result = []
        
        i = 0
        while i < len(code_string):
            j = i + 1
            while code_string[i:j] not in decode_table.keys():
                j += 1
            result.append(decode_table[code_string[i:j]])
            i = j
            
        real_string = ''.join(result)
        return real_string
    
    def get_table_code(self):
        # возвразает таблица декодирования в виде словаря
        if self.code_table:
            return self.code_table
        return False
    
    def get_real_code(self):
        # возвращает строку в виде двоичного кода        
        if self.real_string:
            result = []
            for char in self.real_string:
                result.append(bin(ord(char))[2:].zfill(0))
            return ''.join(result)
        return False
    
    
if __name__ == '__main__':
    string = input('Введите строку: ')
    haff = Haffman()
    code_s = haff.encode(string)
    print(haff.get_real_code())
    print(code_s)
    table = haff.get_table_code()
    print(table)
    real1 = haff.decode(code_s, table)
    real2 = haff.decode(code_s)
    print(real1)
    print(real2)
    


Введите строку: Lyubaya stroka dlya kodirovki
10011001111001111010111000101100001111100111000011000001110011111010011100101101111110101111000011000001100100110110011110011100001100000110101111011111100100110100111100101101111111011011010111101001
0000111000000000000100111000111101010010110001100101001111011001000110001111101100011001110001100010011010111
{'u': '000000', 'b': '000001', 'L': '00001', 'r': '0001', 'a': '001', 'l': '01000', 'v': '01001', 's': '01010', 't': '01011', 'd': '0110', 'i': '0111', 'o': '100', 'k': '101', 'y': '110', ' ': '111'}
Lyubaya stroka dlya kodirovki
Lyubaya stroka dlya kodirovki
