In [None]:
from heapq import heappush, heappop, heapify
from collections import defaultdict

In [None]:
class Node:
    def __init__(self, char=None, freq=0, left=None, right=None):
        self.char = char
        self.freq = freq
        self.left = left
        self.right = right

    # Define os métodos de comparação para permitir a comparação de nós com base na frequência
    def __lt__(self, other):
        return self.freq < other.freq

def build_huffman_tree(text):
    # Passo 1: Calcular as frequências dos caracteres
    freq = defaultdict(int)
    for char in text:
        freq[char] += 1

    # Passo 2: Construir a árvore de Huffman usando uma fila de prioridade (heap)
    priority_queue = []
    for char, frequency in freq.items():
        heappush(priority_queue, Node(char=char, freq=frequency))

    while len(priority_queue) > 1:
        # Retirar os dois nós com as menores frequências
        left = heappop(priority_queue)
        right = heappop(priority_queue)
        # Criar um novo nó interno com a frequência combinada
        combined_node = Node(freq=left.freq + right.freq, left=left, right=right)
        # Inserir o novo nó de volta na fila de prioridade
        heappush(priority_queue, combined_node)

    # Retornar a raiz da árvore de Huffman
    return priority_queue[0]

def generate_huffman_codes(node, current_code, huffman_codes):
    if node:
        if node.char is not None:
            huffman_codes[node.char] = current_code
        generate_huffman_codes(node.left, current_code + "0", huffman_codes)
        generate_huffman_codes(node.right, current_code + "1", huffman_codes)

def encode(text):
    root = build_huffman_tree(text)
    huffman_codes = {}
    generate_huffman_codes(root, "", huffman_codes)
    encoded_text = ''.join(huffman_codes[char] for char in text)
    return encoded_text, huffman_codes

def decode(encoded_text, huffman_codes):
    current_code = ""
    decoded_text = ""
    for bit in encoded_text:
        current_code += bit
        for char, code in huffman_codes.items():
            if code == current_code:
                decoded_text += char
                current_code = ""
                break
    return decoded_text

def calcular_tamanho_original(texto):
    # Calcular o tamanho do texto original em bits (assumindo 8 bits por caractere)
    return len(texto) * 8

def calcular_tamanho_codificado(texto_codificado):
    # Calcular o tamanho do texto codificado em bits
    return len(texto_codificado)

def calcular_economia_de_espaco(tamanho_original, tamanho_codificado):
    # Calcular a economia de espaço como porcentagem
    if tamanho_original == 0:
        return 0.0
    return (tamanho_original - tamanho_codificado) / tamanho_original * 100

# Exemplo de uso:
input_string = "Huffman gosta de batata e de estudar"
texto_codificado, huffman_codes = encode(input_string)
texto_decodificado = decode(texto_codificado, huffman_codes)

tamanho_original = calcular_tamanho_original(input_string)
tamanho_codificado = calcular_tamanho_codificado(texto_codificado)

razao_de_compressao = tamanho_original / tamanho_codificado
economia_de_espaco = calcular_economia_de_espaco(tamanho_original, tamanho_codificado)

print("Texto Codificado:", texto_codificado)
print("Texto Decodificado:", texto_decodificado)
print("Tamanho Original (bits):", tamanho_original)
print("Tamanho Codificado (bits):", tamanho_codificado)
print("Razão de Compressão:", razao_de_compressao)
print("Economia de Espaço (%):", economia_de_espaco)

print("######################################################################################################")

input_string = "Resolucao de Problemas utilizando grafos"
texto_codificado, huffman_codes = encode(input_string)
texto_decodificado = decode(texto_codificado, huffman_codes)

tamanho_original = calcular_tamanho_original(input_string)
tamanho_codificado = calcular_tamanho_codificado(texto_codificado)

razao_de_compressao = tamanho_original / tamanho_codificado
economia_de_espaco = calcular_economia_de_espaco(tamanho_original, tamanho_codificado)

print("Texto Codificado:", texto_codificado)
print("Texto Decodificado:", texto_decodificado)
print("Tamanho Original (bits):", tamanho_original)
print("Tamanho Codificado (bits):", tamanho_codificado)
print("Razão de Compressão:", razao_de_compressao)
print("Economia de Espaço (%):", economia_de_espaco)

print("######################################################################################################")

input_string = "Testando TDE04"
texto_codificado, huffman_codes = encode(input_string)
texto_decodificado = decode(texto_codificado, huffman_codes)

tamanho_original = calcular_tamanho_original(input_string)
tamanho_codificado = calcular_tamanho_codificado(texto_codificado)

razao_de_compressao = tamanho_original / tamanho_codificado
economia_de_espaco = calcular_economia_de_espaco(tamanho_original, tamanho_codificado)

print("Texto Codificado:", texto_codificado)
print("Texto Decodificado:", texto_decodificado)
print("Tamanho Original (bits):", tamanho_original)
print("Tamanho Codificado (bits):", tamanho_codificado)
print("Razão de Compressão:", razao_de_compressao)
print("Economia de Espaço (%):", economia_de_espaco)

Texto Codificado: 1011100101011001100111011010111111101111101100100001110111000100111101001100011100011101111001110001001111000100001010100011010101
Texto Decodificado: Huffman gosta de batata e de estudar
Tamanho Original (bits): 288
Tamanho Codificado (bits): 130
Razão de Compressão: 2.2153846153846155
Economia de Espaço (%): 54.861111111111114
######################################################################################################
Texto Codificado: 111110110111001001011111101111111110100010001111010100000000101000001110111101011001110110001011110011011010101110100111011100111100111000100001000101110000011001100
Texto Decodificado: Resolucao de Problemas utilizando grafos
Tamanho Original (bits): 320
Tamanho Codificado (bits): 165
Razão de Compressão: 1.9393939393939394
Economia de Espaço (%): 48.4375
######################################################################################################
Texto Codificado: 11101000101000001100101101011101011111011100100001