#Usage

####Para rodar o programa, execute o bloco de código abaixo para importar os arquivos de teste (.txt) do repositório no GitHub.

In [None]:
!git clone https://github.com/pedro-negrao/AED-II-PROJETO.git

Cloning into 'AED-II-PROJETO'...
remote: Enumerating objects: 11, done.[K
remote: Counting objects: 100% (11/11), done.[K
remote: Compressing objects: 100% (8/8), done.[K
remote: Total 11 (delta 0), reused 0 (delta 0), pack-reused 0[K
Unpacking objects: 100% (11/11), done.


##Algoritmo de Huffman:##



In [None]:
class No:
    def __init__(self, prob, simbolo, esquerda=None, direita=None):
        self.prob = prob
        self.simbolo = simbolo
        self.esquerda = esquerda
        self.direita = direita
        self.codigo = ''


def CalcularCodigos(no, valor=''):
    novoValor = valor + str(no.codigo)
    if(no.esquerda):
        CalcularCodigos(no.esquerda, novoValor)
    if(no.direita):
        CalcularCodigos(no.direita, novoValor)
    if(not no.esquerda and not no.direita):
        codigos[no.simbolo] = novoValor

    return codigos


def CalcularProbabilidade(data):
    simbolos = dict()
    for elemento in data:
        if simbolos.get(elemento) == None:
            simbolos[elemento] = 1
        else:
            simbolos[elemento] += 1

    return simbolos


def CalcularTamanhoArquivo(data, coding):
    original = len(data) * 8    #espaço total de bits para armazenar os dados antes da compressão
    comprimido = 0
    simbolos = coding.keys()
    for simbolo in simbolos:
        count = data.count(simbolo)
        comprimido = comprimido + count * len(coding[simbolo])
    razaoCompressao = (comprimido / original) * 100

    print("Espaço usado antes da compressão: " + str(original) + " bits")
    print("Espaço usado depois da compressão: " + str(comprimido) + " bits")
    print(f"Razão de compressão: {razaoCompressao:.2f}%")


def OutputCodificado(data, coding):
    output = []
    for c in data:
        output.append(coding[c])
    string = ''.join([str(item) for item in output])

    return string


def Huffman(data):
    dicionarioSimbolos = CalcularProbabilidade(data)
    simbolos = dicionarioSimbolos.keys()
    probabilidades = dicionarioSimbolos.values()

    print("Símbolos: ", simbolos)
    print("Probabilidades: ", probabilidades)

    nos = []

    for simbolo in simbolos:
        nos.append(No(dicionarioSimbolos.get(simbolo), simbolo))

    while len(nos) > 1:
        # ordena todos os nós em ordem do menor para o maior baseado em suas probabilidades
        nos = sorted(nos, key=lambda x: x.prob)

        direita = nos[0]
        esquerda = nos[1]

        esquerda.codigo = 0
        direita.codigo = 1

        # combina os 2 menores nós para criar um novo nó
        novoNo = No(esquerda.prob + direita.prob, esquerda.simbolo + direita.simbolo, esquerda, direita)

        nos.remove(esquerda)
        nos.remove(direita)
        nos.append(novoNo)

    codificacao = CalcularCodigos(nos[0])
    print("Códigos dos símbolos: ", codificacao)
    CalcularTamanhoArquivo(data, codificacao)
    output = OutputCodificado(data,codificacao)

    return output, nos[0]


def Decodificacao(infoCodificada, arvore):
    raiz = arvore
    outputDecodificado = []
    for x in infoCodificada:
        if x == '1':
            arvore = arvore.direita
        elif x == '0':
            arvore = arvore.esquerda
        try:
            if arvore.esquerda.simbolo == None and arvore.direita.simbolo == None:
                pass
        except AttributeError:
            outputDecodificado.append(arvore.simbolo)
            arvore = raiz

    decodificado = ''.join([str(item) for item in outputDecodificado])
    return decodificado

codigos = dict()



############### TESTE 1 ##################

print("##### TESTE 1 #####\n")
f = open("/content/AED-II-PROJETO/exemplo1.txt", "r")
data = f.read()
infoCodificada, arvore = Huffman(data)
print("Informação codificada:", infoCodificada)
print("Informação decodificada:", Decodificacao(infoCodificada, arvore))

##########################################


############### TESTE 2 ##################

print("\n\n##### TESTE 2 #####\n")
f = open("/content/AED-II-PROJETO/exemplo2.txt", "r")
data = f.read()
infoCodificada, arvore = Huffman(data)
print("Informação codificada:", infoCodificada)
print("Informação decodificada:", Decodificacao(infoCodificada, arvore))

##########################################


############### TESTE 3 ##################

print("\n\n##### TESTE 3 #####\n")
f = open("/content/AED-II-PROJETO/exemplo3.txt", "r")
data = f.read()
infoCodificada, arvore = Huffman(data)
print("Informação codificada:", infoCodificada)
print("Informação decodificada:", Decodificacao(infoCodificada, arvore))

##########################################


##### TESTE 1 #####

Símbolos:  dict_keys(['A', 'B', 'G', 'F'])
Probabilidades:  dict_values([27, 28, 19, 33])
Códigos dos símbolos:  {'F': '00', 'B': '01', 'A': '10', 'G': '11'}
Espaço usado antes da compressão: 856 bits
Espaço usado depois da compressão: 214 bits
Razão de compressão: 25.00%
Informação codificada: 1010101010101010101010101010100101010101010101010111111100000000000000000000000000101010101010101010101010010101011111111111000000000000000001010101010101010101010101011111111111111111111111000000000000000000000000
Informação decodificada: AAAAAAAAAAAAAAABBBBBBBBBBGGGFFFFFFFFFFFFFAAAAAAAAAAAABBBBGGGGGFFFFFFFFBBBBBBBBBBBBBBGGGGGGGGGGGFFFFFFFFFFFF


##### TESTE 2 #####

Símbolos:  dict_keys(['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'])
Probabilidades:  dict_values([52, 42, 58, 56, 57, 45, 46, 44, 48, 30])
Códigos dos símbolos:  {'F': '0000', 'B': '0010', 'A': '101', 'G': '111', 'H': '0001', 'J': '0011', 'C': '010', 'E': '011', 'D': '100', 'I': '110'}
Espaço usado antes d

##Algoritmo de Compressão RLE:##

In [None]:
def FormatarSaida(data):
    result = []
    for item in data:
        if (item[1] == 1):
            result.append(item[0])
        else:
            result.append(str(item[1]) + item[0])

    return "".join(result)


def CalcularTamanho(data, coding):
    original = len(data) * 8
    comprimido = len(coding) * 8
    razaoCompressao = (comprimido / original) * 100

    print("Espaço usado antes da compressão: " + str(original) + " bits")
    print("Espaço usado depois da compressão: " + str(comprimido) + " bits")
    print(f"Razão de compressão: {razaoCompressao:.2f}%")



def Codificar(data):
    contador = 1
    output = []
    outputFormatado = []

    for x, item in enumerate(data):
        if x == 0:
            continue
        elif item == data[x - 1]:
            contador += 1
        else:
            output.append((data[x - 1], contador))
            contador = 1
    output.append((data[len(data) - 1], contador))

    return output


def Decodificar(data):
    decodificado = []
    for elemento in data:
        decodificado.append(elemento[0] * elemento[1])

    return "".join(decodificado)



############### TESTE 1 ##################

print("##### TESTE 1 #####\n")
f = open("/content/AED-II-PROJETO/exemplo1.txt", "r")
rle = f.read()
codificado = Codificar(rle)
output = FormatarSaida(codificado)
decodificado = Decodificar(codificado)
CalcularTamanho(rle, output)
print("Informação codificada:", output)
print("Informação decodificada:", decodificado)

##########################################


############### TESTE 2 ##################

print("\n\n##### TESTE 2 #####\n")
f = open("/content/AED-II-PROJETO/exemplo2.txt", "r")
rle = f.read()
codificado = Codificar(rle)
output = FormatarSaida(codificado)
decodificado = Decodificar(codificado)
CalcularTamanho(rle, output)
print("Informação codificada:", output)
print("Informação decodificada:", decodificado)

##########################################


############### TESTE 3 ##################

print("\n\n##### TESTE 3 #####\n")
f = open("/content/AED-II-PROJETO/exemplo3.txt", "r")
rle = f.read()
codificado = Codificar(rle)
output = FormatarSaida(codificado)
decodificado = Decodificar(codificado)
CalcularTamanho(rle, output)
print("Informação codificada:", output)
print("Informação decodificada:", decodificado)

##########################################


##### TESTE 1 #####

Espaço usado antes da compressão: 856 bits
Espaço usado depois da compressão: 232 bits
Razão de compressão: 27.10%
Informação codificada: 15A10B3G13F12A4B5G8F14B11G12F
Informação decodificada: AAAAAAAAAAAAAAABBBBBBBBBBGGGFFFFFFFFFFFFFAAAAAAAAAAAABBBBGGGGGFFFFFFFFBBBBBBBBBBBBBBGGGGGGGGGGGFFFFFFFFFFFF


##### TESTE 2 #####

Espaço usado antes da compressão: 3824 bits
Espaço usado depois da compressão: 816 bits
Razão de compressão: 21.34%
Informação codificada: 7A9B8C8D9E10F9G8H8I9J13A2B2C2D2E2F2G2H2I2ABCD17A14B33C29D27E18F22G21H21I21J14C13A16D19E16B17I13H13G15F
Informação decodificada: AAAAAAABBBBBBBBBCCCCCCCCDDDDDDDDEEEEEEEEEFFFFFFFFFFGGGGGGGGGHHHHHHHHIIIIIIIIJJJJJJJJJAAAAAAAAAAAAABBCCDDEEFFGGHHIIAABCDAAAAAAAAAAAAAAAAABBBBBBBBBBBBBBCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCDDDDDDDDDDDDDDDDDDDDDDDDDDDDDEEEEEEEEEEEEEEEEEEEEEEEEEEEFFFFFFFFFFFFFFFFFFGGGGGGGGGGGGGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHIIIIIIIIIIIIIIIIIIIIIJJJJJJJJJJJJJJJJJJJJJCCCCCCCCCCCCCCAAAAAAAAAAAAADDDDDDDDDDDDDDDDEEE