# Compressor e descompressor de Imagens

Alunos: 
 - Daniel Souza de Campos - 2018054664
 - Letícia da Silva Macedo Alves - 2018054443

Nosso método de compressão de imagem é constituído pelos seguintes passos:

- Tratar da Redundância Psicovisual por meio da retirada dos 5 bits menos significativos da representação do tom de cada pixel (logo trata-se de um método com perda)
- Gerar o Comprimento de Corrida da imagem tratando da Redundância Interpixel
- Aplicar a Codificação de Huffman tanto nos tons quanto nas quantidades presentes nos pares do comprimento de corrida da imagem
- Gravar todas as informações necessárias para a reconstrução da imagem em um arquivo binário

Na decodificação consideramos a Codificação de Huffman para traduzir os bits para as tonalidades e suas respectivas quantidades e, por fim, reconstruir o Comprimento de Corrida e gerar a imagem.

In [61]:
%matplotlib inline
import cv2
import numpy as np
from matplotlib import pyplot as plt
#Usada para traduzir para binário qualquer coisa
import struct

## Funções usadas na Compressão e Descompressão

### Tratando da redundância de codificação

In [62]:
# Retirado das notebooks disponibilizados pelo professor com pequenas alterações
from heapq import heappush, heappop, heapify
from collections import defaultdict

def encode(symb2freq):
    """Huffman encode the given dict mapping symbols to weights"""
    heap = [[wt, [sym, ""]] for sym, wt in symb2freq.items()]
    heapify(heap)
    while len(heap) > 1:
        lo = heappop(heap)
        hi = heappop(heap)
        for pair in lo[1:]:
            pair[1] = '0' + pair[1]
        for pair in hi[1:]:
            pair[1] = '1' + pair[1]
        heappush(heap, [lo[0] + hi[0]] + lo[1:] + hi[1:])
    return sorted(heappop(heap)[1:], key=lambda p: (len(p[-1]), p))

def applyHuffman(histValues):
    """
    Recebe um dicionário no qual as chaves correspondem aos tons e os valores correspondem à probabilidade de o tom 
    aparecer.
    Retorna um dicionário no qual as chaves são os tons e os valores são os códigos de Huffman correspondentes
    """
    huffValues = encode(histValues)
    huffDict = {subLista[0]: subLista[1] for subLista in huffValues}

    return huffDict

## Funções para Compressão

In [63]:
def calcProbsValues(listaValores):
    """
    Recebe uma lista de números
    Retorna um dicionário no qual as chaves correspondem aos números e os valores correspondem à probabilidade de o número 
    aparecer na lista. 
    """
    dictValues = {}
    for valor in listaValores:
        if valor in dictValues:
            dictValues[valor] += 1
        else:
            dictValues[valor] = 1
    
    qtdValues = len(listaValores)
    dictProbs = defaultdict(float)
    dictProbs = {chave: int(float("{0:.13f}".format(valor/qtdValues*1.0E13))) for chave, valor in dictValues.items()}
    return dictProbs

### Tratando da redundância psicovisual

In [64]:
def retira5BitsMenosSignificativos(img):
    #retira 5 bits
    return img & 0xE0

### Tratando da redundância interpixel

In [65]:
def calculaComprimentosCorrida (img):
    """
    Recebe uma imagem em formato de matriz
    
    Retorna uma lista de duplas na qual o primeiro elementro representa o tom e o segundo elemento representa quantas
    vezes seguidas ele apareceu
    """
    comprimentosCorrida = []
    
    tomAtual = -1
    qtdRepeticoes = 0
    
    adicionouUltimo = False
    for x in range(img.shape[0]):
        for y in range (img.shape[1]):
            if (tomAtual < 0):
                tomAtual = img[x][y]
                qtdRepeticoes += 1
                adicionouUltimo = False
            else:
                if (img[x][y] == tomAtual):
                    qtdRepeticoes += 1
                    adicionouUltimo = False
                else:
                    comprimentosCorrida.append((tomAtual, qtdRepeticoes))
                    tomAtual = img[x][y]
                    qtdRepeticoes = 1
                    adicionouUltimo = True
    
    if( not adicionouUltimo):
        comprimentosCorrida.append((tomAtual, qtdRepeticoes))
        
    return comprimentosCorrida

In [66]:
def geraNomeArquivoComprimido(enderecoArquivoOriginal):
    """
    Gera o nome do arquivo de saída na compressão
    """
    nomeArquivoDescomprimido = enderecoArquivoOriginal.split(".")[0]
    nomeArquivoDescomprimido += "Compressed.bin"
    return nomeArquivoDescomprimido

def escreveAlturaLarguraImagemArquivo(file, imgHeight, imgWidth):
    """
    Escreve no arquivo binário as dimensões da imagem original
    """
    alturaBits = struct.pack('i',imgHeight)
    larguraBits = struct.pack('i',imgWidth)
    numBitsUsados = (4+4)*8 #Cada altura acima é salvo como 'i' que possui 4 bytes
    file.write(larguraBits)
    file.write(alturaBits)
    return numBitsUsados
    
def escreveParesNoArquivo(listaDuplas, arquivo):
    """
    Escreve no arquivo os elementos das duplas da lista de duplas passada. Assume que tudo já está em binário
    """
    numBitsUsados = 0
    for par in listaDuplas:
            arquivo.write(par[0])
            arquivo.write(par[1])
            numBitsUsados += len(par[0])
            numBitsUsados += len(par[1])
    
    return numBitsUsados
            

def escreveIndicadorFimTabela(arquivo, letraTamChave, letraTamValor):
    """
    Escreve um indicador de fim de tabela no arquivo. O indicador é composto de 1 byte de 0 seguido de 4 bytes de 0.
    Identificador que a tabela de probabilidades acabou ao guardar um tom 0 com probabilidade igual a 0
    Como só guardamos tons que aparecem na imagem, nenhum tom real terá probabilidade igual a 0
    """
    numBitsUsados = 0
    chaveIndicador = struct.pack(letraTamChave,0)
    valorIndicador = struct.pack(letraTamValor,0)
    arquivo.write(chaveIndicador)
    arquivo.write(valorIndicador)
    
def getBigHuffmanString(comprimentoCorrida, huffTons, huffQtds):
    stringHuffmanTons = ""
    stringHuffmanQtds = ""
    tamStringTons = 0
    tamStringQtds = 0
    
    for par in comprimentoCorrida:
        huffmanTom = huffTons[par[0]]
        stringHuffmanTons += huffmanTom
        tamStringTons += len(huffmanTom)
            
        huffmanQtd = huffQtds[par[1]]
        stringHuffmanQtds += huffmanQtd
        tamStringQtds += len(huffmanQtd)

    
    return stringHuffmanTons, stringHuffmanQtds, tamStringTons, tamStringQtds

def escreveONumeroTotalDeBytesDaProximaSecao(arquivo, qtdsBytesString):
    """
    Escreve o número de bytes dessa seção para que seja possível descomprimir.
    Igual ao número de bytes total mais 2. Grava um número de 64 bits = 8 bytes para representar.
    Dessa forma, o tamanho máximo da próxima seção é igual ao maior número que pode ser representado por 8 bytes
    """
    numBitsUsados = 0
    totalBytesASeremEscritos = qtdsBytesString + 2
    
    #Número total de bits a serem escritos na seção
    numBitsUsados += totalBytesASeremEscritos * 8
    
    #Representação binária do número
    seqBits = struct.pack('Q',totalBytesASeremEscritos)
    arquivo.write(seqBits)
    
    #Como o tamanho da seção é representado acima por um número usando Q = 8 bytes:
    numBitsUsados += 8*8
    return numBitsUsados

def escreveBigHuffmanStringArquivo(arquivo, huffString, tamHuffString):
    numBitsUsados = 0
    #No range vai até isso menos 1
    qtdsBytesString = tamHuffString//8
    numBitsSobrando = tamHuffString - (qtdsBytesString*8)
    
    numBitsUsados += escreveONumeroTotalDeBytesDaProximaSecao(arquivo, qtdsBytesString)
    
    #O número de bits impressos abaixo já foi contado na função chamada acima
    #De oito em oito, ir traduzindo o binário para o arquivo
    ultimaPosicaoidxInicio = tamHuffString+(-numBitsSobrando)+(-8)+1
    for idxInicio in range(0, ultimaPosicaoidxInicio, 8):
        idxFinal = idxInicio+8
        bitsASeremGravados = huffString[idxInicio:idxFinal]
        bitsComprimidos = struct.pack('B',int(bitsASeremGravados,2))
        arquivo.write(bitsComprimidos)
    
    #Escrevo mais um byte para os bits sobrando ou não
    idxInicio = tamHuffString - numBitsSobrando
    bitsSobrandoCompletadosComZero = huffString[idxInicio:].zfill(8)
    bitsSobrando = struct.pack('B',int(bitsSobrandoCompletadosComZero,2))
    arquivo.write(bitsSobrando)
    
    #indicador de quantos bits levar em consideração do último byte de dados
    ultimoByte = "{0:b}".format(numBitsSobrando)
    ultimoByte = ultimoByte.zfill(8)
    ultimoByte = struct.pack('B',int(ultimoByte,2))
    arquivo.write(ultimoByte)
    return numBitsUsados

Método principal para a compressão da imagem contida no endereço passado como parâmetro.
    
    Operações:
    1. Retira os 5 bits menos significativos de cada pixel da imagem, tratando da redundância psicovisual.
    2. Calcula o Comprimento de Corrida da imagem, gerando uma lista de duplas, o que trata da redundância interpixel.
    3. Calcula as probabilidades de cada tom e cada quantidade associada aos tons de aparecerem no Comprimento de Corrida
    4. Calcula os Códigos de Huffman separadamente para os tons e para as quantidades tratando da redundância de codificação
    5. Traduz os Códigos de Huffman dos tons e quantidades para o formato binário
    6. Grava no arquivo comprimido, as dimensões da imagem em binário
    7. Grava duas tabelas de probabilidade, para os tons e quantidades, em binário, que será usada para recriar os Códigos de Huffman de ambos na descompressão
    8. Grava os Códigos de Huffman em binário dos tons na ordem em que eles aparecem no Comprimento de Corrida
    9. Grava os Códigos de Huffman em binário das quantidades relativas aos tons na ordem em que eles aparecem no Comprimento de Corrida
    
    Obs.: A todo momento, são calculados os bits utilizados para a compressão 

In [67]:
def comprimeImagem(endereco):
    img = cv2.imread(endereco,0)
    
    imgWidth = img.shape[1]
    imgHeight = img.shape[0]
    
    #Variáveis usadas para contar os bits usados
    numBitsImagemOriginal = imgWidth * imgHeight * 8
    numBitsImagemComprimida = 0
    
    imgPsicovisual = retira5BitsMenosSignificativos(img)
    
    listaParesCompCorrida = calculaComprimentosCorrida(imgPsicovisual)
    
    #Calcula as probabilidades de cada tom e quantidade aparecerem
    histTons = calcProbsValues([par[0] for par in listaParesCompCorrida])
    histQtds = calcProbsValues([par[1] for par in listaParesCompCorrida])
    
    # Aplica Huffman nos tons e quantidades do comprimento de corrida
    huffTons = {}
    huffQtds = {}
    huffTons = applyHuffman(histTons)
    huffQtds = applyHuffman(histQtds)
    
    #Gera o nome do arquivo comprimido "originalCompressed.bin"
    nomeArquivo = geraNomeArquivoComprimido(endereco)
    
    #Grava os binários da tabela de probabilidades dos tons no arquivo comprimido
    #Os tons cabem em um byte 'B' e a probabilidade é um inteiro e os gravamos com 'Q'
    #Isso deve refletir na leitura
    probsTonsGuardado = [(struct.pack('B',el[0]), struct.pack('Q',el[1])) for el in histTons.items()]
    #Cada par da lista acima possui 9 bytes Q = 8 e B = 1
    numBitsImagemComprimida += (1+8)*8*len(probsTonsGuardado)
    
    probsQtdsGuardado = [(struct.pack('I',el[0]), struct.pack('Q',el[1])) for el in histQtds.items()]
    #Cada par da lista acima possui 9 bytes I = 4 e Q = 8
    #O maior valor que uma quantidade pode ter é o maior número representado por 4 bytes
    numBitsImagemComprimida += (4+8)*8*len(probsQtdsGuardado) 


    with open(nomeArquivo,"wb") as file:
        
        numBitsImagemComprimida += escreveAlturaLarguraImagemArquivo(file, imgHeight, imgWidth)
        
        escreveParesNoArquivo(probsTonsGuardado, file)
        escreveIndicadorFimTabela(file, 'B', 'Q')
        #Como o indicador contém bits de tamanho B = 1 byte e Q = 8 bytes, o tamanho do indicador é:
        numBitsImagemComprimida += (1+8)*8

        escreveParesNoArquivo(probsQtdsGuardado, file)
        escreveIndicadorFimTabela(file, 'I', 'Q')
        #Como o indicador contém bits de tamanho I = 4 byte e Q = 8 bytes, o tamanho do indicador é:
        numBitsImagemComprimida += (4+8)*8
        
        #Gera duas strings relativas às duas seções de Códigos de Huffman: para tons e quantidades
        stringHuffmanTons, stringHuffmanQtds, tamStringTons, tamStringQtds = getBigHuffmanString(listaParesCompCorrida, 
                                                                                                 huffTons,
                                                                                                 huffQtds)
        
        numBitsImagemComprimida += escreveBigHuffmanStringArquivo(file, stringHuffmanTons, tamStringTons)
        
        numBitsImagemComprimida += escreveBigHuffmanStringArquivo(file, stringHuffmanQtds, tamStringQtds)
    
    return numBitsImagemOriginal, numBitsImagemComprimida

## Funções para descompressão

In [68]:
def leAlturaLarguraImagemArquivo(file):
    alturaBits = file.read(4)
    alturaBits = struct.unpack('i',alturaBits)[0]
    
    larguraBits = file.read(4)
    larguraBits = struct.unpack('i',larguraBits)[0]
    return larguraBits, alturaBits

def leTabelaProbs(arquivo, numBytesChave, numBytesValor, letraTamChave, letraTamValor):
    tabelaProbs = {}
    tom = arquivo.read(numBytesChave)
    while tom:
        prob = arquivo.read(numBytesValor)
        #Se é a probabilidade do tom é 0, significa que a tabela acabou, já que só guardamos coisas que aparecem na imagem
        #e, portanto, não podem ter probabilidade zero
        if(struct.unpack(letraTamValor,prob)[0] == 0):
            break
        tabelaProbs[struct.unpack(letraTamChave,tom)[0]] = (struct.unpack(letraTamValor,prob)[0])/1.0E13
        tom = arquivo.read(numBytesChave)
    return tabelaProbs

def leSessaoBigStringBits(arquivo):
    #Quantos bytes a seção possui
    bitsNumBytesSessao = arquivo.read(8)
    numBytesSessao = struct.unpack('Q',bitsNumBytesSessao)[0]
    
    #String que irá conter a sequência de bits da seção
    bigStringBits = ""
    for numByte in range(numBytesSessao):
        byteLido = arquivo.read(1)
        #Número inteiro que representa o byte lido
        intByteLido = struct.unpack('B', byteLido)[0]
        
        #Se for o último byte que é o indicador de quantos bits levar em consideração do byte anterior
        if(numByte == numBytesSessao - 1):
            idxInicioUltimoByte = (8*(numBytesSessao-2))
            bigStringBits = bigStringBits[0:idxInicioUltimoByte] + bigStringBits[(idxInicioUltimoByte+(8-intByteLido)):]
        else:
            sequenciaBits = bin(intByteLido)[2:]
            sequenciaBits = sequenciaBits.zfill(8)
            bigStringBits += str(sequenciaBits)
            
    return bigStringBits
    

def transformaStringEmLista(stringBits, codHuffman):
    """
    Traduz a 'big String' lida do arquivo comprimido de acordo com os Códigos de Huffman passsados como parâmetro
    """
    listaValores = []
    
    idxInicio = 0
    quantidadeBitsLidos = 1
    adicionouUltimo = False
    while(idxInicio + quantidadeBitsLidos < len(stringBits)):
        sequenciaBits = stringBits[idxInicio:idxInicio+quantidadeBitsLidos]
        if sequenciaBits in codHuffman:
            listaValores.append(codHuffman[sequenciaBits])
            idxInicio += quantidadeBitsLidos
            quantidadeBitsLidos = 1
            adicionouUltimo = True
        else:
            adicionouUltimo = False
            quantidadeBitsLidos += 1
    
    if not adicionouUltimo:
        sequenciaBits = stringBits[idxInicio:idxInicio+quantidadeBitsLidos+1]
        listaValores.append(codHuffman[sequenciaBits])
    
    return listaValores

def restauraImagem(listaTons, listaQtds, larguraImg, alturaImg):
    """
    Preenche a imagem de acordo com a lista de tons e quantidades correspondendo ao Comprimento de Corrida da imagem. 
    """
    img = np.zeros(larguraImg*alturaImg, dtype=np.int16)
    
    idxInicial = 0
    for i in range(len(listaTons)):
        qtdTom = listaQtds[i]
        img[idxInicial: idxInicial+qtdTom] = int(listaTons[i])
        idxInicial += qtdTom
    
    img = np.reshape(img, (larguraImg, alturaImg))
    return img
    
    

Método principal para a descompressão da imagem contida no endereço passado como parâmetro.
    
    Operações:
    1. Lê as dimensões da imagem comprimida.
    2. Lê as tabelas de probabilidades dos tons e das quantidades presentes no comprimento de corrida da imagem
    3. Lê duas seções de bits que representam: 
        1. Os Códigos de Huffman dos tons na ordem em que os tons aparecem na imagem
        2. Os Códigos de Huffman das quantidades na ordem em que as quantidades relativas aos tons aparecem na imagem
    4. A partir das tabelas de probabilidade, recomputa os Códigos de Huffman para os tons e quantidades
    5. Traduz as duas seções de bits lidas de acordo com os Códigos de Huffman recomputados
    6. Reconstrói a imagem de acordo com o comprimento de corrida reconstruído

In [69]:
def descomprimirImagem(endereco):
    probsTonsDescomprimido = {}
    probsQtdsDescomprimido = {}
    stringBitsTons = ""
    stringBitsQtds = ""
    larguraImg = 0
    alturaImg = 0
    with open(endereco,"rb") as file:
        
        larguraImg, alturaImg = leAlturaLarguraImagemArquivo(file)
        
        #Lê as tabelas de probabilidade dos tons e quantidades.
        probsTonsDescomprimido = leTabelaProbs(file, 1, 8, 'B', 'Q' )
        probsQtdsDescomprimido = leTabelaProbs(file, 4, 8, 'I', 'Q')
        
        #Lê os bits das seções que representam os códigos de Huffman de cada tom e quantidade na ordem que apareceram
        stringBitsTons = leSessaoBigStringBits(file)
        stringBitsQtds = leSessaoBigStringBits(file)
        
    #Dicionários de Códigos de Huffman cuja chave é o próprio código 
    huffmanTons = {par[1]: par[0] for par in applyHuffman(probsTonsDescomprimido).items()}
    huffmanQtds = {par[1]: par[0] for par in applyHuffman(probsQtdsDescomprimido).items()}

    #Lê os bits das seções traduzindo-os para tons e quantidades
    listaTonsOrdemAparecem = transformaStringEmLista(stringBitsTons, huffmanTons)
    listaQtdsOrdemAparecem = transformaStringEmLista(stringBitsQtds, huffmanQtds)
    
    #Restaura a imagem de acordo com os tons e respectivas quantidades de comprimento de corrida
    img = restauraImagem(listaTonsOrdemAparecem, listaQtdsOrdemAparecem, larguraImg, alturaImg)
    
    return img

## Funções para comprimir, descomprimir e mostrar informações

In [70]:
# Retirado das notebooks disponibilizados pelo professor
def calcEntropy(img):
    hist = cv2.calcHist([img],[0],None,[256],[0,256])
    hist = hist.ravel()/hist.sum()
    logs = np.log2(hist+0.00001)
    entropy = -1 * (hist*logs).sum()

    return entropy

def rmse(predictions, targets):
    return np.sqrt(((predictions - targets) ** 2).mean())


def psnr(predictions, targets):
    rmsev = rmse(predictions, targets)
    return 20 * np.log10(255/rmsev)

def mostraInformacoesCompressao(imgReal, imgComprimida):
    print(f"RMSE: {rmse(imgReal, imgComprimida)}")
    print(f"PSNR: {psnr(imgReal, imgComprimida)}")

def mostraImagem(img, titulo):
    plt.figure(figsize=(12,6))
    plt.title(titulo)
    plt.imshow(img, cmap = 'gray')
    plt.show()

def carregaEMostraImagem(endereco, titulo):
    img = cv2.imread(endereco,0)
    mostraImagem(img, titulo)
    return img

def calculaEconomiaDeEspaco(valorOriginal, outroValor):
    return (1-(outroValor/valorOriginal))*100

def calculaTaxaCompressao(valorOriginal, outroValor):
    return valorOriginal/outroValor

def carregaComprimeDescomprimeImg(endereco):
    imgOriginal = carregaEMostraImagem(endereco, 'Original')
    numBitsImgOriginal, numBitsImgComprimida = comprimeImagem(endereco)
    print(f"Assumindo que o tamanho da imagem original seja igual a width({imgOriginal.shape[0]})*height({imgOriginal.shape[1]})*8 bits")
    print("NUM BITS ORIGINAL: ",numBitsImgOriginal)
    print("NUM BITS Comprimida: ",numBitsImgComprimida)
    print("Economia de espaço: ", calculaEconomiaDeEspaco(numBitsImgOriginal,numBitsImgComprimida),"%")
    print("Taxa de compressão: ", calculaTaxaCompressao(numBitsImgOriginal,numBitsImgComprimida))
    nomeArquivoComprimido = geraNomeArquivoComprimido(endereco)
    imgDescomprimida = descomprimirImagem(nomeArquivoComprimido)
    mostraImagem(imgDescomprimida, 'Descomprimido')
    mostraInformacoesCompressao(imgOriginal, imgDescomprimida)

## Como testar

Para testar a compressão e a descompressão de uma imagem, primeiramente, rode todas as células acima. Depois, basta chamar a função 'carregaComprimeDescomprimeImg(endereco)' definida logo acima.

Exemplo:

carregaComprimeDescomprimeImg('lena.jpg')

Será gerado um arquivo '.bin' na mesma pasta do notebook representando o arquivo comprimido. O mesmo arquivo é utilizado na descompressão da imagem.