# Trabalho Prático 1 - Introdução à Computação Visual

## Introdução

O objetivo deste trabalho é a implementação de um método de compressão de imagens em escala de cinza. Deverá ser possível comprimir uma imagem sem compressão passada como entrada, salvar essa imagem e, posteriormente, passar como entrada uma imagem comprimida pelo método aqui implementado e exibi-la. A compressão pode ser tanto com perda quanto sem perda. O PSNR deverá ser exibido após a compressão da imagem.

## Implementação

O método implementado neste trabalho consiste na implementação da codificação preditiva sem perdas com o processo da codificação de Huffman no final. Para uma dada imagem inserida, o compressor irá salvar somente o primeiro pixel da imagem, presente na origem (0, 0). A partir daí, uma função de predição irá tentar retornar o valor do próximo pixel. A diferença entre o valor predito e o valor real será o erro obtido. Esse erro será o valor salvo para codificação naquele ponto, de forma a reduzir a entropia da imagem, obtendo, no final, uma matriz com uma frequência alta de poucos valores. Os valores dessa matriz serão, ao final, codificados em uma árvore com a codificação de Huffman, diminuindo o número médio de bits por pixel.

Para obter a imagem novamente, será necessário somente realizar um processo para reverter a codificação de Huffman e, a partir do primeiro pixel, gerar os pixels seguintes, de acordo com a diferença obtida entre a função inversa de predição e o valor real, que estará na matriz.

Para podermos testar o impacto de cada um dos dois métodos utilizados na taxa de compressão, o algoritmo será modularizado e parametrizado de forma que possa ser utilizado livremente qualquer um dos dois métodos a qualquer momento, além de poder utilizar os dois em conjunto.

### Importações

In [1]:
%matplotlib inline
import cv2
import numpy as np
from matplotlib import pyplot as plt
import heapq

### Definições de variáveis constantes

In [2]:
INPUT_UNCOMPRESSED_IMG_PATH = "lena512.pgm"
OUTPUT_COMPRESSED_IMG_PATH = "./"
INPUT_COMPRESSED_IMG_PATH = "lena512.mycompress"

# Alterar essas variáveis irá ativar ou desativar esses métodos de compressão.
USE_HUFFMAN = True
USE_PREDICTION = True

### Implementação da codificação preditiva e sua decodificação

In [3]:
def predictionFunction(x, raveledImg):
    return raveledImg[x - 1]

def predictiveCode(img):
    imgShape = img.shape
    raveledImg = img.ravel()
    firstElement = raveledImg[0]
    errorMatrix = np.empty(raveledImg.shape, dtype=int)
    # O primeiro elemento não terá erro, pois seu valor será passado diretamente ao cabeçalho.
    errorMatrix[0] = 0
    for x, currentValue in enumerate(raveledImg[1:], 1):
        predictedValue = predictionFunction(x, raveledImg)
        error = int(currentValue) - int(predictedValue)
        errorMatrix[x] = error
    errorMatrix = errorMatrix.reshape(imgShape)
    return errorMatrix, firstElement
    
def predictiveDecode(errorMatrix, firstElement):
    imgShape = errorMatrix.shape
    errorMatrix = errorMatrix.ravel()
    img = np.empty(errorMatrix.shape, dtype=int)
    # Como a função de predição utiliza o elemento anterior, ao menos o primeiro elemento deve estar preenchido.
    img[0] = firstElement
    for x, error in enumerate(errorMatrix[1:], 1):
        predictedValue = predictionFunction(x, img)
        img[x] = predictedValue + error
    img = img.reshape(imgShape)
    return img

### Implementação da codificação de Huffman e sua decodificação

In [4]:
class Node:
    def __init__(self, left, right):
        self.left = left
        self.right = right
    
    # Sobrescreve operadores de comparação que são usados na fila de prioridade.
    # Como essa comparação só é feita quando a frequência é igual para dois valores, a ordem não fará diferença.
    def __lt__(self, other):
        return True

    def __gt__(self, other):
        return True

def generatePriorityQueue(img):
    values, frequencies = np.unique(img, return_counts=True)
    priorityQueue = np.asarray((frequencies, values)).T.tolist()
    heapq.heapify(priorityQueue)
    return priorityQueue

def generateBinaryTree(priorityQueue):
    for _ in range(len(priorityQueue) - 1):
        lowerElement = heapq.heappop(priorityQueue)
        secondLowerElement = heapq.heappop(priorityQueue)
        # O primeiro valor da tupla é a frequência e o segundo é o valor em si.
        newFrequency = lowerElement[0] + secondLowerElement[0]
        node = Node(lowerElement[1], secondLowerElement[1])
        heapq.heappush(priorityQueue, [newFrequency, node])
    return heapq.heappop(priorityQueue)[1]

def recursiveDFS(currentNode, code, currentValue):
    currentValue = currentValue + '0'
    if isinstance(currentNode.left, Node):
        recursiveDFS(currentNode.left, code, currentValue)
    else:
        code[currentNode.left] = currentValue
        
    currentValue = currentValue[:-1] + '1'
    if isinstance(currentNode.right, Node):
        recursiveDFS(currentNode.right, code, currentValue)
    else:
        code[currentNode.right] = currentValue

def generateCode(binaryTree):
    initialValue = ''
    code = {}
    recursiveDFS(binaryTree, code, initialValue)
    return code
        
def huffmanCode(img):
    priorityQueue = generatePriorityQueue(img)
    binaryTree = generateBinaryTree(priorityQueue)
    code = generateCode(binaryTree)
    return code

### Implementação da codificação binária tradicional

In [29]:
def intToBinary(number, length):
    return bin(number)[2:].zfill(length)

def binaryCode(img):
    code = {}
    uniqueValues = np.unique(img)
    minimumBitsLength = len(uniqueValues).bit_length()
    for i, value in enumerate(uniqueValues):
        code[value] = intToBinary(i, minimumBitsLength)
    return code

### Definição das funções de escrita e leitura de imagens comprimidas

In [6]:
def writeCompressedImage(img, codingTree=None):
    None
    
def readCompressedImage(file):
    None

### Definição das funções gerais

In [7]:
def showImage(img, title="Image"):
    plt.title(title)
    plt.imshow(img, cmap = 'gray')
    plt.show()

def compressImageAndShowResults(imgPath):
    img = cv2.imread(imgPath, cv2.IMREAD_GRAYSCALE)
    showImage(img)

### Sandbox para uso das funções

In [30]:
# compressImageAndShowResults(INPUT_UNCOMPRESSED_IMG_PATH)
img = cv2.imread(INPUT_UNCOMPRESSED_IMG_PATH, cv2.IMREAD_GRAYSCALE)
errorMatrix, firstElement = predictiveCode(img)
binaryCode(errorMatrix)

{-168: '000000000',
 -161: '000000001',
 -160: '000000010',
 -159: '000000011',
 -158: '000000100',
 -157: '000000101',
 -156: '000000110',
 -155: '000000111',
 -154: '000001000',
 -153: '000001001',
 -151: '000001010',
 -150: '000001011',
 -147: '000001100',
 -146: '000001101',
 -145: '000001110',
 -143: '000001111',
 -142: '000010000',
 -141: '000010001',
 -139: '000010010',
 -138: '000010011',
 -137: '000010100',
 -136: '000010101',
 -135: '000010110',
 -134: '000010111',
 -133: '000011000',
 -132: '000011001',
 -130: '000011010',
 -129: '000011011',
 -128: '000011100',
 -127: '000011101',
 -126: '000011110',
 -125: '000011111',
 -124: '000100000',
 -123: '000100001',
 -122: '000100010',
 -121: '000100011',
 -120: '000100100',
 -119: '000100101',
 -118: '000100110',
 -117: '000100111',
 -116: '000101000',
 -115: '000101001',
 -114: '000101010',
 -112: '000101011',
 -111: '000101100',
 -110: '000101101',
 -109: '000101110',
 -108: '000101111',
 -107: '000110000',
 -106: '000110001',
