# MAC0417/5768 - Visão e Processamento de Imagens (2021)

Exercício Programa 2.1 - Data augmentation

Gabriela Melo e Richard Block

In [1]:
import skimage
from skimage import io
from skimage import color
from skimage import exposure
import matplotlib.pyplot as plt
import numpy as np
from glob import glob
import os

In [6]:
# criar diretórios para os novos datasets
os.mkdir("/Users/gabimelo/Desktop/EP2/originalGrayDataset")
os.mkdir("/Users/gabimelo/Desktop/EP2/augmentedDataset")

In [8]:
# criar função para soma de fundo com gradiente de níveis de cinza
def add_gradient_exposure(imgarr):
    x = np.linspace(0, 1, imgarr.shape[0]) #cria os valores do gradiente
    grad = np.tile(x, (imgarr.shape[1], 1)).T #replica os valores verticalmente no mesmo tamanho do input 'imgarr'
    return imgarr + grad

func_dict = {
    "gradient": add_gradient_exposure, # soma de fundo com gradiente de níveis de cinza
    "log": exposure.adjust_log, # logaritmo da imagem
    "gamma": lambda imgarr: exposure.adjust_gamma(imgarr, 2) # exponencial da imagem
    # [add] filtro da média implementado usando convolução
}

**Explicações e comentários sobre as funções:**

1. **RGB2Gray**:
    Soma os três canais de cor, vermelho, verde e azul, com pesos para cada canal que aproximam a percepção humana de cores: output = 0.2125R + 0.7154G + 0.0721B. Ao final temos um array no qual cada valor representa uma intensidade na escala de cinza.
    
2. **Soma de Fundo com gradiente de níveis de cinza**:
    Essa função cria variações na iluminação da imagem, de acordo com o gradiente escolhido. Optamos por um gradiente vertical que vai do preto ao branco.
    
3. **Logaritmo da imagem**:
    Reescala os valores da imagem para o intervalo [0, 1]. Em seguida aplica-se a função output = gain\*log(1+ input). A função log desloca os valores dos pixels, aumentando a intensidade, e ajustando o contraste da imagem. "Gain" por padrão é 1; alterando esta variável, altera-se a curva log e os valores dos pixels.
    
4. **Exponencial da imagem**:
    Assim como a função log, altera o contraste das imagens. A forma como ela é implementada, com a variável "gamma", é possível deixar a imagem mais clara (gamma < 1) ou mais escura (gamma > 1). Optamos por um gamma igual a 2. Output = Input\*\*2.
    
5. **Filtro da média implementado usando convolução**:
    Aplicamos um filtro da média (kernel), por meio da função filter2D da biblioteca OpenCV que faz a convolução da imagem com o kernel. O filtro serve para suavizar a imagem, e dependendo do tamanho do kernel, a imagem fica com aparência embaçada.

In [10]:
for path in glob("/Users/gabimelo/Desktop/EP2/dataset/*.jpg"):

    print(path)
    
    # carregar imagem
    img = io.imread(path)
    
    # aplicar função rgb2gray
    gray_img = color.rgb2gray(img)   
    
    # definir novo nome da imagem cinza
    old_name = path.split("/")[-1].replace(".jpg","")
    gray_name = old_name + "_" + "gray"
    print(gray_name)

    # salvar imagem no dataset originalGrayDataset
    np.save("/Users/gabimelo/Desktop/EP2/originalGrayDataset/" + gray_name, gray_img)
        
    for f_name, f in func_dict.items():

        # aplicar função
        aug_img = f(color.rgb2gray(img))

        # definir novo nome da imagem
        old_name = path.split("/")[-1].replace(".jpg","")
        aug_name = old_name + "_" + f_name
        print(aug_name)
        
        # salvar imagem no dataset augmentedDataset
        np.save("/Users/gabimelo/Desktop/EP2/augmentedDataset/" + aug_name, aug_img)

/Users/gabimelo/Desktop/EP2/dataset/leite_2_noite_fora_palha_2.jpg
leite_2_noite_fora_palha_2_gray
leite_2_noite_fora_palha_2_gradient
leite_2_noite_fora_palha_2_log
leite_2_noite_fora_palha_2_gamma
/Users/gabimelo/Desktop/EP2/dataset/tesoura_3_noite_dentro_verde_3.jpg
tesoura_3_noite_dentro_verde_3_gray
tesoura_3_noite_dentro_verde_3_gradient
tesoura_3_noite_dentro_verde_3_log


KeyboardInterrupt: 