# Transformação de imagens

> Atenção: este notebook foi desenhado para funcionar no **Google Collab**. Se pretende executar localmente prefira a versão local deste notebook, sem o sufixo ```-collab```.

## 1. Requerimentos

Utilize o comando ao lado para instalar pelo Anaconda terminal.

* OpenCV 3.4.3 (```conda install -c conda-forge opencv==3.4.3```)
* Matplotlib 3.1.3 (```conda install matplotlib==3.1.3```)
* Seaborn 0.0.10 (```conda install -c conda-forge seaborn==0.10.0```)
* Numpy 1.18.1 (```conda install numpy==1.15.2```)

### 1.2 Arquivos

Baixe o repositório do GitHub utilizando o comando abaixo. Em caso de atualização, utilize o comando para apagar o diretório antes.

In [None]:
!rm -rf fiap-ml-visao-computacional/

In [None]:
!git clone https://github.com/michelpf/fiap-ml-visao-computacional

Vamos agora posicionar o diretório do repositório para a aula respectiva. Nesse caso envie o comando de mudança de diretório.

In [None]:
%cd fiap-ml-visao-computacional/aula-2-transformacao/

Importação das bibliotecas.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import cv2

#Exibição na mesma tela do Jupyter
%matplotlib inline

plt.style.use('seaborn')
sns.set_style("whitegrid", {'axes.grid' : False})

## 2. Translação

Carregando uma imagem previamente existente

In [None]:
imagem = cv2.imread("imagens/robot.jpg")
imagem = cv2.cvtColor(imagem, cv2.COLOR_BGR2RGB)

plt.imshow(imagem)
plt.title("Robô")

Aplicando translação, sempre em paralelo nos eixos x e y. Neste caso utilizando valores positivos.

In [None]:
height, width = imagem.shape[:2]

#Vamos alterar o tamanho para a 25% do original
height_alterado, width_alterado = height/4, width/4

# Matriz de translação
matriz_translacao = np.float32([[1, 0, width_alterado],[0, 1, height_alterado]])

print(matriz_translacao)

imagem_transladada = cv2.warpAffine(imagem, matriz_translacao, (width, height))

plt.imshow(imagem_transladada)
plt.title("Robô Translação")

Aplicando translação no sentido inverso, utilizando valores negativos.

In [None]:
matriz_translacao = np.float32([[1, 0, -width_alterado],[0, 1, -height_alterado]])

# Matriz de translação
print(matriz_translacao)

imagem_transalada = cv2.warpAffine(imagem, matriz_translacao, (width, height))

plt.imshow(imagem_transalada)
plt.title("Robô Translação")

## 3. Rotação

Carregando uma imagem previamente existente

In [None]:
imagem = cv2.imread("imagens/robot.jpg")
imagem = cv2.cvtColor(imagem, cv2.COLOR_BGR2RGB)

plt.imshow(imagem)
plt.title("Robô")

Aplicando matriz de rotação e incluindo na transformação afim.

In [None]:
height, width = imagem.shape[:2]
matriz_rotacao = cv2.getRotationMatrix2D((width/2, height/2), 90, 1)
imagem_rotacionada = cv2.warpAffine(imagem, matriz_rotacao, (width, height))

print(matriz_rotacao)

plt.imshow(imagem_rotacionada)
plt.title("Robô Rotacionado")

Utilizando transposição de imagens. Método mais simples para rotações de ângulos retos.

In [None]:
imagem_transposta = cv2.transpose(imagem)

plt.imshow(imagem_rotacionada)
plt.title("Robô Rotacionado (por transposição)")

## 4. Redimensionamento e Interpolação

O redimensionamento de imagens pode utilizar uma série de interpolações que servem para cobrir os pixels que são expandidos. Cada tipo de interpolação traz aspectos de maior nitidez e velocidade de processamento.

*Os experimentos abaixo foram adaptados deste [link](http://tanbakuchi.com/posts/comparison-of-openv-interpolation-algorithms), de Anthony Tanbakuchi.*

Carregando uma imagem previamente existente

In [None]:
imagem = cv2.imread("imagens/coffee_small.jpg")
imagem = cv2.cvtColor(imagem, cv2.COLOR_BGR2RGB)

plt.imshow(imagem)
plt.title("Café Original (Pequeno)")

Escala por fator (multiplicação)

In [None]:
fator_x=5
fator_y=5

imagem_nova_linear = cv2.resize(imagem, None, fx=fator_x, fy=fator_y)
imagem_nova_cubica = cv2.resize(imagem, None, fx=fator_x, fy=fator_y, interpolation=cv2.INTER_CUBIC)
imagem_nova_area = cv2.resize(imagem, None, fx=fator_x, fy=fator_y, interpolation=cv2.INTER_AREA)
imagem_nova_lanczo = cv2.resize(imagem, None, fx=fator_x, fy=fator_y, interpolation=cv2.INTER_LANCZOS4)

plt.figure(figsize=(20,10))
plt.subplot(2,2,1)
plt.imshow(imagem_nova_linear)
plt.title("Ampliação Linear")

plt.subplot(2,2,2)
plt.imshow(imagem_nova_cubica)
plt.title("Ampliação Cúbica")

plt.subplot(2,2,3)
plt.imshow(imagem_nova_area)
plt.title("Ampliação Interárea")

plt.subplot(2,2,4)
plt.imshow(imagem_nova_lanczo)
plt.title("Ampliação Lanczo")

Escala por novo tamanho.

In [None]:
novo_tamanho = (200,200)

imagem_nova_linear = cv2.resize(imagem, novo_tamanho)
imagem_nova_cubica = cv2.resize(imagem, novo_tamanho, interpolation=cv2.INTER_CUBIC)
imagem_nova_interarea = cv2.resize(imagem, novo_tamanho, interpolation=cv2.INTER_AREA)
imagem_nova_lanczo = cv2.resize(imagem, novo_tamanho, interpolation=cv2.INTER_LANCZOS4)

plt.figure(figsize=(20,10))
plt.subplot(2,2,1)
plt.imshow(imagem_nova_linear)
plt.title("Ampliação Linear")

plt.subplot(2,2,2)
plt.imshow(imagem_nova_cubica)
plt.title("Ampliação Cúbica")

plt.subplot(2,2,3)
plt.imshow(imagem_nova_interarea)
plt.title("Ampliação Interárea")

plt.subplot(2,2,4)
plt.imshow(imagem_nova_lanczo)
plt.title("Ampliação Lanczo")

## 5. Transformação Homográfica (Não-Afim)

In [None]:
imagem = cv2.imread("imagens/portal.jpg")
imagem = cv2.cvtColor(imagem, cv2.COLOR_BGR2RGB)

plt.imshow(imagem)
plt.title("Portal")

In [None]:
height, width = imagem.shape[:2]

imagem_marcadores = imagem.copy()

print(height, width)

pontos_marcadores = np.float32([[300,90],[510,100],[20,490],[780,490]])
pontos_destino = np.float32([[0,0],[800,0],[0,600],[800,600]])

# Adicionando marcadores para visualizar os pontos que serão expandidos

cv2.circle(imagem_marcadores, (300,90), 5, (0, 0, 255), 3)
cv2.circle(imagem_marcadores, (510,100), 5, (0, 0, 255), 3)
cv2.circle(imagem_marcadores, (20,490), 5, (0, 0, 255), 3)
cv2.circle(imagem_marcadores, (780,490), 5, (0, 0, 255), 3)

plt.imshow(imagem_marcadores)
plt.title("Portal com Marcadores")

In [None]:
# Realizando a transformação não afim

matriz_perspectiva = cv2.getPerspectiveTransform(pontos_marcadores, pontos_destino)
imagem_transformada = cv2.warpPerspective(imagem,matriz_perspectiva,(800,600))

plt.imshow(imagem_transformada)
plt.title("Portal com Marcadores")

## 6. Recorte de imagens e região de interesse (ROI)

No OpenCV não existe uma função própria para recortar segmentos de uma imagem. Por outro lado, conseguimos fazer esta tarefa fácilmente aplicando diretamente na matriz da imagem as alterações.

In [None]:
imagem = cv2.imread("imagens/robot.jpg")
imagem = cv2.cvtColor(imagem, cv2.COLOR_BGR2RGB)

height, width = imagem.shape[:2]

plt.imshow(imagem)
plt.title("Imagem Original")

In [None]:
linha_inicio, coluna_inicio = int(height*0.3), int(width*0.3)
linha_final, coluna_final =  int(height*0.6), int(width*0.6)

imagem_recortada = imagem[linha_inicio:linha_final, coluna_inicio:coluna_final]

plt.imshow(imagem_recortada)
plt.title("Imagem Recortada")

### 6.1 Obtendo imagem a da câmera

Este método é de uso exclusivo do Colab, uma vez que não temos acesso direto a câmera do dispositivo.

Obtido dos [snippets avançados](https://colab.research.google.com/notebooks/snippets/advanced_outputs.ipynb#scrollTo=buJCl90WhNfq) do Google Colab.

In [None]:
from IPython.display import display, Javascript
from google.colab.output import eval_js
from base64 import b64decode

def take_photo(filename='photo.jpg', quality=0.8):
  js = Javascript('''
    async function takePhoto(quality) {
      const div = document.createElement('div');
      const capture = document.createElement('button');
      capture.textContent = 'Capture';
      div.appendChild(capture);

      const video = document.createElement('video');
      video.style.display = 'block';
      const stream = await navigator.mediaDevices.getUserMedia({video: true});

      document.body.appendChild(div);
      div.appendChild(video);
      video.srcObject = stream;
      await video.play();

      // Resize the output to fit the video element.
      google.colab.output.setIframeHeight(document.documentElement.scrollHeight, true);

      // Wait for Capture to be clicked.
      await new Promise((resolve) => capture.onclick = resolve);

      const canvas = document.createElement('canvas');
      canvas.width = video.videoWidth;
      canvas.height = video.videoHeight;
      canvas.getContext('2d').drawImage(video, 0, 0);
      stream.getVideoTracks()[0].stop();
      div.remove();
      return canvas.toDataURL('image/jpeg', quality);
    }
    ''')
  display(js)
  data = eval_js('takePhoto({})'.format(quality))
  binary = b64decode(data.split(',')[1])
  with open(filename, 'wb') as f:
    f.write(binary)
  return filename

Função que obtem a foto da câmera do navegador e salva em uma pasta determinada.

In [None]:
from IPython.display import Image
try:
  filename = take_photo("imagens/foto.jpg")
  print('Saved to {}'.format(filename))
  
  # Show the image which was just taken.
  display(Image(filename))
except Exception as err:
  # Errors will be thrown if the user does not have a webcam or if they do not
  # grant the page permission to access it.
  print(str(err))

In [None]:
imagem = cv2.imread("imagens/foto.jpg")
imagem = cv2.cvtColor(imagem, cv2.COLOR_BGR2RGB)

plt.figure(figsize=(20,10))
plt.imshow(imagem)

In [None]:
imagem_anotada = imagem.copy()
cv2.rectangle(imagem_anotada,(1000,600), (1400,1000), (255, 0, 0), 2)

plt.figure(figsize=(20,10))
plt.imshow(imagem_anotada)

In [None]:
roi = imagem_anotada[600:1000, 1000:1400]

plt.figure(figsize=(20,10))
plt.imshow(roi)

In [None]:
roi = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY)
roi = cv2.cvtColor(roi, cv2.COLOR_GRAY2BGR)

imagem_anotada[600:1000, 1000:1400] = roi

plt.figure(figsize=(20,10))
plt.imshow(imagem_anotada)

## 7. Alterando brilho (nitidez) de uma imagem

Refere-se a tornar a imagem mais clara.

In [None]:
imagem = cv2.imread("imagens/robot.jpg")
imagem = cv2.cvtColor(imagem, cv2.COLOR_BGR2RGB)

imagem_shape = imagem.shape

plt.imshow(imagem)
plt.title("Imagem Original")

In [None]:
matriz_brilho = np.ones(imagem_shape, np.uint8) * 100
imagem_brilho = cv2.add(imagem, matriz_brilho)

plt.imshow(imagem_brilho)
plt.title("Imagem Brilho")

In [None]:
imagem_escura = cv2.subtract(imagem, matriz_brilho)

plt.imshow(imagem_escura)
plt.title("Imagem Escura")

## 8. Operações lógicas

As operações lógicas ou bitwise operations são operações do tipo and, or, xor e not. São utilizadas na composição de 2 imagens, criar máscaras e intersecções.

In [None]:
retangulo = np.zeros((300,300), np.uint8)
cv2.rectangle(retangulo, (50,50), (200,200), 255, -2)

plt.imshow(retangulo, cmap="gray")
plt.title("Retangulo")

In [None]:
circulo = np.zeros((300,300), np.uint8)
cv2.circle(circulo,(180,150), 100, 255, -2)

plt.imshow(circulo, cmap="gray")
plt.title("Círculo")

In [None]:
operacao_and = cv2.bitwise_and(retangulo, circulo)

plt.imshow(operacao_and, cmap="gray")
plt.title("Operação And (E)")

In [None]:
operacao_or = cv2.bitwise_or(retangulo, circulo)

plt.imshow(operacao_or, cmap="gray")
plt.title("Operação Or (Ou)")

In [None]:
operacao_xor = cv2.bitwise_xor(retangulo, circulo)

plt.imshow(operacao_or, cmap="gray")
plt.title("Operação Xor (Ou Exclusivo)")

In [None]:
operacao_negacao = cv2.bitwise_not(circulo)

plt.imshow(operacao_negacao, cmap="gray")
plt.title("Operação Not (Negação)")