# Lista de Exercício 4
### Visão Computacional (SEL0339/SEL5886)

**Instruções:**

 1. Esta lista consiste em 4 exercícios, sendo um deles opcional (aplicação).
 1. Deve-se colocar comentários nos códigos desenvolvidos.
 1. As perguntas devem ser respondidas também como comentários no arquivo.
 1. Colocar seu nome e número USP abaixo.
 1. Quaisquer problemas na execução das listas, entrar em contato com os monitores.
 1. Depois de terminados os exercícios, deve ser gerado um arquivo **extensão .ipynb** para ser enviado ao professor pelo E-DISCIPLINAS da disciplina até a data máxima de entrega.
 1. Caso não seja enviado - ou identifique-se cópia - o aluno ficará sem nota.


---



 <table class="tfo-notebook-buttons" align="left">
  <td>
    <a target="_blank" href="https://colab.research.google.com/github/LAVI-USP/SEL0339-SEL5886_2022/blob/main/praticas/Lista_de_Exercicio_4.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png" />Executar no Google Colab</a>
  </td>
  <td>
    <a target="_blank" href="https://github.com/LAVI-USP/SEL0339-SEL5886_2022/blob/main/praticas/Lista_de_Exercicio_4.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png" />Ver codigo fonte no GitHub</a>
  </td>
</table>

`Nome: `

`Número USP: `

### Introdução:

Nesta lista de exercícios vamos estudar sobre filtros passa-baixa, passa-alta e processamento de pixel de borda. Primeiramente, vamos importar as bibliotecas que iremos utilizar:

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import cv2 as cv
import os

from scipy.io import loadmat
from IPython.display import HTML
from base64 import b64encode
from skimage.util import random_noise

#### **Atenção**: os códigos abaixo são para fazer o download das imagens necessárias para a prática. EXECUTE-OS!

In [None]:
import urllib.request

try:
  urllib.request.urlretrieve("https://github.com/LAVI-USP/SEL0339-SEL5886_2022/blob/main/imagens/pratica_04/board.tif?raw=true", "board.tif")
except:
  print("[ERRO] Não foi possível fazer o download das imagens dessa prática. Entre em contato com o monitor")

try:
  urllib.request.urlretrieve("https://github.com/LAVI-USP/SEL0339-SEL5886_2022/blob/main/imagens/pratica_04/board_ruido.tif?raw=true", "board_ruido.tif")
except:
  print("[ERRO] Não foi possível fazer o download das imagens dessa prática. Entre em contato com o monitor")

try:
  urllib.request.urlretrieve("https://github.com/LAVI-USP/SEL0339-SEL5886_2022/blob/main/imagens/pratica_04/obama.mp4?raw=true", "obama.mp4")
except:
  print("[ERRO] Não foi possível fazer o download das imagens dessa prática. Entre em contato com o monitor")

try:
  urllib.request.urlretrieve("https://github.com/LAVI-USP/SEL0339-SEL5886_2022/blob/main/imagens/pratica_04/parede.tif?raw=true", "parede.tif")
except:
  print("[ERRO] Não foi possível fazer o download das imagens dessa prática. Entre em contato com o monitor")

try:
  urllib.request.urlretrieve("https://github.com/LAVI-USP/SEL0339-SEL5886_2022/blob/main/imagens/pratica_04/pontos.tif?raw=true", "pontos.tif")
except:
  print("[ERRO] Não foi possível fazer o download das imagens dessa prática. Entre em contato com o monitor")


try:
  urllib.request.urlretrieve("https://github.com/LAVI-USP/SEL0339-SEL5886_2022/blob/main/imagens/pratica_04/faceMask.mat?raw=true", "faceMask.mat")
except:
  print("[ERRO] Não foi possível fazer o download das imagens dessa prática. Entre em contato com o monitor")

### 1) Transformações por vizinhança

Transformações por vizinhança se dão por meio da combinação das intensidades de um certo número de pixels (janela ou *kernel*), a fim de computar o valor da nova intensidade na imagem de saída. A Figura 1 ilustra como se dá esse processo através da convolução espacial.

<center><img src="https://github.com/LAVI-USP/SEL0339-SEL5886_2022/blob/main/imagens/pratica_04/convolucao.gif?raw=true" style="width:650px;height:300px;"></center>

<center><caption><b> Figura 1:</b> Ilustração da convolução de um filtro em uma imagem.</b></caption></center>

Na figura acima foi utilizado um *kernel* do tipo:

\begin{equation}
K = 
\begin{bmatrix}
1 & 0 & 1\\
0 & 1 & 0\\
1 & 0 & 1
\end{bmatrix}
\end{equation}

Quando o filtro está na primeira posição, a equação matemática para se obter o valor 4 é dada por:

$$g(x,y) = 1 \times 1  +  0 \times 1  + 1 \times 1  + 0 \times 0  + 1 \times 1  + 0 \times 1  + 1 \times 0  + 0  \times 0  + 1 \times 1.$$

É importante notar que no domínio do espaço a diferença entre a Convolução e a Correlação Cruzada reside apenas no espelhamento do Template (*kernel*) a ser utilizado, que deve ser feito na Convolução. Como, em geral, os Templates são simétricos, a equação da Correlação Cruzada tem sido empregada com o nome de Convolução na área de Processamento de Imagens.

Como pode ser observado na animação acima, caso a borda da imagem não seja tratada, a imagem resultante tem um tamanho menor. Esse tamanho pode ser calculado por meio da equação:

$$ g_n = n + 2 \times p - k + 1,$$

onde $n$ é o número de linhas da imagem original, $p$ o número de pixels utilizados no *padding* e $k$ é o tamanho do *kernel* (geralmente quadrado). No caso acima, $n = 5$, $p = 0$ e $k = 3$, resultando em uma imagem de $3\times3$. Para evitar esse problema é necessário utilizar o *padding* com o valor $p = 1$. O mesmo se dá para as colunas da imagem. 

Referências:

*   Material da sala de aula;
*   OpenCV: [Smoothing Images](https://docs.opencv.org/master/d4/d13/tutorial_py_filtering.html).

### 1.1) Filtro Passa Baixa (Nota: 1.5/10)

**Exercício:**

1. A imagem ```board_ruido.tif``` está contaminada com ruído *gaussiano* de média zero e desvio padrão 100. Implemente um código que atenue o ruído da imagem dada utilizando:
 
  *   Filtro da média ```3x3```.
  *   Filtro da média ```9x9```.
  *   Filtro da média ```12x12```.

2. Comente os resultados.

*Dicas:* 

*    Considere o exemplo do *kernel* $K$ de um filtro espacial da média apresentado abaixo:
    \begin{equation}
    K = \frac{1}{9}
    \begin{bmatrix}
    1 & 1 & 1\\
    1 & 1 & 1\\
    1 & 1 & 1
    \end{bmatrix}
    \end{equation}

    Pode-se utilizar a declaração de array da biblioteca *numpy* para declarar K como uma matriz da seguinte maneira:

    ``` python
    kernel = np.array(((1, 1, 1), 
                        (1, 1, 1),
                        (1, 1, 1))) / 9
    ```
 ou
    ``` python
    kernel = np.ones((3,3)) / 9
    ```
*   Utilize a função [cv.filter2D](https://docs.opencv.org/3.4/d4/d86/group__imgproc__filter.html#ga27c049795ce870216ddfb366086b5a04) para fazer a convolução com o *kernel*. 

    ``` python
    cv.filter2D(myImg, -1, myKernel)
    ```
   
*   Mostre as imagens na faixa de ```0-255 ```.

**Observação**

Ao trabalhar com filtros convolucionais, é essencial garantir que a imagem a ser filtrada seja de um "tipo" de variável que contemple números "quebrados", tal como o tipo ```float```. Sendo assim, nos exercícios abaixo, ao ler a imagem utilizando a função ```cv.imread()```, vamos adicionar um código que fará a variável ser do tipo ```float```. Para isto, basta adicionarmos o termo ```.astype('float')``` , conforme a primeira linha do código abaixo. Esta forma de utilizar a variável que contém a imagem é muito utilizada em processamentos de imagem.

In [None]:
img_board_ruido = cv.imread('board_ruido.tif',cv.IMREAD_UNCHANGED).astype('float')

## -- Seu código começa AQUI -- ##


## -- Seu código termina AQUI -- ##

## -- COMENTÁRIOS -- ##

### 1.2) Filtro da Média e da Mediana (Nota: 3.5/10)

1. Contamine a imagem ```board.tif``` com ruído "*gaussiano*” de média zero e desvio padrão 50.

2. Contamine a imagem ```board.tif``` com ruído do tipo "*sal e pimenta*" . 

3. Implemente um código que diminua o ruído das imagens geradas utilizando:
 
  *   Filtro da média ```3x3```. 
  *   Filtro da mediana ```3x3```. 

  **OBS: Cada filtro deve ser aplicado nas duas imagens ruidosas, a fim de poder comparar os resultados.**

4. Qual filtro foi melhor para cada caso? Comente.

5. Agora, aumente o tamanho de ambos kernels para ```5x5``` e aplique cada um dos filtros criados na imagem original (sem ruído). Compare os resultados, tendo como base o que cada um dos dois filtros tem de diferente entre si.

*Dicas:* 
  *   Você pode utilizar a função [np.random.normal](https://numpy.org/doc/stable/reference/random/generated/numpy.random.normal.html) para gerar o ruído Gaussiano;
  *   Você pode utilizar a função [random_noise](https://scikit-image.org/docs/stable/api/skimage.util.html#skimage.util.random_noise) para inserir o ruído "*sal e pimenta*" - basta utilizar o mode='s&p'. Já importamos a bilioteca no início do notebook.
   * **OBS: a função random_noise converte a imagem para o intervalo [0, 1]. Lembre-se de escalar novamente para a faixa [0, 255] e converter para o tipo *float*** 
  *   Você pode utilizar a função [cv.filter2D](https://docs.opencv.org/3.4/d4/d86/group__imgproc__filter.html#ga27c049795ce870216ddfb366086b5a04) para fazer a convolução com o *kernel* do filtro;
  *   Você pode utilizar a função [cv.medianBlur](https://docs.opencv.org/3.4/d4/d86/group__imgproc__filter.html#ga564869aa33e58769b4469101aac458f9) para o filtro da mediana;
  *   Mostre as imagens na faixa de ```0-255 ```.  

*Exemplos:*
``` python

img_ruidosa_gauss = myImg + np.random.normal(loc=0, scale=Desvio_Padrão, size=Tamanho)
img_filtrada = cv.filter2D(myImg, -1, myKernel)
img_ruidosa_salt_pep = random_noise(myImg, mode='s&p')
img_ruidosa_salt_pep = (255*img_ruidosa_salt_pep).astype('float')
img_filtrada_mediana = cv.medianBlur(np.uint8(myImg), ksize)
```



In [None]:
## -- Seu código começa AQUI -- ##


## -- Seu código termina AQUI -- ##

## -- COMENTÁRIOS -- ##

### 2) Filtro passa-alta 

#### 2.1) Filtro de aguçamento (Nota: 2.0/10.0)

**Exercício:**

1. Aplique o *kernel* de um filtro espacial passa-alta na imagem ```parede.tif``` a fim de adquirir as altas frequências da imagem. Apresente a imagem resultante e, para melhor visualização, seu negativo. Você pode criar o filtro como orientado no exercício anterior, mas agora para passa-alta.

2. Modifique esse *kernel* a fim de torná-lo um filtro de aguçamento e aplique-o na imagem. Apresente a imagem resultante e comente os resultados.



In [None]:
## -- Seu código começa AQUI -- ##


## -- Seu código termina AQUI -- ##

## -- COMENTÁRIOS -- ##

#### 2.2) Filtro Laplaciano - detectação de pontos isolados (Nota: 1.5/10.0)


A imagem da figura ```pontos.tif``` apresenta 3 pontos isolados quase imperceptíveis que podem ser detectados com um filtro passa-alta espacial.

**Exercício:**

1. Aplique filtro de *kernel* laplaciano na imagem para detectar esses pontos.

2. Faça a binarização dessa imagem para melhor visualização dos pontos. Se necessário, utilize o histograma da imagem após a filtragem para detectar um bom valor de *threshold*. 

*Dicas:* 

*  Você pode utilizar a função [cv.filter2D](https://docs.opencv.org/3.4/d4/d86/group__imgproc__filter.html#ga27c049795ce870216ddfb366086b5a04) para fazer a convolução com o *kernel*;
* Você pode ajustar o range do histograma para encontrar uma melhor visualização.

*  Você pode utilizar a função [np.where](https://numpy.org/doc/stable/reference/generated/numpy.where.html) para fazer a binarização. 
 

*Ex:*
``` python
cv.filter2D(myImg, -1, myKernel)
plt.hist(img.flatten(),bins=255, density=False, range = (valor_min,valor_max))
np.where(myImg < threshold, Valor_para_TRUE, Valor_para_FALSE)
```

In [None]:
## -- Seu código começa AQUI -- ##


## -- Seu código termina AQUI -- ##

## -- COMENTÁRIOS -- ##

### 3) Processamento do pixel da borda (Nota: 1.5/10.0)
**Exercício:**

1. Filtre a imagem *img* dada abaixo, utilizando um filtro da média 5x5. Utilize as seguintes soluções para a borda:
 
  *   *Padding* com zeros;
  *   *Padding* simétrico;
  *   *Padding* replicado;

2. Mostre as imagens resultantes e comente as diferenças encontradas. Não se esqueça de definir vmin e max para melhor visualizar as diferenças.

*Dicas:* 
  *   Você pode utilizar a função [cv.blur](https://docs.opencv.org/master/d4/d86/group__imgproc__filter.html#ga8c45db9afe636703801b0b2e440fce37) para o filtro da média;
  *   Neste [link](https://docs.opencv.org/master/d2/de8/group__core__array.html#ga209f2f4869e304c82d07739337eae7c5) você pode encontrar os tipos de *padding* utilizados no OpenCV. O tipo ```BORDER_CONSTANT``` tem como padrão o valor 0.

*Ex:*
``` python
cv.blur(myImg, (ksize,ksize), borderType=TipoDePadding)
```



In [None]:
#Imagem fornecida
img = np.array(((255, 255,   255,     0, 255,   0, 0, 255, 0), 
                (255,   0,     0,     0, 255,   0, 0, 255, 0),
                (255,   0,   255,     0, 255,   0, 0, 255, 0),
                (255,   0,     0,     0, 255,   0, 0, 255, 0),
                (255, 255,   255,   255, 255,   0, 0, 255, 0),
                (255,   0,     0,     0, 255,   0, 0, 255, 0),
                (255,   0,     0,     0, 255,   0, 0, 255, 0),
                (255, 255,   255,   255, 255,   0, 0, 255, 0),
                (255, 255,   255,   255, 255,   0, 0, 255, 0))).astype('float')

### -- Seu código começa AQUI -- ##


## -- Seu código termina AQUI -- ##

## -- COMENTÁRIOS -- ##

### 4) Opcional - Aplicação

Você foi contratado por uma empresa de televisão para preservar a identidade de pessoas em matérias onde apareçam crianças, pessoas que foram acometidas por crimes etc. 

Para isso, vamos utilizar um vídeo do ex-presidente Obama para fazer alguns testes. Sua missão é esconder o rosto do presidente em todo o seu discurso. 

<center><img src="https://github.com/LAVI-USP/SEL0339-SEL5886_2022/blob/main/imagens/pratica_04/obama.gif?raw=true" style="width:400px;height:225px;"></center>

<center><caption><b> Figura 2:</b> Discurso do Obama.</b></caption></center>

Nós fornecemos para você uma máscara ``` faceMask.mat``` onde é identificada a face da pessoa a cada frame. Essa identificação foi feita com o valor ``` 255``` , ou seja, onde este valor estiver na imagem, ali estará a face. A máscara tem a mesma dimensão do frame do vídeo.

Essa máscara foi gerada por meio de uma Rede Neural Convolucional (CNN). Caso queira obter mais informações sobre a mesma, visite esse [blog](https://www.pyimagesearch.com/2018/02/26/face-detection-with-opencv-and-deep-learning/).

**FILTRO GAUSSIANO:**

1. Altere os parametros *filter_sigma* e *filter_size* do código abaixo de forma a borrar a região de interesse.

*Dicas:* 
  *   Foi utilizada a função [cv.GaussianBlur](https://docs.opencv.org/master/d4/d86/group__imgproc__filter.html#gaabe8c836e97159a9193fb0b11ac52cf1);
  *   Nós já extraímos a parte da face de cada frame na matriz ```frame_roi``` para a aplicação do filtro.


In [None]:
# Execute essa cécula caso queira ver o vídeo.
mp4 = open("obama.mp4",'rb').read()
data_url = "data:video/mp4;base64," + b64encode(mp4).decode()
HTML("""<video width="400" height="225" controls><source src="%s" type="video/mp4"></video>""" % data_url)

In [None]:
# Carrega a matriz com a mascara da face em cada frame
mask = loadmat("faceMask.mat")['faceMask']

# Cria o objeto VideoCapture
vs = cv.VideoCapture("obama.mp4")

video = []

# Loop em todos os frames
while True:
  
  # Leitura do frame
  ret, frame = vs.read() 

  # Caso nao tenha mais nenhum frame
  if frame is None:
    break
  
  # Resize do frame para o tamanho da mascara
  frame = cv.resize(frame, (mask.shape[1],mask.shape[0]))

  # Coloca o frame lido na lista criada
  video.append(frame) 
  
vs.release()

# Cria uma np array com todos os frames (M=225, N=400, C=3, F=780)
video = np.stack(video, axis=3)

# Defina o codec e cria o objeto VideoWriter. A saída é armazenada no arquivo 'obama_out.mp4'.
out = cv.VideoWriter("obama_out.mp4",cv.VideoWriter_fourcc(*"MP4V"), 20.0, (video.shape[1],video.shape[0]))

# Loop em todos os frames
for i in range(mask.shape[2]):

  # Lê a mascara do respectivo frame
  mask_frame = mask[:,:,i]

  # Lê o frame
  frame = video[:,:,:,i] 

  # Calculo das coordenadas onde a face esta localizada
  rowInd = np.nonzero(np.abs(np.diff(np.sum(mask_frame, axis=1).T)))[0]
  colInd = np.nonzero(np.abs(np.diff(np.sum(mask_frame, axis=0).T)))[0]

  # Retira somente a face do frame
  frame_roi = frame[rowInd[0]:rowInd[1],colInd[0]:colInd[1],:]

  # ALTERE OS PARAMETROS ABAIXO E VEJA O RESULTADO

  filter_sigma = 1
  filter_size = 3

  frame_roi = cv.GaussianBlur(frame_roi,(filter_size,filter_size), filter_sigma, filter_sigma, borderType=cv.BORDER_REFLECT)
  # ----------
  
  # Retorna a face filtrada para o frame
  frame[rowInd[0]:rowInd[1],colInd[0]:colInd[1],:] = np.uint8(frame_roi)

  # Escreve o frame no arquivo 
  out.write(frame)

out.release()

# Removendo o arquivo de saída, caso já haja algum criado anteriormente
os.system(f"rm obama_out_compressed.mp4")

# Compressao do video gerado(Ref: https://stackoverflow.com/a/56589840/8682939)
os.system(f"ffmpeg -i obama_out.mp4 -vcodec libx264 obama_out_compressed.mp4")



plt.imshow(cv.cvtColor(frame, cv.COLOR_BGR2RGB));
plt.axis('off');

In [None]:
# Execute essa cécula caso queira ver o resultado.
mp4 = open('obama_out_compressed.mp4','rb').read()
data_url = "data:video/mp4;base64," + b64encode(mp4).decode()
HTML("""<video controls><source src="%s" type="video/mp4"></video>""" % data_url)