<a href="https://colab.research.google.com/github/DaviHorner/Data_Science/blob/main/REO_TF_Trabalho_Final_Andr%C3%A9_Sa%C3%BAde.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# PDI - Processamento Digital de Imagens
Guia de Estudos

Roteiro de Estudos Orientados - Trabalho Final

Trabalho Final - Criando animações com técnicas de filtragem, morfologia matemática e segmentação de imagens coloridas.

Parte do Guia de Estudos disponível em: [https://bit.ly/3ouwEMg](https://bit.ly/3ouwEMg)

**AUTOR**: André Vital Saúde

## Objetivo
Aplicações de diversos conhecimentos de processamento digital de imagens para a criação de vídeos sintéticos.

O objetivo específico é criar um vídeo de animação que transforma gradativamente uma imagem em outra.

## Partes do Trabalho

Este trabalho está dividido em quatro partes:

1. Crop e criação de imagens de referência

2. Aplicação de erosões sequenciais

3. Criação de vídeo

4. Extensão para imagens coloridas



# Parte 1: Crop e criação de imagens de referência

Nesta primeira parte faremos:

1. Carregamento e exibição das imagens de entrada

2. Crop das imagens de entrada. Da seguinte forma:
  - Detecção das menores dimensões (ymin,xmin)
  - Para cada imagem de entrada, extrair uma janela de tamanho (ymin,xmin) centralizada no centro da imagem original
  - Substituir a imagem de entrada pela janela (ymin,xmin)
  - Todas as imagens agora são do mesmo tamanho.

3. Criação de filtro gaussiano. Criar e exibir a DFT de um filtro suavizante gaussiano do tamanho (ymin,xmin). Sugestão de tamanho do filtro gaussiano: 8x8.

4. Exibir DFTs. Para cada imagem, exibir a imagem ao lado de suas respectivas DFTs. Na sequência, para cada imagem, exibir a imagem filtrada pelo filtro gaussiano, ao lado de suas respectivas DFTs.

5. Criar imagens de referência. Para cada par de imagens da lista de imagens, calcular o mínimo entre suas imagens filtradas. Esse mínimo será a imagem de referência.

## 1.1. Carregamento e exibição das imagens de entrada
Primeiramente, vamos carregar algumas imagens para servir de exemplo, carregando-as em um dicionário Python.

Utilizamos agora o módulo *requests*, ao invés de *urllib*, que estava dando erro de [access denied](https://stackoverflow.com/questions/24962039/python-urllib-getting-access-denied-when-browser-works).

Primeiro o download.

In [None]:
imageURLs = {
    "baby":'https://bit.ly/35kNWF2',
    "cat":'https://bit.ly/3vUTQaT',
    "grimace":'https://bit.ly/362Oj7p'
}

filetype = ".png"

def downloadImages(imageURLdict):
  import requests

  imageNames = list(imageURLdict.keys())
  for imName in imageNames:
    r = requests.get(url = imageURLdict[imName])
    with open(imName + filetype, 'wb') as outfile:
      outfile.write(r.content)

  return imageNames

imageNames = downloadImages(imageURLs)

Depois carregamos as imagens.

In [None]:
import numpy as np
from PIL import Image

def loadImages(imageNames):
  images = dict()
  for imName in imageNames:
    images[imName] = np.asarray(Image.open(imName + filetype))
  return images  

images = loadImages(imageNames)
for imgName in images.keys():
  print("\n" + imgName)
  print(images[imgName].shape)

E visualizamos as imagens com [matplotlib](https://matplotlib.org/stable/api/index.html).

Para melhor entendimento do código a seguir, leia a documentação de [subplots](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.subplots.html#).

In [None]:
def showImages(imList, ncols=3, titles="abcdefghijklmnopqrstuvwxyz"):
  import matplotlib.pyplot as plt
  import math

  imWidth = 6.4
  imHeigth = 4.8
  lenTitles = len(titles)
  
  nrows = math.ceil(len(imList) / ncols)
  fig, axs = plt.subplots(nrows, ncols, figsize=(ncols*imWidth, nrows*imHeigth))
  if (nrows == ncols == 1):
    ax = axs
    ax.set_axis_off()
    ax.imshow(imList[0], cmap='gray')
    ax.set_title("(" + titles[0] + ")")
  else:
    axs = axs.reshape(nrows,ncols)
    imIndex = 0
    for row in range(nrows):
      for col in range(ncols):
        ax = axs[row,col]
        ax.set_axis_off()
        if imIndex < len(imList):
          ax.imshow(imList[imIndex], cmap='gray')
          repeat = 1+ (imIndex // lenTitles) # in case there are more images than the number of titles, replicate titles from the beginning
          ax.set_title("(" + (titles[imIndex % len(titles)] * repeat) + ")")
        imIndex+=1

  fig.show()

def showImagesDict(dic, ncols=3):
  showImages(list(dic.values()),ncols,list(dic.keys()))

showImagesDict(images,2)  # todas as imagens em 2 colunas

## 1.2. Crop das imagens de entrada

Da seguinte forma:
  - Detecção das menores dimensões (ymin,xmin)
  - Para cada imagem de entrada, extrair uma janela de tamanho (ymin,xmin) centralizada no centro da imagem original
  - Substituir a imagem de entrada pela janela (ymin,xmin)
  - Todas as imagens agora são do mesmo tamanho.

Detectamos as menores dimensões y e x.

In [None]:
def minshape(imagesDict):
  minys = minxs = 1000000
  # TODO
  return (minys,minxs)

refshape = minshape(images)
print(refshape)

Crop de todas as imagens selecionando a janela do tamanho da janela de referência, com centro no centro da imagem sendo cortada.

In [None]:
def crop(img, newshape):
  # TODO
  return img

def cropImages(images,newshape):
  for imName in images.keys():
    images[imName] = crop(images[imName],refshape)

cropImages(images,refshape)
for imgName in images.keys():
  print("\n" + imgName)
  print(images[imgName].shape)

E visualizamos as imagens cortadas com [matplotlib](https://matplotlib.org/stable/api/index.html).

Para melhor entendimento do código a seguir, leia a documentação de [subplots](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.subplots.html#).

In [None]:
showImagesDict(images,2)  # 2 colunas

## 1.3. Criação de filtro gaussiano.
Criar e exibir a DFT de um filtro suavizante gaussiano do tamanho (ymin,xmin). Sugestão de tamanho do filtro gaussiano: 8x8.

Vamos criar esse filtro no domínio da frequência e visualizá-lo.

Utilizaremos a implementação da Fast Fourier Transform (FFT) do NumPy (módulo numpy.fft).

Vamos reaproveitar do REO P06 as funções úteis para visualizar a DFT:

1. *normaliza(f)*, que normaliza os valores de *f* no intervalo de inteiros de 8 bits

2. *dftmag(F)*, que extrai o logaritmo da magnitude dos números complexos de *F* e normaliza o resultado (espectro de Fourier)

3. *dftshift(mag)*, que desloca o centro do espectro para a coordenada central da imagem

4. *dftview(F)*, que usa *dftshift* e *dftmag* para criar uma visualização da DFT

In [None]:
def normaliza(f):
    ma = f.max(); mi = f.min()
    if ma == mi:
        return 127*np.ones(f.shape, dtype=np.uint8)
    else:
        g = (255 / (ma-mi)) * (f-mi)
        return g.astype(np.uint8)

def dftmag(F):
    # magnitude com log
    mag = np.log(np.abs(F)+1)
    return normaliza(mag).astype(np.uint8)

def dftshift(mag): # mag é a magnitude da DFT
    # deslocamento do centro da DFT
    sh = np.zeros(mag.shape, dtype=np.uint8) # shift
    (ys,xs) = mag.shape
    yc = int(ys/2); xc = int(xs/2)
    sh[0:yc,xc:xs] = mag[ys-yc:ys,0:xs-xc] # q1 = q3
    sh[0:yc,0:xc] = mag[ys-yc:ys,xs-xc:xs] # q2 = q4
    sh[yc:ys,0:xc] = mag[0:ys-yc,xs-xc:xs] # q3 = q1
    sh[yc:ys,xc:xs] = mag[0:ys-yc,0:xs-xc] # q4 = q2
    return sh

def dftview(F):
    # espectro de Fourier
    return dftshift(dftmag(F))

def gaussianKernel2d(s):
    n = s*s; mu = s/2; cov = [[s, 0], [0, s]]; d = 2
    x = np.indices((s,s)).reshape((d, n))
    xc = x - mu
    k = 1. * xc * np.dot(np.linalg.inv(cov), xc)
    k = np.sum(k,axis=0) #the sum is only applied to the rows
    g = (1./((2 * np.pi)**(d/2.) * np.sqrt(np.linalg.det(cov)))) * np.exp(-1./2 * k)
    return g.reshape((s,s))

def resizeKernel(h,newshape):
  k = np.zeros(newshape)
  (hys,hxs) = h.shape
  k[0:hys,0:hxs]=h
  return k

# TODO utilizar as funções acima pra criar o espectro de Fourier do filtro gaussiano 8x8
espectroGaussKernF = images["grimace"] # TODO substituir esta linha

showImages([espectroGaussKernF],1)

## 1.4. Exibir DFTs.
Para cada imagem, exibir a imagem ao lado de suas respectivas DFTs. Na sequência, para cada imagem, exibir a imagem filtrada pelo filtro gaussiano, ao lado de suas respectivas DFTs.

Primeiro vamos visualizar as imagens e respectivas DFTs.

In [None]:
def computeDFTs(imDict):
  dftDict = dict()
  # TODO reutilizar código anterior. Computar todas as DFTs e coloca-las em um dicionário.
  return dftDict

dfts = computeDFTs(images)

In [None]:
def viewDFTs(imDict,dftDict, showOrig=True):
  # TODO reutilizar código anterior. Computar o espectro de Fourier de cada DFT do dicionário.
  titles = ["baby"]       # TODO substituir esta linha
  imgs = [imDict["baby"]] # TODO substituir esta linha
  return imgs,titles

imgs,titles = viewDFTs(images,dfts)
showImages(imgs,2,titles)

Agora vamos suavizar todas as imagens e visualiza-las ao lado de suas respectivas DFTs.




In [None]:

# TODO computar suavizadas e respectivas DFTs
blurred = images    # TODO substituir esta linha
blurredDFTs = dfts  # TODO substituir esta linha

imgs,titles = viewDFTs(blurred,blurredDFTs)
showImages(imgs,2,titles)

## 1.5. Criar imagens de referência.

Para cada par de imagens da lista de imagens, calcular o mínimo entre suas imagens filtradas. Esse mínimo será a imagem de referência.

In [None]:
def minImagesPairs(imgs):
  # TODO calcular o mínimo entre cada par de imagens e colocar numa lista
  return imgs # TODO substituir esta linha

refimages = minImagesPairs(list(blurred.values()))
showImages(refimages,3)

# Parte 2: Erosões

Aguarde...

# Parte 3: Criar vídeo

Aguarde...

# Parte 4: Extensão para imagens coloridas

Aguarde...

## Estude mais...

Que outro tipo de operação, além da erosão, você utilizaria para gerar efeitos similares?

# Referências
<a name="gonzalez-2010"></a>**\[Gonzalez e Woods, 2010\]** GONZALEZ, R. C.; WOODS, R. E. *Processamento digital de imagens*. 3. ed. São Paulo: Pearson, 2010.

<a name="lotufo"></a> **\[LOTUFO, 2018\]** LOTUFO, R. A. Roberto Lotufo on GitHub. Disponível em https://github.com/robertoalotufo. Acessado em 18/03/2022.

<a name="saude-2019"></a>**\[Saúde, 2019\]** SAÚDE, A. V. *Computação gráfica e processamento de imagens*. 1. ed. Londrina: Editora e Distribuidora Educacional SA, 2019. v. 1. 200p.