### Introdução ao Processamento Digital de Imagens (PDI)

*  O que é PDI e quais são seus objetivos?
  * Facilitar a interpretação das imagens por pessoas;
  * Permitir o armazenamento e transmissão de imagens, possibilitando a sua exibição e extração de informações;
  * Alterar propriedades de uma imagem (edição de imagens).

Um computador enxerga uma imagem como matriz, em que cada número corresponde ao pixel da imagem

![Title](../imgs/image_matrix.png)

**Matriz de imagem**

A matriz que agrega os elementos (pixels) de uma dada imagem.

Sendo uma matriz $M \times N$ ($M$ colunas e $N$ linhas), o tamanho de uma imagem é dado por $M \times N  \times k$ bits, se cada pixel for armazenado com $k$ bits.

O **campo de visão** (*field of view (FOV)*, em inglês) é o tamanho exibido da imagem. Entretanto, se o mesmo campo de visão for mantido e o tamanho da matriz for aumentado, o tamanho dos pixels serão menores e portanto a resolução será melhorada, em outras palavras teremos uma maior densidade de pixels por $cm^2$, caracterizando um aumento de **resolução**. 

<img src=https://upload.wikimedia.org/wikipedia/commons/f/f2/Resolution_illustration.png width=900>

### Uma imagem no Python

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import cv2

In [None]:
img = np.array([[255, 255,   0,   0, 255, 255,   0,   0, 255, 255],
                  [255, 255,   0,   0, 255, 255,   0,   0, 255, 255],
                  [  0,   0,   0,   0,   0,   0,   0,   0,   0,   0],
                  [  0,   0,   0,   0,   0,   0,   0,   0,   0,   0],
                  [  0,   0,   0,   0,   0,   0,   0,   0,   0,   0],
                  [  0,   0,   0,   0,   0,   0,   0,   0,   0,   0],
                  [255, 255,   0,   0,   0,   0,   0,   0, 255, 255],
                  [255, 255, 255,   0,   0,   0,   0, 255, 255, 255],
                  [255, 255, 255, 255,   0,   0, 255, 255, 255, 255],
                  [255, 255, 255, 255,   0,   0, 255, 255, 255, 255]])

In [None]:
img ### resolução da imagem

In [None]:
img.shape ### dimensão da imagen

 #### Visualização da imagem

In [None]:
plt.imshow(img)

In [None]:
plt.imshow(img, cmap="gray");

In [None]:
plt.imshow(img, cmap="gray")

plt.xticks([])
plt.yticks([])

plt.show()

#### Manipular os pixels
* Uma imagem é uma matriz do python
* Podemos manipular igual qualquer matriz

In [None]:
img

In [None]:
print(img[0, 0])
print(img[8, 4])

In [None]:
img[0, 0] = 0
img[8, 4] = 255

In [None]:
img

In [None]:
plt.imshow(img, cmap="gray");

#### Leitura de imagens reais com OpenCV

* Biblioteca padrão para pré-processamento de imagens https://docs.opencv.org/4.x/d6/d00/tutorial_py_root.html

In [None]:
import cv2

In [None]:
lenna_img = cv2.imread("imgs/lenna.png")

In [None]:
lenna_img

In [None]:
lenna_img.shape

In [None]:
plt.imshow(lenna_img);

In [None]:
lenna_img_rgb = cv2.cvtColor(lenna_img, cv2.COLOR_BGR2RGB)

plt.imshow(lenna_img_rgb);

Uma imagem pode ser representada por uma única matriz ou uma combinação de várias matrizes (como uma aquarela), sendo esta combinação uma representação de cor

![Title](imgs/rgb.png)

Esta representação é feita por espaço de cores, em que cada espaço possui uma formulação matemática para tal combinação

### Espaço de cor RGB

* 3 canais de cores (vermelho, azul e verde)
* Pixels variam de 0 (preto) a 255 (branco)
* Cada canal de cor representa uma matriz, sendo assim, por exemplo, se tivermos na matriz a cor branca, ela será representada como (255,255,255). Isto é, o valor 255 presente em todos os canais.

### Espaço CMYK
* 4 canais de cor (ciano, magenta, amarelo, preto)

![Title](imgs/cmyk.png)

### Espaço CIE-LAB

* 3 canais de cor: l(luminância), a e b (cores)
![Title](imgs/cie_lab.png)

#### Voltando para a Lenna

* Cada espaço de cores é representado por uma codificação no opencv
* A alteração de um espaço de cor para outro pode ser feita através do cvtColor
* Cada espaço de cor tem sua tag

cv2.cvtColor(lenna_img, cv2.COLOR_BGR2RGB) ### bgr para rgb
cv2.cvtColor(lenna_img, cv2.COLOR_BGR2GRAY) ### bgr para tons de cinza


In [None]:
lenna_img_gray = cv2.cvtColor(lenna_img, cv2.COLOR_BGR2GRAY)

plt.imshow(lenna_img_gray, cmap="gray");

In [None]:
cv2.imwrite("imgs/lenna_gray.png", lenna_img_gray)

#### Vamos praticar um pouco
* Escolha uma imagem da internet
* Salve  a imagem no seu computador
* Leia a imagem
* Visualize a imagem
* Quantos canais existem na imagem?
* Qual a dimensão da imagem?
* Passe a imagem para tons de cinza
* Salve a imagem em tons de cinza no seu computador e exiba essa imagem
* Bônus: crie um dataset de 5 imagens e repita os passos anteriores

In [None]:
img = cv2.imread('dataset/stray.jpeg') ### ler a imagem
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img);

In [None]:
img.shape

In [None]:
img_gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
plt.imshow(img_gray, cmap='gray')

In [None]:
cv2.imwrite('imgs/imgs_gray.png', img_gray)

In [None]:
img_gray = cv2.imread('imgs/imgs_gray.png') ### ler a imagem
plt.imshow(img_gray);

In [None]:
### bonus

img = cv2.imread('dataset/stray.jpeg') ### ler a imagem
img2 = cv2.imread('dataset/cat.jpeg') ### ler a imagem
img3 = cv2.imread('dataset/cat2.jpeg') ### ler a imagem
img4 = cv2.imread('dataset/cat3.jpeg') ### ler a imagem
img5 = cv2.imread('dataset/cat4.jpeg') ### ler a imagem

dataset = [img, img2, img3,img4,img5]
for i, image in enumerate(dataset):
    img = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    plt.imshow(img);
    plt.show()
    print(img.shape)
    img_gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
    cv2.imwrite('dataset/gray/imgs_gray_' + str(i) + '.png', img_gray)

In [None]:
### bonus com leitura de diretório

import glob
for i, file in enumerate(glob.glob('dataset/*.jpeg')):
    img = cv2.imread(file) ### ler a imagem
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    plt.imshow(img);
    plt.show()
    print(img.shape)
    img_gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
    cv2.imwrite('dataset/gray/imgs_gray_' + str(i) + '.png', img_gray)