## Tutorial Opencv

> Este tutorial apresenta conceitos introdutórios de processamento de imagens (filtros) e de visão computacional (segmentação, classificação, reconhecimento de padrão e rastreamento). Estes conceitos serão introduzidos utilizando a biblioteca **OpenCV**, que é distribuída gratuitamente e possui documentação farta na internet, com exemplos e aplicações práticas. Para utilizar essa biblioteca em python acesse o terminal com ambiente de python ativado e digite ```pip install opencv-python```.

In [1]:
# Importação das bibliotecas
import cv2
import numpy as np

In [2]:
# Leitura da imagem com a função imread()
imagem = cv2.imread('entrada.jpg')

#Propriedades da imagem
print('Propriedades da imagem: ', end='')
print(imagem.shape)

#Altura da imagem 
print('Altura em pixels: ', end='')
print(imagem.shape[0])

#Largura da imagem
print('Largura em pixels: ', end='')
print(imagem.shape[1])

#Qtde de canais
print('Qtde de canais: ', end='')
print(imagem.shape[2])

# Mostra a imagem com a função imshow
cv2.imshow("Nome da janela", imagem)
cv2.waitKey(0) #espera pressionar qualquer tecla

# Salvar a imagem no disco com função imwrite()
cv2.imwrite("saida.jpg", imagem)

Propriedades da imagem: (254, 248, 3)
Altura em pixels: 254
Largura em pixels: 248
Qtde de canais: 3


True

> A importação da biblioteca padrão da OpenCV é obrigatória para utilizar suas funções. A primeira função usada é para abrir a imagem através de ```cv2.imread()``` que leva como argumento o nome do arquivo em disco. 

> A imagem é lida e armazenada em ‘imagem’ que é uma variavel que dará acesso ao objeto da imagem que nada mais é que uma matriz de 3 dimensões (3 canais) contendo em cada dimensão uma das 3 cores do padrão RGB (red=vermelho, green-verde, blue=azul). 

> No caso de uma imagem preto e branca temos apenas um canal, ou seja, apenas uma matriz de 2 dimensões. Para facilitar o entendimento podemos pensar em uma planilha eletrônica, com linhas e colunas, portanto, uma matriz de 2 dimensões. Cada célula dessa matriz é um pixel, que no caso de imagens preto e brancas possuem um valor de 0 a 255, sendo 0 para preto e 255 para branco. Portanto, cada célula contém um inteiro de 8 bits (sem sinal) que em Python é definido por “uint8” que é um unsigned integer de 8 bits. 

> No  caso  de  imagens  preto  e  branca  é  composta  de  apenas  uma  matriz  de  duas  dimensões  como  na  imagem  acima.  
> Já  para  imagens  coloridas  temos  três  dessas  matrizes  de duas dimensões cada uma representando uma das cores do sistema RGB. Portanto, cada pixel é formado de uma tupla de 3 inteiros de 8 bits sem sinal no sistema (R,G,B) sendo que (0,0,0) representa o preto, (255,255,255) o branco. Nesse sentido, as cores mais comuns são:  

> Branco - RGB (255,255,255); 
Azul - RGB (0,0,255); 
Vermelho - RGB (255,0,0); 
Verde - RGB (0,255,0); 
Amarelo - RGB (255,255,0); 
Magenta - RGB (255,0,255); 
Ciano - RGB (0,255,255); 
Preto - RGB (0,0,0). 

> As imagens coloridas, portanto, são compostas normalmente de 3 matrizes de inteiros  sem  sinal  de  8  bits,  a  junção  das  3  matrizes  produz  a  imagem  colorida  com  capacidade  de reprodução de 16,7 milhões de cores, sendo que os 8 bits tem capacidade para 256 valores e  elevando a 3 temos 256³ = 16,7 milhões. 

> Podemos  alterar  a  cor  individualmente  para  cada  pixel, ou seja, podemos manipular individualmente cada pixel da imagem.  Para isso é importante entender o sistema de coordenadas (linha, coluna) onde o pixel mais a esquerda e acima da imagem esta na posição (0,0) esta na linha zero e coluna zero. Já em uma imagem com 300 pixels de largura, ou seja, 300 colunas e tendo 200 pixels de altura,  ou  seja,  200  linhas,  terá  o  pixel  (199,299)  como  sendo  o  pixel  mais  a  direita  e  abaixo  da imagem.  

> A partir do entendimento do sistema de coordenadas é possível alterar individualmente cada pixel ou ler a informação individual do pixel conforme abaixo: 

> Imagens são matrizes Numpy neste caso retornadas pelo método ```“imread”``` e armazenada em memória através da variável “imagem” conforme acima. Lembre-se que o pixel superior mais a esquerda é o (0,0). 

> No código é retornado na tupla (b, g, r) os respectivos valores das cores do pixel superior mais a esquerda. Veja que o método retorna a sequência BGR e não RGB como poderiamos esperar. Tendo os valores inteiros de cada cor é possível exibi-los na tela com o código abaixo:

In [3]:
imagem = cv2.imread('ponte.png') 
(b, g, r) = imagem[0, 0] # Veja que a ordem BGR e não RGB  = tupla

print('O pixel (0, 0) tem as seguintes cores:') 
print('Vermelho:', r, 'Verde:', g, 'Azul:', b)  

O pixel (0, 0) tem as seguintes cores:
Vermelho: 255 Verde: 255 Azul: 255


> Outra possibilidade é utilizar dois laços de repetição para “varrer” todos os pixels da  imagem, linha por linha como é o caso do código abaixo. Importante notar que esta estratégia pode  não  ser  muito  performática  já  que  é  um  processo  lento  varrer  toda  a  imagem  pixel  a pixel. 

In [4]:
imagem = cv2.imread('ponte.png') 
for y in range(0, imagem.shape[0]):
    for x in range(0, imagem.shape[1]):
        imagem[y, x] = (255,0,0)
        
cv2.imshow("Imagem modificada", imagem) 
cv2.waitKey(0) #espera pressionar qualquer tecla

-1

> O objetivo agora é saltar a cada 10 pixels ao percorrer as linhas e mais 10 pixels ao percorrer as colunas. A cada salto é criado um quadrado amarelo de 5x5 pixels. Desta vez parte da imagem original é preservada e  podemos ainda observar a ponte por baixo da grade de quadrados amarelos. 

In [10]:
imagem = cv2.imread('ponte.png')
for y in range(0, imagem.shape[0], 10): #percorre linhas saltando 10 linhas
    for x in range(0, imagem.shape[1], 10): #percorre colunas saltando 10 colunas
        imagem[y: y+5, x: x+5] = (0,255,255)
cv2.imshow("Imagem modificada", imagem) 
cv2.waitKey(0)

-1

### Cortando uma imagem / Crop

> Veja  o  código  abaixo onde criamos uma nova imagem a partir de um pedaço da imagem original (ROI) e a salvamos no
disco.

In [7]:
imagem = cv2.imread('ponte.png')
recorte = imagem[100:200, 100:200]  #imagem[linhas, colunas] ou imagem[altura, largura] ou imagem[y, x]

cv2.imshow("Recorte da imagem", recorte)
cv2.waitKey(0)

cv2.imwrite("recorte.png", recorte) #salva no disco 

True

### Redimensionamento / Resize

> Para  reduzir  ou  aumentar  o  tamanho  da  imagem,  existe  uma  função  já  pronta  da OpenCV, trata-se da função ```resize``` mostrada abaixo. 

> Importante notar que é preciso calcular a proporção da altura em relação a largura da nova imagem, caso contrário ela poderá ficar distorcida.

In [4]:
img = cv2.imread('ponte.png')
#cv2.imshow("Original", img)

largura = img.shape[1]
altura = img.shape[0]
proporcao = float(altura/largura)

largura_nova = 320 #em pixels
altura_nova = int(largura_nova*proporcao)
tamanho_novo = (largura_nova, altura_nova)

img_redimensionada = cv2.resize(img, tamanho_novo, interpolation = cv2.INTER_AREA)
cv2.imshow('Resultado', img_redimensionada)
cv2.waitKey(0) 

-1

> Veja  que  a  função  ```resize```  utiliza  uma  propriedade  aqui  definida  com ```cv2.INTER_AREA``` que  é  uma  especificação  do  cálculo  matemático  para  redimensionar  a imagem. Apesar disso, caso a imagem seja redimensionada para um tamanho maior é preciso ponderar que ocorrerá perda de qualidade.  

### Espelhando uma imagem / Flip  

> Para espelhar uma imagem, basta inverter suas linhas, suas colunas ou ambas.  
* Invertendo as linhas: flip horizontal 
* Invertendo as colunas: flip vertical.
    
> Podemos fazer o espelhamento/flip tanto com uma função oferecida pela OpenCV (função flip) como através da manipulação direta das matrizes que compõe a imagem. 

In [13]:
img = cv2.imread('ponte.png')
cv2.imshow("Original", img) 

#flip_horizontal = img[::-1,:] #comando equivalente abaixo 
flip_horizontal = cv2.flip(img, 0)  
cv2.imshow("Flip Horizontal", flip_horizontal) 

#flip_vertical = img[:,::-1] #comando equivalente abaixo 
flip_vertical = cv2.flip(img, 1)  
cv2.imshow("Flip Vertical", flip_vertical) 

#flip_hv = img[::-1,::-1] #comando equivalente abaixo  
flip_hv = cv2.flip(img, -1)
cv2.imshow("Flip Horizontal e Vertical", flip_hv)

cv2.waitKey(0) 

-1

### Rotacionando uma imagem / Rotate

> A  transformação  ```affine```  ou  ```mapa  affine```,  é  uma  função  entre  espaços  affine  que preservam  os  pontos,  grossura  de linhas  e  planos.  Além  disso,  linhas  paralelas  permanecem paralelas após uma transformação affine. Essa transformação não necessariamente preserva a distância entre pontos mas ela preserva a proporção das distâncias entre os pontos de uma linha reta. Uma rotação é um tipo de transformação affine. 

In [20]:
img = cv2.imread('ponte.png')

(alt, lar) = img.shape[:2] #captura altura e largura 
centro = (lar // 2, alt // 2) #acha o centro  

M = cv2.getRotationMatrix2D(centro, 30, 1.0)#30 graus 
img_rotacionada = cv2.warpAffine(img, M, (lar, alt))  

cv2.imshow("Imagem rotacionada em 30 graus", img_rotacionada) 
cv2.waitKey(0)
  

-1

### Sistemas de cores 

> Já  conhecemos  o  tradicional  espaço  de  cores  **RGB  (Red,  Green,  Blue)**  que  sabemos que  em  OpenCV  é  na  verdade  BGR  dada  a  necessidade  de  colocar  o  azul  como  primeiro elemento e o vermelho como terceiro elemento de uma tupla que compõe as cores de pixel.  

> Contudo, existem outros espaços de cores como o próprio “Preto e Branco” ou “tons de cinza”, além de outros coloridos como o **L*a*b*** e o **HSV**. Abaixo temos um exemplo de como ficaria nossa imagem da ponte nos outros espaços de cores :

In [21]:
img = cv2.imread('ponte.png')

cv2.imshow("Original", img)

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow("Gray", gray)

hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
cv2.imshow("HSV", hsv)

lab = cv2.cvtColor(img, cv2.COLOR_BGR2LAB)
cv2.imshow("L*a*b*", lab)

cv2.waitKey(0) 

113

> Como  já  sabemos  uma  imagem  colorida  no  formato  RGB  possui  3  canais,  um  para cada  cor.  

>Existem  funções  do  OpenCV  que  permitem  separar  e  visualizar  esses  canais individualmente. Veja: 

> A função ```split``` faz o trabalho duro separando os canais. Assim podemos exibi-los em tons de cinza conforme mostra a imagem abaixo:

In [2]:
img = cv2.imread('ponte.png')

(canalAzul, canalVerde, canalVermelho) = cv2.split(img)

cv2.imshow("Vermelho", canalVermelho) 
cv2.imshow("Verde", canalVerde) 
cv2.imshow("Azul", canalAzul) 

cv2.waitKey(0) 

-1

> Também é possível alterar individualmente as Numpy Arrays que formam cada canal e depois juntá-las para criar novamente a imagem. Para isso use o comando: 

In [5]:
resultado = cv2.merge([canalAzul, canalVerde, canalVermelho]) 
cv2.imshow("resultado", resultado)
cv2.waitKey(0) 

-1

>Também é possível exibir os canais nas cores originais conforme abaixo:  

In [12]:
img = cv2.imread('ponte.png')  

(canalAzul, canalVerde, canalVermelho) = cv2.split(img)  
zeros = np.zeros(img.shape[:2], dtype = "uint8")  

cv2.imshow("Vermelho", cv2.merge([zeros, zeros, canalVermelho]))  
cv2.imshow("Verde", cv2.merge([zeros, canalVerde, zeros])) 
cv2.imshow("Azul", cv2.merge([canalAzul, zeros, zeros])) 

cv2.imshow("Original", img) 
cv2.waitKey(0) 

-1