# Tutorial Opencv

Este tutorial apresenta conceitos introdutórios de processamento de imagens (filtros) e de visão computacional (segmentação, classificação, reconhecimento de padrão e rastreamento). Estes conceitos serão introduzidos utilizando a biblioteca OpenCV, que é distribuída gratuitamente e possui documentação farta na internet, com exemplos e aplicações práticas. Para utilizar essa biblioteca em python acesse o terminal com ambiente de python ativado e digite `pip install opencv-python`.

## 1. Lendo um documento e primeiras operações.

![pega_na _pasta_img](img\img_1.jpg)

Este  programa  abre  uma  imagem,  mostra  suas  propriedades  de  largura  e  altura  em pixels, mostra a quantidade de canais utilizados, mostra a imagem na tela, espera o pressionar de  alguma tecla  para  fechar  a  imagem  e  salva  em  disco  a  mesma  imagem  com  o  nome ‘saída.jpg’. Vamos explicar o código em detalhes no decorrer do texto. Mas vamos aplica-lo logo em uma imagem. 

É importante comentar que cada código abaixo foi rodado em uma IDE (pycharm ou vscode).

In [1]:
# Importação das bibliotecas
import cv2

# Leitura da imagem com a função imread()
imagem = cv2.imread('ponte.jpg')

print('Largura em pixels: ', end='')
print(imagem.shape[1]) #largura da imagem (quantidade de colunas)

print('Altura em pixels: ', end='')
print(imagem.shape[0]) #altura da imagem (quantidade de linhas)

print('Qtde de canais: ', end='')
print(imagem.shape[2])

# Mostra a imagem com a função imshow
cv2.imshow("Ponte", imagem)
cv2.waitKey(0) #espera pressionar qualquer tecla
# Salvar a imagem no disco com função imwrite()
cv2.imwrite("saida.jpg", imagem)


Largura em pixels: 300
Altura em pixels: 168
Qtde de canais: 3


True

Ao fim da excução teremos a mostra da janela abaixo

![pega_na _pasta_img](pratica\img_geradas\saida.jpg)

A importação da biblioteca padrão da OpenCV é obrigatória para utilizar suas funções. A primeira função usada é para abrir a imagem através de cv2.imread() que leva como argumento o nome do arquivo em disco. A imagem é lida e armazenada em ‘imagem’ que é uma variavel que dará acesso ao objeto da imagem que nada mais é que uma matriz de 3 dimensões (3 canais) contendo em cada dimensão uma das 3 cores do padrão RGB (red=vermelho, green-verde, blue=azul). No caso de uma imagem preto e branca temos apenas um canal, ou seja, apenas uma matriz de 2 dimensões. Para facilitar o entendimento podemos pensar em uma planilha eletrônica, com linhas e colunas, portanto, uma matriz de 2 dimensões. Cada célula dessa matriz é um pixel, que no caso de imagens preto e brancas possuem um valor de 0 a 255, sendo 0 para preto e 255 para branco. Portanto, cada célula contém um inteiro de 8 bits (sem sinal) que em Python é definido por “uint8” que é um unsigned integer de 8 bits.

![pega_na _pasta_img](img\img_2.jpg)

**Figura 1- Imagem preto e branca representada em uma matriz de inteiros onde cada célula é um inteiro sem sinal de 8 bits que pode conter de 0 (preto) até 255 (branco). Perceba os vários tons de cinza nos valores intermediários como 30 (cinza escuro) e 210 (cinza claro).**

No  caso  de  imagens  preto  e  branca  é  composta  de  apenas  uma  matriz  de  duas  dimensões  como  na  imagem  acima.  Já  para  imagens  coloridas  temos  três  dessas  matrizes  de duas dimensões cada uma representando uma das cores do sistema RGB. Portanto, cada pixel é formado de uma tupla de 3 inteiros de 8 bits sem sinal no sistema (R,G,B) sendo que (0,0,0) representa o preto, (255,255,255) o branco. Nesse sentido, as cores mais comuns são:  

Branco - RGB (255,255,255); 

Azul - RGB (0,0,255); 

Vermelho - RGB (255,0,0); 

Verde - RGB (0,255,0); 

Amarelo - RGB (255,255,0); 

Magenta - RGB (255,0,255); 

 Ciano - RGB (0,255,255); 

Preto - RGB (0,0,0). 

As imagens coloridas, portanto, são compostas normalmente de 3 matrizes de inteiros  sem  sinal  de  8  bits,  a  junção  das  3  matrizes  produz  a  imagem  colorida  com  capacidade  de reprodução de 16,7 milhões de cores, sendo que os 8 bits tem capacidade para 256 valores e  elevando a 3 temos 256³ = 16,7 milhões. 

![pega_na _pasta_img](img\img_3.jpg)

**Figura 2- Na imagem temos um exemplo das 3 matrizes que compõe o sistema RGB. Cada pixel da imagem, portanto, é composto por 3 componentes de 8 bits cada, sem sinal, o que gera 256 combinações por cor. Portanto, a representação é de 256 vezes 256 vezes 256 ou 256³ que é igual a 16,7 milhões de cores.**

## 2. Sistema de coordenadas e manipulação de pixels

Podemos  alterar  a  cor  individualmente  para  cada  pixel, ou seja, podemos manipular individualmente cada pixel da imagem.  Para isso é importante entender o sistema de coordenadas (linha, coluna) onde o pixel mais a esquerda e acima da imagem esta na posição (0,0) esta na linha zero e coluna zero. Já em uma imagem com 300 pixels de largura, ou seja, 300 colunas e tendo 200 pixels de altura,  ou  seja,  200  linhas,  terá  o  pixel  (199,299)  como  sendo  o  pixel  mais  a  direita  e  abaixo  da imagem.  

![pega_na _pasta_img](img\img_4.jpg)

**Figura 3- O sistema de coordenadas envolve uma linha e coluna. Os índices iniciam em zero. O pixel (2,8), ou seja, na linha índice 2 que é a terceira linha e na coluna índice 8 que é a nona linha possui a cor 50.**

A partir do entendimento do sistema de coordenadas é possível alterar individualmente cada pixel ou ler a informação individual do pixel conforme abaixo:

In [None]:
imagem = cv2.imread('ponte.jpg') 
(b, g, r) = imagem[0, 0] #veja que a ordem BGR e não RGB

#Uma observação que podemos fazer aqui é a equivalencia entre imagem[y, x] com imagem[y][x]

print(len(imagem[0]))

Imagens são matrizes Numpy neste caso retornadas pelo método “imread” e armazenada em memória através da variável “imagem” conforme acima. Lembre-se que o pixel superior mais a esquerda é o (0,0). No código é retornado na tupla (b, g, r) os respectivos valores das cores do pixel superior mais a esquerda. Veja que o método retorna a sequência BGR e não RGB como poderiamos esperar. Tendo os valores inteiros de cada cor é possível exibi-los na tela com o código abaixo:

In [None]:
print('O pixel (0, 0) tem as seguintes cores:') 
print('Vermelho:', r, 'Verde:', g, 'Azul:', b)

Outra possibilidade é utilizar dois laços de repetição para “varrer” todos os pixels da  imagem, linha por linha como é o caso do código abaixo. Importante notar que esta estratégia pode  não  ser  muito  performática  já  que  é  um  processo  lento  varrer  toda  a imagem  pixel  a pixel.

In [None]:
import cv2

imagem = cv2.imread('ponte.jpg') 
for y in range(0, imagem.shape[0]):
    for x in range(0, imagem.shape[1]):
        imagem[y, x] = (255,0,0)
cv2.imshow("Imagem modificada", saida_azul)
cv2.waitKey(0) 


O resultado é uma imagem com todos os pixels substituídos pela cor azul (255,0,0), como mostra a janela abaixo:


![pega_na _pasta_img](Prática\img_geradas\Imagem_modificada.jpg)

**Figura 5 Imagem completamente azul pela alteração de todos os pixels para (255,0,0). Lembrando que o  padrão RGB é na verdade BRG pela tupla (B, R, G).**

Com uma  modificação temos o código abaixo. O objetivo agora é saltar  a cada 10 pixels ao percorrer as linhas e mais 10 pixels ao percorrer as colunas. A cada salto é criado um quadrado amarelo de 5x5 pixels. Desta vez parte da imagem original é preservada e  podemos ainda observar a ponte por baixo da grade de quadrados amarelos. 


In [2]:
import cv2 

imagem = cv2.imread('ponte.jpg') 
for y in range(0, imagem.shape[0], 10): #percorre linhas
    for x in range(0, imagem.shape[1], 10): #percorre colunas
        imagem[y:y+5, x: x+5] = (0,255,255)
cv2.imshow("Imagem modificada", imagem) 
cv2.waitKey(0) 

-1

![pega_na _pasta_img](Pratica\img\quadrados_amarelos.jpg)

**Figura 6 Código gerou quadrados amarelos de 5x5 pixels sobre a toda a imagem.**

é de grande importância entender o sistema de coordenadas em uma imagem, tendo em vista os cortes que podemos fazer na mesma.

### 3. Cortando uma imagem / Crop
Veja  o  código  abaixo onde criamos uma nova imagem a partir de um pedaço da imagem original (ROI) e a salvamos no
disco.

In [1]:
import cv2
imagem = cv2.imread('ponte.jpg')
recorte = imagem[100:200, 100:200]
cv2.imshow("Recorte da imagem", recorte)
cv2.imwrite("img/recorte.jpg", recorte) #salva no disco 

True

![pega_na _pasta_img](Pratica\img\recorte.jpg)

**Figura 7 Imagem recortada da imagem original**