Tutorial Opencv


Este tutorial apresenta conceitos introdutórios de processamento de imagens (filtros) e de visão computacional (segmentação, classificação, reconhecimento de padrão e rastreamento). Estes conceitos serão introduzidos utilizando a biblioteca OpenCV, que é distribuída gratuitamente e possui documentação farta na internet, com exemplos e aplicações práticas. Para utilizar essa biblioteca em python acesse o terminal com ambiente de python ativado e digite pip install opencv-python.

In [None]:
# Importação das bibliotecas
import cv2
# Leitura da imagem com a função imread()
imagem = cv2.imread('entrada.jpg')
print('Largura em pixels: ', end='')
print(imagem.shape[1])
#largura da imagem print('Altura em pixels: ', end='')
print(imagem.shape[0])
#altura da imagem
print('Qtde de canais: ', end='')
print(imagem.shape[2])
# Mostra a imagem com a função imshow
cv2.imshow("Nome da janela", imagem)
cv2.waitKey(0) #espera pressionar qualquer tecla
# Salvar a imagem no disco com função imwrite()
cv2.imwrite("saida.jpg", imagem)

Este  programa  abre  uma  imagem,  mostra  suas  propriedades  de  largura  e  altura  em pixels, mostra a quantidade de canais utilizados, mostra a imagem na tela, espera o pressionar de  alguma tecla  para  fechar  a  imagem  e  salva  em  disco  a  mesma  imagem  com  o  nome ‘saída.jpg’. Vamos explicar o código em detalhes abaixo: 



In [None]:
# Importação das bibliotecas  
import cv2   
# Leitura da imagem com a função imread()  
imagem = cv2.imread('entrada.jpg')  

A partir do entendimento do sistema de coordenadas é possível alterar individualmente cada pixel ou ler a informação individual do pixel conforme abaixo: 

In [None]:
import cv2 
imagem = cv2.imread('ponte.jpg') 
(b, g, r) = imagem[0, 0] #veja que a ordem BGR e não RGB 

Imagens são matrizes Numpy neste caso retornadas pelo método “imread” e armazenada em memória através da variável “imagem” conforme acima. Lembre-se que o pixel superior mais a esquerda é o (0,0). No código é retornado na tupla (b, g, r) os respectivos valores das cores do pixel superior mais a esquerda. Veja que o método retorna a sequência BGR e não RGB como poderiamos esperar. Tendo os valores inteiros de cada cor é possível exibi-los na tela com o código abaixo:

In [None]:
print('O pixel (0, 0) tem as seguintes cores:') 
print('Vermelho:', r, 'Verde:', g, 'Azul:', b)  

Outra possibilidade é utilizar dois laços de repetição para “varrer” todos os pixels da  imagem, linha por linha como é o caso do código abaixo. Importante notar que esta estratégia
pode  não  ser  muito  performática  já  que  é  um  processo  lento  varrer  toda  a  imagem  pixel  a pixel.

In [None]:
import cv2 
imagem = cv2.imread('ponte.jpg') 
for y in range(0, imagem.shape[0]):
   for x in range(0, imagem.shape[1]):
     imagem[y, x] = (255,0,0)
cv2.imshow("Imagem modificada", imagem) 

Com uma  modificação temos o código abaixo. O objetivo agora é saltar  a cada 10 pixels ao percorrer as linhas e mais 10 pixels ao percorrer as colunas. A cada salto é criado um quadrado amarelo de 5x5 pixels. Desta vez parte da imagem original é preservada e  podemos ainda observar a ponte por baixo da grade de quadrados amarelos. 

In [None]:
import cv2 
imagem = cv2.imread('ponte.jpg') 
for y in range(0, imagem.shape[0], 10): #percorre linhas
   for x in range(0, imagem.shape[1], 10): #percorre colunas
     imagem[y:y+5, x: x+5] = (0,255,255)
cv2.imshow("Imagem modificada", imagem) 
cv2.waitKey(0)  

Veja  o  código  abaixo onde criamos uma nova imagem a partir de um pedaço da imagem original (ROI) e a salvamos no
disco.

In [None]:
import cv2
imagem = cv2.imread('ponte.jpg')
recorte = imagem[100:200, 100:200]
cv2.imshow("Recorte da imagem", recorte)
cv2.imwrite("recorte.jpg", recorte) #salva no disco 

Redimensionamento / Resize


Para  reduzir  ou  aumentar  o  tamanho  da  imagem,  existe  uma  função  já  pronta  da OpenCV, trata-se da função ‘resize’ mostrada abaixo. Importante notar que é preciso calcular
a proporção da altura em relação a largura da nova imagem, caso contrário ela poderá ficar distorcida.

In [None]:
import numpy as np
import cv2
img = cv2.imread('ponte.jpg')
cv2.imshow("Original", img)
largura = img.shape[1]
altura = img.shape[0]
proporcao = float(altura/largura)
largura_nova = 320 #em pixels
altura_nova = int(largura_nova*proporcao)
tamanho_novo = (largura_nova, altura_nova)
img_redimensionada = cv2.resize(img,
tamanho_novo, interpolation = cv2.INTER_AREA)
cv2.imshow('Resultado', img_redimensionada)
cv2.waitKey(0) 

Espelhando uma imagem / Flip  


Para espelhar uma imagem, basta inverter suas linhas, suas colunas ou ambas. Invertendo as linhas temos o flip horizontal e invertendo as colunas temos o flip vertical.
Podemos fazer o espelhamento/flip tanto com uma função oferecida pela OpenCV (função flip) como através da manipulação direta das matrizes que compõe a imagem. Abaixo
temos os dois códigos equivalentes em cada caso.

In [None]:
import cv2 img = cv2.imread('ponte.jpg') 
cv2.imshow("Original", img) 
flip_horizontal = img[::-1,:]#comando equivalente abaixo 
#flip_horizontal = cv2.flip(img, 1)  
cv2.imshow("Flip Horizontal", flip_horizontal) 
flip_vertical = img[:,::-1] #comando equivalente abaixo 
#flip_vertical = cv2.flip(img, 0)  
cv2.imshow("Flip Vertical", flip_vertical) 
flip_hv = img[::-1,::-1] #comando equivalente abaixo  
#flip_hv = cv2.flip(img, -1) 
cv2.imshow("Flip Horizontal e Vertical", flip_hv) 
cv2.waitKey(0) 

Rotacionando uma imagem / Rotate  


A  transformação  affine  ou  mapa  affine,  é  uma  função  entre  espaços  affine  que preservam  os  pontos,  grossura  de  linhas  e  planos.  Além  disso,  linhas  paralelas  permanecem
paralelas após uma transformação affine. Essa transformação não necessariamente preserva a distância entre pontos mas ela preserva a proporção das distâncias entre os pontos de uma
linha reta. Uma rotação é um tipo de transformação affine. 

In [None]:
img = cv2.imread('ponte.jpg') 
(alt, lar) = img.shape[:2] #captura altura e largura 
centro = (lar // 2, alt // 2) #acha o centro  
M = cv2.getRotationMatrix2D(centro, 30, 1.0)#30 graus 
img_rotacionada = cv2.warpAffine(img, M, (lar, alt))  
cv2.imshow("Imagem rotacionada em 30 graus", img_rotacionada) 
cv2.waitKey(0)
  

Sistemas de cores 



Já  conhecemos  o  tradicional  espaço  de  cores  RGB  (Red,  Green,  Blue)  que  sabemos que  em  OpenCV  é  na  verdade  BGR  dada  a  necessidade  de  colocar  o  azul  como  primeiro elemento e o vermelho como terceiro elemento de uma tupla que compõe as cores de pixel.  

Contudo, existem outros espaços de cores como o próprio “Preto e Branco” ou “tons de cinza”, além de outros coloridos como o L*a*b* e o HSV. Abaixo temos um exemplo de
como ficaria nossa imagem da ponte nos outros espaços de cores :

In [None]:
img = cv2.imread('ponte.jpg')
cv2.imshow("Original", img)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow("Gray", gray)
hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
cv2.imshow("HSV", hsv)
lab = cv2.cvtColor(img, cv2.COLOR_BGR2LAB)
cv2.imshow("L*a*b*", lab)
cv2.waitKey(0) 

Como  já  sabemos  uma  imagem  colorida  no  formato  RGB  possui  3  canais,  um  para cada  cor.  Existem  funções  do  OpenCV  que  permitem  separar  e  visualizar  esses  canais
individualmente. Veja: 



In [None]:
img = cv2.imread('ponte.jpg') 
(canalAzul, canalVerde, canalVermelho) = cv2.split(img)
cv2.imshow("Vermelho", canalVermelho) 
cv2.imshow("Verde", canalVerde) 
cv2.imshow("Azul", canalAzul) 
cv2.waitKey(0) 

Também é possível alterar individualmente as Numpy Arrays que formam cada canal e depois juntá-las para criar novamente a imagem. Para isso use o comando: 

In [None]:
resultado = cv2.merge([canalAzul, canalVerde, canalVermelho]) 

Também é possível exibir os canais nas cores originais conforme abaixo:  



In [None]:
import numpy as np 
import cv2 
img = cv2.imread('ponte.jpg')  
(canalAzul, canalVerde, canalVermelho) = cv2.split(img)  
zeros = np.zeros(img.shape[:2], dtype = "uint8")  
cv2.imshow("Vermelho", cv2.merge([zeros, zeros, canalVermelho]))  
cv2.imshow("Verde", cv2.merge([zeros, canalVerde, zeros])) 
cv2.imshow("Azul", cv2.merge([canalAzul, zeros, zeros])) 
cv2.imshow("Original", img) 
cv2.waitKey(0) 

Histogramas e equalização de imagem  



Um histograma é um gráfico de colunas ou de linhas que representa a distribuição dos valores dos pixels de uma imagem, ou seja, a quantidade de pixeis mais claros (próximos de 255) e a quantidade de pixels mais escuros (próximos de 0). O eixo X do gráfico normalmente possui uma distribuição de 0 a 255 que demonstra o valor (intensidade) do pixel e no eixo Y é plotada a quantidade de pixels daquela intensidade. 



In [None]:
from matplotlib import pyplot as plt 
import cv2  
img = cv2.imread('ponte.jpg') 
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #converte P&B 
cv2.imshow("Imagem P&B", img) 
#Função calcHist para calcular o histograma da imagem 
h = cv2.calcHist([img], [0], None, [256], [0, 256]) 
plt.figure() 
plt.title("Histograma P&B") 
plt.xlabel("Intensidade") 
plt.ylabel("Qtde de Pixels") 
plt.plot(h) 
plt.xlim([0, 256]) 
plt.show() 
cv2.waitKey(0)  

Também  é  possível  plotar  o  histograma  de  outra  forma,  com  a  ajuda  da  função ‘ravel()’. Neste caso o eixo X avança o valor 255 indo até 300, espaço que não existem pixels.  



In [None]:
plt.hist(img.ravel(),256,[0,256]) plt.show() 

lém do histograma da imagem em tons de cinza é possível plotar um histograma da imagem colorida. Neste caso teremos três linhas, uma para cada canal. Veja abaixo o código 

necessário.  Importante notar que a função ‘zip’ cria uma lista de tuplas formada  pelas  união das  listas  passadas  e  não  tem  nada  a  ver  com  um  processo  de  compactação  como  poderia  se esperar. 



In [None]:
from matplotlib import pyplot as plt
import numpy as np
import cv2
img = cv2.imread('ponte.jpg')
cv2.imshow("Imagem Colorida", img)
#Separa os canais
canais = cv2.split(img)
cores = ("b", "g", "r")
plt.figure()
plt.title("'Histograma Colorido")
plt.xlabel("Intensidade")
plt.ylabel("Número de Pixels")
for (canal, cor) in zip(canais, cores):
#Este loop executa 3 vezes, uma para cada canal
hist = cv2.calcHist([canal], [0], None, [256], [0, 256])
plt.plot(hist, cor = cor)
plt.xlim([0, 256])
plt.show() 

Equalização de Histograma 


É possível realizar um cálculo matemático sobre a distribuição de pixels para aumentar o contraste da imagem. A intenção neste caso é distribuir de forma mais uniforme as
intensidades dos pixels sobre a imagem. No histograma é possível identificar a diferença pois o acumulo de pixels próximo a alguns valores é suavizado. Veja a diferença entre o
histograma original e o equalizado abaixo:

In [None]:
from matplotlib import pyplot as plt
import numpy as np
import cv2
img = cv2.imread('ponte.jpg')
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
h_eq = cv2.equalizeHist(img)
plt.figure()
plt.title("Histograma Equalizado")
plt.xlabel("Intensidade")
plt.ylabel("Qtde de Pixels")
plt.hist(h_eq.ravel(), 256, [0,256])
plt.xlim([0, 256])
plt.show()
plt.figure()
plt.title("Histograma Original")
plt.xlabel("Intensidade")
plt.ylabel("Qtde de Pixels")
plt.hist(img.ravel(), 256, [0,256])
plt.xlim([0, 256])
plt.show()
cv2.waitKey(0) 

Suavização de imagens


A  suavização  da  imagem  (do  inglês  Smoothing),  também  chamada  de  ‘blur’  ou ‘blurring’ que podemos traduzir para “borrão”, é um efeito que podemos notar nas fotografias fora de foco ou desfocadas onde tudo fica embasado. Na  verdade  esse  efeito  pode  ser  criado  digitalmente,  basta  alterar  a  cor  de  cada  pixel misturando  a  cor  com  os  pixels  ao  seu  redor.  Esse  efeito  é  muito  útil  quando  utilizamos algoritmos  de  identificação  de  objetos  em  imagens  pois  os  processos  de  detecção  de  bordas por exemplo, funcionam melhor depois de aplicar uma suavização na imagem.

Suavização por cálculo da média



 Neste caso é criada uma “máscara para envolver o pixel em questão e calcular seu novo valor. O novo valor do pixel será a média simples dos valores dos pixels dentro da máscara,  ou  seja,  dos  pixels  da  vizinhança.  Alguns  autores  chamam  esta  máscara  de  janela  de cálculo ou kernel (do inglês núcleo).   


Portanto o novo valor do pixel será a média da sua vizinhança o que gera a suavização na imagem como um todo.  No código abaixo percebemos que o método utilizado para a suavização pela média é o  método  ‘blur’  da  OpenCV.  Os  parâmetros  são  a  imagem  a  ser  suavizada  e  a  janela  de suavização. Colocarmos números impars para gerar as caixas de cálculo pois dessa forma não existe dúvida sobre onde estará o pixel central que terá seu valor atualizado.  Perceba que usamos as funções vstack (pilha vertical) e hstack (pilha horizontal) para juntar as imagens em uma única imagem final mostrando desde a imagem original e seguinte com caixas de calculo de 3x3, 5x5, 7x7, 9x9 e 11x11. Perceba que conforme aumenta a caixa maior é o efeito de borrão (blur) na imagem.  

In [None]:
img = cv2.imread('ponte.jpg') 
img = img[::2,::2] # Diminui a imagem  
suave = np.vstack([   np.hstack([img,cv2.blur(img, ( 3,  3))]),np.hstack([cv2.blur(img, (5,5)), cv2.blur(img, ( 7,  7))]),np.hstack([cv2.blur(img, (9,9)), cv2.blur(img, (11, 11))]),])  
cv2.imshow("Imagens suavisadas (Blur)", suave) 
cv2.waitKey(0)  

Suavização pela mediana


Da  mesma  forma  que  os  cálculos  anteriores,  aqui  temos  o  cálculo  de  uma  caixa  ou  janela  quadrada  sobre  um  pixel  central  onde  matematicamente  se  utiliza  a  mediana  para 

calcular o valor final do pixel. A mediana é semelhante à média, mas ela despreza os valores muito altos ou muito baixos que podem distorcer o resultado. A mediana é o número que fica 

exatamente no meio do intervalo. A  função  utilizada  é  a  cv2.medianBlur(img,  3)  e  o  único  argumento  é  o  tamanho  da caixa ou janela usada. É importante notar que este método não cria novas cores, como pode acontecer com os anteriores, pois ele sempre altera a cor do pixel atual com um dos valores da vizinhança. 

Veja o código usado: 



In [None]:
import numpy as np
import cv2
img = cv2.imread('ponte.jpg')
img = img[::2,::2] # Diminui a imagem
suave = np.vstack([
np.hstack([img,
cv2.medianBlur(img,  3)]),
np.hstack([cv2.medianBlur(img,  5),
cv2.medianBlur(img,  7)]),
np.hstack([cv2.medianBlur(img,  9),
cv2.medianBlur(img, 11)]),
])
cv2.imshow("Imagem original e suavizadas pela mediana", suave)
cv2.waitKey(0) 

Suavização com filtro bilateral  


Este  método  é  mais  lento  para calcular  que os  anteriores  mas  como  vantagem apresenta a preservação de bordas e garante que o ruído seja removido.  

Para  realizar  essa  tarefa,  além  de  um  filtro  gaussiano  do  espaço  ao  redor  do  pixel também é utilizado outro cálculo com outro filtro gaussiano que leva em conta a diferença de 

intensidade  entre  os  pixels,  dessa  forma,  como  resultado  temos  uma  maior  manutenção  das bordas das imagem. A função usada é cv2.bilateralFilter() e o código usado segue abaixo: 



In [None]:
img = cv2.imread('ponte.jpg')
img = img[::2,::2] # Diminui a imagem
suave = np.vstack([
np.hstack([img,
cv2.bilateralFilter(img,  3, 21, 21)]),
np.hstack([cv2.bilateralFilter(img,  5, 35, 35),
cv2.bilateralFilter(img,  7, 49, 49)]),
np.hstack([cv2.bilateralFilter(img,  9, 63, 63),
cv2.bilateralFilter(img, 11, 77, 77)])
]) 

Binarização com limiar


Thresholding  pode  ser  traduzido  por  limiarização  e  no  caso  de  processamento  de imagens  na  maior  parte  das  vezes  utilizamos  para  binarização  da  imagem.  Normalmente
convertemos  imagens  em  tons  de  cinza  para  imagens  preto  e  branco  onde  todos  os  pixels possuem 0 ou 255 como valores de intensidade.  



In [None]:
img = cv2.imread('ponte.jpg') 
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  
suave = cv2.GaussianBlur(img, (7, 7), 0) # aplica blur  
(T, bin) = cv2.threshold(suave, 160, 255, cv2.THRESH_BINARY) 
(T, binI) = cv2.threshold(suave, 160, 255, cv2.THRESH_BINARY_INV) 
resultado = np.vstack([  np.hstack([suave, bin]),  np.hstack([binI, cv2.bitwise_and(img, img, mask = binI)])  ])   
cv2.imshow("Binarização da imagem", resultado) 
cv2.waitKey(0) 

Threshold adaptativo  


O valor de intensidade 160 utilizada para a binarização acima foi arbitrado, contudo, é possível otimizar esse valor matematicamente. Esta é a proposta do threshold adaptativo.  
Para isso precisamos dar um valor da janela ou caixa de cálculo para que o limiar seja calculado nos pixels próximos das imagem. Outro parâmetro é um inteiro que é subtraído da
média calculada dentro da caixa para gerar o threshold final. 

In [None]:
img = cv2.imread('ponte.jpg') 
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # converte  
suave = cv2.GaussianBlur(img, (7, 7), 0) # aplica blur   
bin1 = cv2.adaptiveThreshold(suave, 255,  cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY_INV, 21, 5) 
bin2 = cv2.adaptiveThreshold(suave, 255,  cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV, 21, 5)  
resultado = np.vstack([  np.hstack([img, suave]),  np.hstack([bin1, bin2])  ])   
cv2.imshow("Binarização adaptativa da imagem", resultado) 
cv2.waitKey(0)  

Threshold com Otsu e Riddler-Calvard


Outro método que automaticamente encontra um threshold para a imagem é o método de Otsu. Neste caso ele analiza o histograma da imagem para encontrar os dois maiores picos
de intensidades, então ele calcula um valor para separar da melhor forma esses dois picos.

In [None]:
import mahotas 
import numpy as np 
import cv2  
img = cv2.imread('ponte.jpg') 
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # converte  
suave = cv2.GaussianBlur(img, (7, 7), 0) # aplica blur  
T = mahotas.thresholding.otsu(suave) 
temp = img.copy() 
temp[temp > T] = 255 
temp[temp < 255] = 0 
temp = cv2.bitwise_not(temp) 
T = mahotas.thresholding.rc(suave) 
temp2 = img.copy() 
temp2[temp2 > T] = 255 
temp2[temp2 < 255] = 0 
temp2 = cv2.bitwise_not(temp2) 
resultado = np.vstack([  np.hstack([img, suave]),  np.hstack([temp, temp2])  ])  
cv2.imshow("Binarização com método Otsu e Riddler-Calvard", resultado) 
cv2.waitKey(0) 

Sobel  


Não entraremos na explicação matemática de cada método mas é importante notar que o  Sobel  é  direcional,  então  temos  que  juntar  o  filtro  horizontal  e  o  vertical  para  ter  uma
transformação completa, veja: 

In [None]:
import numpy as np 
import cv2  
img = cv2.imread('ponte.jpg') 
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  
sobelX = cv2.Sobel(img, cv2.CV_64F, 1, 0) 
sobelY = cv2.Sobel(img, cv2.CV_64F, 0, 1) 
sobelX = np.uint8(np.absolute(sobelX)) 
sobelY = np.uint8(np.absolute(sobelY)) 
sobel = cv2.bitwise_or(sobelX, sobelY)  
resultado = np.vstack([  np.hstack([img,    sobelX]),  np.hstack([sobelY, sobel])  ])   
cv2.imshow("Sobel", resultado) 
cv2.waitKey(0) 

Filtro Laplaciano

O  filtro  Laplaciano  não  exige  processamento  individual  horizontal  e  vertical  como  o Sobel.  Um  único  passo  é  necessário  para  gerar  a  imagem  abaixo.  Contudo,  também  é 

necessário trabalhar com a representação do pixel em ponto flutuant de 64 bits com sinal para depois converter novamente para inteiro sem sinal de 8 bits. 



In [None]:
import numpy as np 
import cv2 
img = cv2.imread('ponte.jpg') 
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) 
lap = cv2.Laplacian(img, cv2.CV_64F) 
lap = np.uint8(np.absolute(lap)) 
resultado = np.vstack([img, lap])  
cv2.imshow("Filtro Laplaciano", resultado) 
cv2.waitKey(0) 

Detector de bordas Canny  
Em inglês canny pode ser traduzido para esperto, esta no discionário. E o Carry Hedge Detector ou detector de bordas Caany realmente é mais inteligente que os outros. Na verdade 

ele  se  utiliza  de  outras  técnicas  como  o  Sobel  e  realiza  multiplos  passos  para  chegar  ao resultado final.  

Basicamente o Canny envolve: 

1. Aplicar um filtro gaussiano para suavizar a imagem e remover o ruído. 

2. Encontrar os gradientes de intensidade da imagem. 

3. Aplicar Sobel duplo para determinar bordas potenciais. 

4. Aplicar o processo de “hysteresis” para verificar se o pixel faz parte de uma borda  “forte”  suprimindo todas as outras bordas que são fracas e não conectadas a bordas fortes.  

É preciso fornecer dois parâmetros para a função  cv2.Canny(). Esses dois valores são o  limiar  1  e  limiar  2  e são utilizados no processo de “hysteresis” final.  Qualquer  gradiente 

com valor maior que o limiar 2 é considerado como borda. Qualquer valor inferior ao limiar 1 não é considerado borda. Valores entre o limiar 1 e limiar 2 são classificados como bordas ou 

não bordas com base em como eles estão conectados.

In [None]:
import numpy as np 
import cv2 
img = cv2.imread('ponte.jpg') 
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) 
suave = cv2.GaussianBlur(img, (7, 7), 0)  
canny1 = cv2.Canny(suave, 20, 120) 
canny2 = cv2.Canny(suave, 70, 200) 
resultado = np.vstack([  np.hstack([img,    suave ]),  np.hstack([canny1, canny2])  ])  
cv2.imshow("Detector de Bordas Canny", resultado) 
cv2.waitKey(0)

Identificando e contando objetos


Como todos sabem, a atividade de jogar dados é muito útil. Muito útil para jogar RPG, General e outros jogos.  Mas depois do sistema apresentado abaixo, não será mais necessário
clicar no mouse ou pressionar uma tecla do teclado para jogar com o computador. Você poderá jogar os dados de verdade e o computador irá “ver” sua pontuação.

In [None]:
import numpy as np 
import cv2 
import mahotas  
#Função para facilitar a escrita nas imagem 
def escreve(img, texto, cor=(255,0,0)):
  fonte = cv2.FONT_HERSHEY_SIMPLEX 
  cv2.putText(img, texto, (10,20), fonte, 0.5, cor, 0,      cv2.LINE_AA)
imgColorida = cv2.imread('dados.jpg') #Carregamento da imagem  
#Se necessário o redimensioamento da imagem pode vir aqui.
#Passo 1: Conversão para tons de cinza 
img = cv2.cvtColor(imgColorida, cv2.COLOR_BGR2GRAY)  
#Passo 2: Blur/Suavização da imagem 
suave = cv2.blur(img, (7, 7))  
#Passo 3: Binarização resultando em pixels brancos e pretos 
T = mahotas.thresholding.otsu(suave) 
bin = suave.copy() bin[bin > T] = 255 
bin[bin < 255] = 0 
bin = cv2.bitwise_not(bin)  
#Passo 4: Detecção de bordas com Canny 
bordas = cv2.Canny(bin, 70, 150)  
#Passo 5: Identificação e contagem dos contornos da imagem 
#cv2.RETR_EXTERNAL = conta apenas os contornos externos 
(lx, objetos, lx) = cv2.findContours(bordas.copy(),cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) #A variável lx (lixo) recebe dados que não são utilizados
escreve(img, "Imagem em tons de cinza", 0) 
escreve(suave, "Suavizacao com Blur", 0) 
escreve(bin, "Binarizacao com Metodo Otsu", 255) 
escreve(bordas, "Detector de bordas Canny", 255)
temp = np.vstack([  np.hstack([img, suave]),   np.hstack([bin, bordas])   ])   
cv2.imshow("Quantidade de objetos: "+str(len(objetos)), temp) 
cv2.waitKey(0) 
imgC2 = imgColorida.copy() 
cv2.imshow("Imagem Original", imgColorida)
cv2.drawContours(imgC2, objetos, -1, (255, 0, 0), 2) 
escreve(imgC2, str(len(objetos))+" objetos encontrados!") 
cv2.imshow("Resultado", imgC2) 
cv2.waitKey(0) 