# Aula 11 – Segmentação: Introdução e métodos básicos

## 1. Introdução

Segmentação é o processo de dividir a imagem em partes de tal forma que não haja interseções e que a união implique novamente na imagem completa. Do ponto de vista prático para visão computacional, isso significa dividir a imagem em regiões de interesse, ou nos objetos que queremos identificar.

Um dos principais e também mais básico método de segmentação é a binarização. Trata-se de um método que divide a imagem pela intensidade dos pixels, jogando em dois grupos: preto e branco. É a limiarização. Isso é muito útil quando o objeto tem intensidade que se difere claramente do restante da imagem. Por exemplo, é o que ocorre com letras escuras em um papel branco. O grande problema da binarização é decidir o valor de limiar ideal que irá jogar os pixels do objeto de interesse para uma classe (pretos, por exemplo) enquanto o restante da imagem ficará na outra. Um modo bastante eficiente de fazer isso é a Binarização de Otsu, que define automaticamente um bom valor de limiar baseado no cálculo da variância dos valores de intensidade dos pixels.

Outra segmentação importante é a das bordas, pois facilita bastante a identificação do objeto por sua forma. Filtragens podem ser realizadas para tal, utilizando-se filtros como Sobel, Roberts, Prewitt, LoG (Laplaciano do Gaussiano), que são filtros de alta frequência e têm leves diferenças na forma como realçam as bordas que podem ser úteis ao analisar características do problema de visão atacado. O LoG, por exemplo, ao aplicar o Gaussiano, reduz o ruído e, ao aplicar o Laplaciano, tende a identificar mais a borda real e confundir menos ruídos com bordas. A desvantagem é a suavização da borda, ficando menos preciso.

Entre os algoritmos de segmentação de bordas, vale enfatizar o Canny. Esse tenta seguir os parâmetros necessário para um detector de bordas ideal: 
- Boa detecção: todas as bordas devem ser identificadas;
- Boa localização: as bordas identificadas devem estar o mais próximo possível das bordas reais;
- Resposta mínima: cada borda deve ser identificada apenas uma vez.
Embora possa falhar principalmente no primeiro ponto, o Canny tem a vantagem de retornar linhas claras com um pixel de espessura bem centralizadas nas bordas (considerando que as bordas não têm exatamente um pixel de espessura). Ou seja, sua detecção fica muito clara e forte, com pouco ruído e poucas falhas de continuidade. A ideia principal do algoritmo é “seguir” a borda, desenhando pixel a pixel o resultado, baseado no gradiente da imagem (direção da variação das intensidades).

## 2. Leitura complementar

Livro E – Seções 5.1.3 e 5.2

Livro 1 – Seções 7.1 e 7.2

Livro 2 – Cap. 7 e Seção 9.1

Livro 3 – Seções 10.2 e 10.3

## 3. Exercícios

- Para os exercícios a seguir, utilize as funções de Otsu e Canny disponibilizadas pela biblioteca que você estiver trabalhando (Matlab ou OpenCV), na linguagem de sua preferência.

a) Utilize o Método de Otsu para limiarizar a placa da imagem do exercício da aula 8 e veja se você obtém uma boa separação dos caracteres em relação ao fundo. Compare com o limiar que você havia utilizado.

b) Utilize o Método de Canny para segmentar os caracteres pelas bordas. O resultado ficou melhor? Isto é, é possível identificar bem os caracteres visualmente, com bordas sem buracos e caracteres diferentes sem contato?

In [1]:
import cv2
import numpy as np

In [2]:
img = cv2.imread('HUH9271.png',cv2.IMREAD_GRAYSCALE)

ret,thr = cv2.threshold(img, 0, 255, cv2.THRESH_OTSU)
cv2.imshow('OTSU', thr)
cv2.waitKey(0)  

canny = cv2.Canny(img, 50, 120)
cv2.imshow('Canny', canny)
cv2.waitKey(0)  
cv2.destroyAllWindows()

Resultado: Canny ficou melhor o resultado, porem não continuou com alguns buracos.