<div style="text-align:center">

<img width="400" src="logo_isel.png">

## Licenciatura em Engenharia Informática e Multimédia
## Processamento de Imagem e Visão
### Trabalho prático 1
#### Fábio Dias [A42921] <br> Diogo Ribeiro [A46337]

##### 2023-2024

</div>

## Objetivos :
<ol type="a">
<h4>
<li> Desenvolver algoritmo de visão por computador, capaz de contar automaticamente a quantia em dinheiro (moedas), colocado em cima de uma mesa;</li><br>
<li> Familiarização com a biblioteca de funções OpenCV (Open Source Computer Vision) para programação de aplicações de visão por computador em tempo real (para linguagem de programação Python)</li>
</h4>
</ol>

## Descrição
<ol type="a">
<h4>
<li> Pretende-se desenvolver um algoritmo para contagem da quantia em dinheiro (moedas de euro), colocado em cima de uma mesa de superfície homogénea e clara, observada por uma câmara, montada num tripé, ajustado de modo a que o plano do sensor é paralelo ao plano da mesa. </li><br>

<li> O algoritmo deverá possuir alguma robustez relativamente às seguintes perturbações: 
<ol type="i">
    <li> presença de objectos, diferentes de moedas, no campo de visão; </li>
    <li> existência de pequenas sombras; </li>
    <li> eventual contacto dos objectos. </li> </li>
</ol><br>

<li> Serão fornecidos exemplos de imagens de treino que podem ser usadas para o desenvolvimento do algoritmo. </li><br>

<li> O algoritmo será avaliado usando um conjunto de imagens de teste, diferentes das de treino, mas adquiridas nas mesmas condições. </li>

</h4>
</ol>

## Desenvolvimento
<ul>
    <li> <h3> Abordagem inicial </h3>

<h4>
<p> No enunciado deste trabalho prático, foi-nos disponibilizada uma sequência típica de tarefas e operações relacionadas com o desenvolvimento deste algoritmo. </p>
<p> Inicialmente, temos de carregar as imagens e guardá-las em memória para depois serem manipuladas conforme o nosso objetivo. </p>
<p> Convertemos as imagens para tons de cinzento. Assim, a imagem passa de três canais, vermelho, verde e azul para apenas um. Desta forma, é requerido menos processamento e reduz a influência da iluminação, o que destaca melhor o contraste entre as moedas e a mesa. </p>
<p> O passo seguinte é a binarização da imagem. Isto significa que as imagens vão possuir apenas dois valores. Neste caso, 0 ou 255. 0 sendo preto e 255 sendo branco. Mas é necessário especificar o que vai ser branco e o que vai ser preto. Desta forma, podemos usar o algoritmo de Otsu. Este encontra automaticamente um valor para o limiar de decisão entre estes dois grupos. Ou seja, este vai encontrar o valor para um limiar ótimo para cada imagem, de forma adaptativa. Finalizando a binarização, quando visualizamos a imagem, conseguimos observar padrões circulares no fundo preto. Estes serão as moedas. </p>
<p> Este processo não é perfeito. As moedas podem ter circunferências perfeitas, mas buracos no círculo ou baías. Algumas moedas ficam irreconhecíveis ao ponto de não terem o aspeto de círculo nem parecerem pertencer ao mesmo objeto. Para corrigir isto e tentar obter algo semelhante a uma moeda, precisamos de efetuar operações morfológicas. Estão são um conjunto de técnicas de processamento de imagem utilizadas para modificar a forma de objetos em imagens. São utilizadas para pré-processamento e análise de imagem para melhorar características, como as bordas dos objetos. </p>
<p> Algumas destas operações usadas são a erosão, esta é utilizada para encolher o objeto, separar objetos assim como remover pequenos detalhes e ruído nas imagens; a dilatação, que serve para expandir objetos, preencher alguns buracos e engrossar bordas; outra operação usada foi o fechamento, que é uma operação de dilatação seguida de uma erosão. Esta também é útil para preencher buracos e suavizar contornos. </p>
<p> Para estas operações, é necessário ter elementos estruturantes. Estas são máscaras com diferentes tamanhos que percorrem cada pixel na imagem, substituindo o seu valor por um diferente de acordo com a operação desejada. </p>
<p> Após diversas tentativas e com diversos elementos estruturantes, concluiu-se que embora fosse um caminho possível, era esgotante e provou-se ineficaz na medida de investimento de tempo. Assim, partimos para outra abordagem. </p></li>
</h4>

### Código

In [182]:
# IMPORTS
import numpy as np
import cv2
import matplotlib.pyplot as plt

#### Métodos auxiliares

In [None]:
def showImage(imageTitle, image):
    cv2.imshow(imageTitle, image)
    cv2.waitKey()
    cv2.destroyAllWindows()
    
def showImageArray(tituloArray, arrayImagens):
    for index in range(len(arrayImagens)):
        showImage(tituloArray + ": " + str(index), arrayImagens[index])

### Importar imagens

In [None]:
numberOfImages = 9
width = 768
height = 1024
initialIndex = 1000697

imagesOriginal = [None] * numberOfImages
currentIndex = initialIndex

for index in range(numberOfImages):
    while imagesOriginal[index] is None:
        imagesOriginal[index] = cv2.imread("P" + str(currentIndex) + "s.jpg")
        currentIndex = currentIndex + 1

#### Conversão para escala de cinzentos

In [None]:
imagesGrayscale = [None] * numberOfImages

for index in range(numberOfImages):
    imagesGrayscale[index] = cv2.cvtColor(imagesOriginal[index], cv2.COLOR_BGR2GRAY)

#### Obtenção do limiar (threshold) para a binarização das imagens e respetiva conversão usando o algoritmo de Otsu

In [None]:
imagesBinary = [None] * numberOfImages
imagesThresholds = [None] * numberOfImages

for index in range(numberOfImages):
    imagesThresholds[index], imagesBinary[index] = cv2.threshold(imagesGrayscale[index], 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

#### Correção/melhoramento das imagens usando operações morfológicas

In [None]:
imagemBinaria = imagesBinary[0]

mascara5x5 = np.ones((5, 5), np.uint8)
mascara5x5[0, 0] = 0
mascara5x5[0, 4] = 0
mascara5x5[4, 0] = 0
mascara5x5[4, 4] = 0

mascara7x7 = np.ones((7, 7), np.uint8)
mascara7x7[0, 0] = 0
mascara7x7[0, 6] = 0
mascara7x7[6, 0] = 0
mascara7x7[6, 6] = 0

mascara9x9 = np.ones((9, 9), np.uint8)
mascara9x9[0, 0] = 0
mascara9x9[0, 8] = 0
mascara9x9[8, 0] = 0
mascara9x9[8, 8] = 0

#Erosão
# erosao1 = cv2.erode(imagemBinaria, mascara5x5, iterations = 1)
# erosao2 = cv2.erode(imagemBinaria, mascara5x5, iterations = 10)
# erosao3 = cv2.erode(imagemBinaria, mascara5x5, iterations = 30)
# erosao4 = cv2.erode(imagemBinaria, mascara5x5, iterations = 50)

#erosao = [erosao1, erosao2, erosao3, erosao4]


#showImageArray("Erosao", erosao)

#Fecho
fechoV1 = cv2.morphologyEx(imagemBinaria, cv2.MORPH_CLOSE, mascara5x5)
fechoV2 = cv2.morphologyEx(fechoV1, cv2.MORPH_CLOSE, mascara5x5)
fechoV3 = cv2.morphologyEx(fechoV2, cv2.MORPH_CLOSE, mascara5x5)

#fecho = [fechoV1, fechoV2, fechoV3] #Várias iterações não tem efeito

fecho5X5 = cv2.morphologyEx(imagemBinaria, cv2.MORPH_CLOSE, mascara5x5)
fecho7X7 = cv2.morphologyEx(imagemBinaria, cv2.MORPH_CLOSE, mascara7x7)
fecho9X9 = cv2.morphologyEx(imagemBinaria, cv2.MORPH_CLOSE, mascara9x9)

##Visualizar as Imagens
#showImage("Binária", imagemBinaria)

imagemBinariaColada = imagesBinary[4]
fecho9X9 = cv2.morphologyEx(imagemBinariaColada, cv2.MORPH_CLOSE, mascara9x9)
contours, hierarchy = cv2.findContours(fecho9X9, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
im = cv2.drawContours(imagesOriginal[4], contours, -1, (0,255,0), 3)

#showImage("", im)

# showImageArray("Erosao", erosao)
# showImageArray("Fecho 5x5", fecho)
# showImage("Fecho 5X5", fecho5X5)
# showImage("Fecho 7X7", fecho7X7)
# showImage("Fecho 9X9", fecho9X9)

imagemBinariaColada = imagesBinary[4]
#showImage("Bin Problema", imagemBinariaColada)


fecho5X5 = cv2.morphologyEx(imagemBinariaColada, cv2.MORPH_CLOSE, mascara5x5)
fecho7X7 = cv2.morphologyEx(imagemBinariaColada, cv2.MORPH_CLOSE, mascara7x7)
fecho9X9 = cv2.morphologyEx(imagemBinariaColada, cv2.MORPH_CLOSE, mascara9x9)

#showImage("Fecho5X5", fecho5X5)
#showImage("Fecho7X7", fecho7X7)
#showImage("Fecho9X9", fecho9X9)

#O engenheiro disse-me para usar a dilatação também com os discos.

dilatacao5X5 = cv2.dilate(imagemBinariaColada, mascara5x5, iterations=1)
fecho5X5 = cv2.morphologyEx(dilatacao5X5, cv2.MORPH_CLOSE, mascara5x5)

# showImage("Dilatacao", dilatacao5X5)
# showImage("Dilatacao + Fecho", fecho5X5)

erosao1 = cv2.erode(dilatacao5X5, mascara5x5, iterations = 1)
#showImage("Erosao", erosao1)

fecho5X5 = cv2.morphologyEx(imagemBinariaColada, cv2.MORPH_CLOSE, mascara5x5)
dilatacao5X5 = cv2.dilate(fecho5X5, mascara5x5, iterations=1)

# showImage("Fecho", fecho5X5)
# showImage("Fecho + Dilatacao", dilatacao5X5)

<ul>
<li> <h3> Abordagem Final </h3>
<h4>
<p> Para esta abordagem, foi necessário o carregamento das imagens assim como a conversão para os tons de cinzento, previamente efetuados para a abordagem anterior. </p>
<p> O próximo passo é desfocar ligeiramente a imagem. Isto porque o desfoque pode suavizar a imagem e reduzir o ruído, conseguindo assim uma melhor detecção das bordas das moedas.</p>
<p> Seguidamente, procuramos os círculos presentes nas imagens e anotamos a que correspondem os mesmos, assim como os seus raios. Esta será a principal característica a ter em conta nas avaliações e classificações das moedas: o seu raio. </p>
<p> Por  fim, soma-se o valor encontrado nos objetos classificados como moedas em cada imagem. </p> 
</h4>
</li>
</ul>