# Desafio 1
## Reconhecimento de faces

Dada uma base de dados de imagens de pessoas da [Caltech](http://www.vision.caltech.edu/html-files/archive.html) na pasta "caltech", colete os dados de cada pessoa, das 10 disponíveis, identificado por meio do seu id ("Subject 1", "Subject 2"  e assim por diante). Use a pasta "train" para treinar um modelo de classificador de rostos e valide os resultados com outras amostras que estão na pasta "val".

Após os testes, teste seu modelo com 10 imagens na pasta "imagens" e avalie como o classificador escolhido se comportou.

Utilize como referência dos sujeitos a ordem a seguir.

Sujeito 1
<img src="imagens/caltech/train/1/image_0002.jpg" width="40%" height="40%">

Sujeito 2
<img src="imagens/caltech/train/2/image_0023.jpg" width="40%" height="40%">

Sujeito 3
<img src="imagens/caltech/train/3/image_0048.jpg" width="40%" height="40%">

Sujeito 4
<img src="imagens/caltech/train/4/image_0070.jpg" width="40%" height="40%">

Sujeito 5
<img src="imagens/caltech/train/5/image_0091.jpg" width="40%" height="40%">

Sujeito 6
<img src="imagens/caltech/train/6/image_0114.jpg" width="40%" height="40%">

Sujeito 7
<img src="imagens/caltech/train/7/image_0139.jpg" width="40%" height="40%">

Sujeito 8
<img src="imagens/caltech/train/8/image_0197.jpg" width="40%" height="40%">

Sujeito 9
<img src="imagens/caltech/train/9/image_0243.jpg" width="40%" height="40%">

Sujeito 10
<img src="imagens/caltech/train/10/image_0429.jpg" width="40%" height="40%">

> Atenção: este notebook foi desenhado para funcionar no **Google Collab**. Se pretende executar localmente prefira a versão local deste notebook, sem o sufixo ```-collab```.

## 1. Requerimentos

### 1.1 Bibliotecas

Todas as bibliotecas já estão instaladas no Google Colab.

* OpenCV>=3.4.3
* Numpy>=1.18.1
* Matplotlib>=3.1.3

### 1.2 Arquivos

Baixe o repositório do GitHub utilizando o comando abaixo. Em caso de atualização, utilize o comando para apagar o diretório antes.

In [None]:
!rm -rf fiap-ml-visao-computacional/

In [None]:
!git clone https://github.com/michelpf/fiap-ml-visao-computacional

Vamos agora posicionar o diretório do repositório para a aula respectiva. Nesse caso envie o comando de mudança de diretório.

In [None]:
%cd fiap-ml-visao-computacional/aula-5-machine-learning-aplicado/desafio-1/

Importação das bibliotecas.

In [1]:
import cv2
from matplotlib import pyplot as plt
import numpy as np
import glob

## 2. Solução

### 2.1 Extração de região de interesse

Implementar extrator de face.

In [2]:
face_classifier = cv2.CascadeClassifier('classificadores/haarcascade_frontalface_default.xml')

# Extrator de faces
def face_extractor(img):
    try:
        gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
        faces = face_classifier.detectMultiScale(gray, 1.3, 5)

        if faces is ():
            return None

        for (x,y,w,h) in faces:
            cropped_face = img[y:y+h, x:x+w]
            
    except:
        return None

    return cropped_face

### 2.2 Normalização

Normalizar o tamanho das imagens em 200 x 200.

In [32]:
def normalizar_imagens(subject):
    list_files = []
    i = 1
    no_face = 0
    total = 0
    for file in glob.glob("imagens/caltech/train/"+str(subject)+"/*"):
        total+=1
        image = cv2.imread(file);
        face = face_extractor(image)
        if face is not None:
            image_norm = cv2.resize(face, (200, 200))
            image_norm = cv2.cvtColor(image_norm, cv2.COLOR_BGR2GRAY)
            file_name_path = "imagens/caltech/train/"+str(subject)+"/norm/"+str(i)+".png"
            cv2.imwrite(file_name_path, image_norm)
            list_files.append(file_name_path)
            i += 1
        else:
            no_face += 1
    print("Faces localizadas "+str(i) + "/" + str(total))
    return list_files

### 2.3 Treinamento

Carregando base de treinamento.

In [39]:
def treinamento():
    training_data, labels = [], []

    for subject in list(range(1,11)):
        print("Processando "+str(subject))
        files = normalizar_imagens(subject)

        # Lendo as imagens e associando a um label
        for i, file in enumerate(files):
            images = cv2.imread(file, cv2.IMREAD_GRAYSCALE)
            training_data.append(np.asarray(images, dtype=np.uint8))
            labels.append(subject)

    # Criando uma matriz da lista de labels
    labels = np.asarray(labels, dtype=np.int32)
    return training_data, labels

In [40]:
training_data, labels = treinamento()

Processando 1
Faces localizadas 16/16
Processando 2
Faces localizadas 15/15
Processando 3
Faces localizadas 17/17
Processando 4
Faces localizadas 16/16
Processando 5
Faces localizadas 17/17
Processando 6
Faces localizadas 15/15
Processando 7
Faces localizadas 16/16
Processando 8
Faces localizadas 16/16
Processando 9
Faces localizadas 17/17
Processando 10
Faces localizadas 17/17


In [41]:
labels

array([ 1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  2,  2,
        2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  3,  3,  3,  3,  3,
        3,  3,  3,  3,  3,  3,  3,  3,  3,  3,  3,  4,  4,  4,  4,  4,  4,
        4,  4,  4,  4,  4,  4,  4,  4,  4,  5,  5,  5,  5,  5,  5,  5,  5,
        5,  5,  5,  5,  5,  5,  5,  5,  6,  6,  6,  6,  6,  6,  6,  6,  6,
        6,  6,  6,  6,  6,  7,  7,  7,  7,  7,  7,  7,  7,  7,  7,  7,  7,
        7,  7,  7,  8,  8,  8,  8,  8,  8,  8,  8,  8,  8,  8,  8,  8,  8,
        8,  9,  9,  9,  9,  9,  9,  9,  9,  9,  9,  9,  9,  9,  9,  9,  9,
       10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10])

Treinamento do modelo

In [42]:
# Treinamento do modelo
model = cv2.face.LBPHFaceRecognizer_create()
model.train(np.asarray(training_data), labels)
print("Modelo treinado com sucesso.")

Modelo treinado com sucesso.


### 2.4 Validação dos resultados

Validar performance do modelo

In [48]:
i = 1
no_face = 0
for subject in list(range(1,11)):
    print("Analisando "+ str(subject))
    total = 0
    success = 0
    for file in glob.glob("imagens/caltech/val/"+str(subject)+"/*"):
        total += 1
        image = cv2.imread(file);
        face = face_extractor(image)
        if face is not None:
            image_norm = cv2.resize(face, (200, 200))
            image_norm = cv2.cvtColor(image_norm, cv2.COLOR_BGR2GRAY)
            results = model.predict(image_norm)
            info = str(results[0]) + " " + str(int(results[1]))+" pontos"
            print(info)
            if results[0] == subject:
                success += 1
        else:
            no_face += 1
    print("Faces localizadas "+str(success) + "/" + str(total)+ " "+str(float(success)*100/float(total)) + "%")

Analisando 1
1 34 pontos
1 36 pontos
1 37 pontos
1 38 pontos
1 47 pontos
Faces localizadas 5/5 100.0%
Analisando 2
2 38 pontos
2 36 pontos
2 39 pontos
2 40 pontos
2 39 pontos
Faces localizadas 5/5 100.0%
Analisando 3
3 35 pontos
3 37 pontos
3 37 pontos
3 36 pontos
3 37 pontos
Faces localizadas 5/5 100.0%
Analisando 4
4 34 pontos
4 33 pontos
4 34 pontos
4 33 pontos
4 36 pontos
Faces localizadas 5/5 100.0%
Analisando 5
5 36 pontos
5 35 pontos
5 35 pontos
5 37 pontos
2 70 pontos
Faces localizadas 4/5 80.0%
Analisando 6
6 32 pontos
6 29 pontos
6 34 pontos
6 36 pontos
6 31 pontos
Faces localizadas 5/5 100.0%
Analisando 7
7 36 pontos
7 40 pontos
7 36 pontos
7 37 pontos
7 36 pontos
Faces localizadas 5/5 100.0%
Analisando 8
8 41 pontos
8 36 pontos
8 36 pontos
8 38 pontos
8 36 pontos
Faces localizadas 5/5 100.0%
Analisando 9
9 37 pontos
9 36 pontos
9 33 pontos
9 38 pontos
9 36 pontos
Faces localizadas 5/5 100.0%
Analisando 10
10 35 pontos
10 33 pontos
10 34 pontos
10 36 pontos
10 35 pontos
Face