# MBA FIAP Inteligência Artificial & Machine Learning

## Visão Computacional: Análise de Imagens Médicas

> Atenção: este notebook foi desenhado para funcionar no **Google Collab**.


## 1. Introdução

Uma determinada fintech focada em consumidores finais pessoa física constataou um grande número de fraudes em transações bancárias.

O setor de fraudes apontou que existem clientes que se queixaram de não contratar serviços específicos, como o crédito pessoal, e após isso transferir para outras contas desconhecidas.

Após análises pelas equipes de segurança, os protocolos de utilização da senha foram realizados em conformidade, ou seja, cada cliente autenticou com sua própria senha de maneira regular.

Em função disso, o banco precisa arcar com reembolsos e medidas de contenção para evitar processos judiciais, pois os clientes alegam terem sido invadidos por hackers ou algo parecido.

Uma das formas de solucionar ou minimizar este problema é com a utilização de outras formas de autenticação, sobretudo em operações críticas, como a obtenção de crédito pessoal.

Desta forma podemos implementar uma verificação de identidade com prova de vida (liveness), que utilize uma verificação e identificação facial.

Caso o cliente não seja autenticado, ele será atendido por uma esteira dedicada e as evidências da não identificação serão encaminhadas para a área de IA para validação dos parâmetros e limiares para aperfeiçoamento do modelo.

Será necessário construir:

* Detector de faces
* Identificação de faces (podendo ser um comparador entre um rosto de documento e outra da prova de vida)
* Detecção de vivacidade (liveness) para evitar que um fraudador utilize uma foto estática.


>Formas alternativas de prover a identificação e prova de vivacidade, além destas que foram solicitadas poderão ser submetidas.


<p align="center">
    <img src="https://github.com/michelpf/fiap-ml-visao-computacional-detector-liveness/blob/master/notebook/imagens/liveness.jpg?raw=1">
</p>

Imagem retirada do [Grunge](https://www.grunge.com/192826/company-testing-robocop-facial-recognition-software-with-us-police/).

## 2. Instruções

Este projeto final tem como objetivo explorar os conhecimentos adquiridos nas aulas práticas.

Iremos constuir uma forma de validar se uma determinada imagem foi ou não adulterada e se trata de uma produção fraudade.

Existem diversas formas de validar a vivacidade, e neste sentido conto com a criatividade de vocês dado que já dominam encontrar uma face numa imagem, aplicar marcos faciais e até mesmo construir uma rede neural convulacional.

A abordagem mais simples é pela construção de uma rede neural com imagens de fotos de rostos de outras fotos e fotos de rostos sem modificações. Tal classificador deverá classificar se dada imagem possui vivacidade ou não com uma pontuação de probabilidade.

Referências que abordam o tema para servir de inspiração:

1. [PyImageSearch](https://pyimagesearch.com/2019/03/11/liveness-detection-with-opencv/), Liveness detection with OpenCV;
2. [Kickertech](https://kickertech.com/face-liveness-detection-via-opencv-and-tensorflow/), Liveness detection via OpenCV and Tensorflow.
3. [Towards Data Science](https://towardsdatascience.com/real-time-face-liveness-detection-with-python-keras-and-opencv-c35dc70dafd3?gi=24f8e1b740f9), Real-time face liveness detection with Python, Keras and OpenCV.

Este projeto poderá ser feita por grupos de até 4 pessoas.
Caso este projeto seja substitutivo, deverá ser realizado por apenas uma pessoa.

| Nome dos Integrantes     | RM            | Turma |
| :----------------------- | :------------ | :-----: |
| Marky Santana            | RM 348228     | 3DTSR |
| Guilherme Seganzerla     | RM 348256     | 3DTSR |
| Raphael Choi             | RM 348188     | 3DTSR |

## 3. Abordagem e organização da solução do problema (2 pontos)

Como o grupo pretende deteccar a prova de vivacidade de uma determinada imagem? Quais os passos e os building blocks deste processo?

**Resposta**:

...

Para nossa arquitetura vamos trabalhar com 3 blocos de reconhecimento nas imagens:

Utilizando uma imagem ou video >

###1º Treinaremos um modelo de CNN capaz de identificar rostos reais e rostos fakes.
Para este processo seguiremos:
- Preparamos um dataset proprietário com fotos dos integrantes do grupo e algumas fotos de sites separando 70% das imagens para treino e 30% para teste.
- Escolhemos o modelo "Keras" que irá aplicar algumas camadas de convolução, maxpooling, uma camada de flaten e uma saida de camada densa com ativação "sigmoid"
- Para as metricas do modelo serão utilizadas loss='binary_crossentropy', optimizer='adam', metrics='accuracy'
- O modelo será treinado em 25 épocas e esperamos uma acurácia superior a 80% dado nosso dataset.

###2º Iremos aplicar o modelo de reconhecimento de rostos.
Para este processo escolhemos o HAAR Cascade "haarcascade_frontalface_default.xml", pois o modelo já esta treinado para reconhecer faces em uma imagem. Alem de reconhecer um rosto, utilizaremos a biblioteca do CV2 para desenhar um retangulo em volta do rosto, assim facilitando a visualização.

###3º Como prova de vida "Liveness Detection" optamos por utilizar tambem o HAAR Cascade "haarcascade_smile.xml".
Será solicitado ao cliente que grave um video dele proprio sorrindo. Aplicaremos o reconhecimento de rostos para reduzir a área de busca e assim identificar se o rosto da imagem esta sorindo. Da mesma forma, aplicaremos bordas em volta do sorriso para melhor visualização do modelo aplicado.

## 4 Desenvolvimento da solução (5,5 pontos)

Detalhe o passo-a-passo do algoritmo de deteção de vivacidade.
Se optar pela construção e treinamento de um modelo de redes neurais convulucionais, apresente a arquitetura, prepare os dados de treinamento, realize o treinamento.

### 4.1 Organização de dados para treinamento de modelo de liveness (2 pontos)

Baixando o conteudo do Github para usar o dataset com as imagens para treinar o modelo e baixado bibliotecas que serão usado no modelo

In [1]:
!git clone https://github.com/choiback/computer_vision

Cloning into 'computer_vision'...
remote: Enumerating objects: 273, done.[K
remote: Counting objects: 100% (233/233), done.[K
remote: Compressing objects: 100% (218/218), done.[K
remote: Total 273 (delta 71), reused 103 (delta 13), pack-reused 40[K
Receiving objects: 100% (273/273), 37.14 MiB | 31.22 MiB/s, done.
Resolving deltas: 100% (76/76), done.


In [2]:
!pip install face_recognition

Collecting face_recognition
  Downloading face_recognition-1.3.0-py2.py3-none-any.whl (15 kB)
Collecting face-recognition-models>=0.3.0 (from face_recognition)
  Downloading face_recognition_models-0.3.0.tar.gz (100.1 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m100.1/100.1 MB[0m [31m5.9 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: face-recognition-models
  Building wheel for face-recognition-models (setup.py) ... [?25l[?25hdone
  Created wheel for face-recognition-models: filename=face_recognition_models-0.3.0-py2.py3-none-any.whl size=100566170 sha256=01f97200b3dafd5c00d8f4d1c1acbdb1cc55bcec94059493d36fdb4f2b663c5e
  Stored in directory: /root/.cache/pip/wheels/7a/eb/cf/e9eced74122b679557f597bb7c8e4c739cfcac526db1fd523d
Successfully built face-recognition-models
Installing collected packages: face-recognition-models, face_recognition
Successfully installed face-recognition-m

Importando as bibliotecas necessarias para rodar o modelo

In [3]:
import os
import cv2
import numpy as np

from PIL import Image
from tqdm import tqdm
from collections import defaultdict
from imutils.video import VideoStream
from keras.preprocessing import image
from keras.applications.imagenet_utils import preprocess_input
from keras.models import Sequential
from keras.layers import Conv2D
from keras.layers import AveragePooling2D, MaxPooling2D
from keras.layers import Flatten
from keras.layers import Dense, Dropout
from keras.models import model_from_json
from keras.preprocessing.image import ImageDataGenerator
from matplotlib import pyplot as plt

Criando função para detectar face no videos (video precisar ter 90% dos frames com uma face)

In [4]:
def detect_faces_in_video(video_path):
    face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')
    cap = cv2.VideoCapture(video_path)
    frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
    face_count = 0

    for _ in tqdm(range(frame_count)):
        ret, frame = cap.read()
        if not ret:
            break

        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

        if len(faces) > 0:
            face_count += 1

    cap.release()

    if face_count / frame_count >= 0.9:
        return True
    else:
        return False

Tratando e separando as imangens de treino e teste que o modelo irar usar para validar se é uma imagem fake ou não

In [5]:
IMG_SIZE = 24

def collect():
	train_datagen = ImageDataGenerator(
			rescale=1./255,
			shear_range=0.2,
			horizontal_flip=True,
		)

	val_datagen = ImageDataGenerator(
			rescale=1./255,
			shear_range=0.2,
			horizontal_flip=True,		)

	train_generator = train_datagen.flow_from_directory(
	    directory="/content/computer_vision/images/train",
	    target_size=(IMG_SIZE, IMG_SIZE),
	    color_mode="grayscale",
	    batch_size=32,
	    class_mode="binary",
	    shuffle=True,
	    seed=42
	)

	val_generator = val_datagen.flow_from_directory(
	    directory="/content/computer_vision/images/test",
	    target_size=(IMG_SIZE, IMG_SIZE),
	    color_mode="grayscale",
	    batch_size=32,
	    class_mode="binary",
	    shuffle=True,
	    seed=42
	)
	return train_generator, val_generator

### 4.2 Treinamento de modelo de liveness (1,5 pontos)

Função para salvar o modelo

In [6]:
def save_model(model):
	model_json = model.to_json()
	with open("model.json", "w") as json_file:
		json_file.write(model_json)
	# serialize weights to HDF5
	model.save_weights("model.h5")

Função para carregar o modelo

In [7]:
def load_model():
	json_file = open('model.json', 'r')
	loaded_model_json = json_file.read()
	json_file.close()
	loaded_model = model_from_json(loaded_model_json)
	# load weights into new model
	loaded_model.load_weights("model.h5")
	loaded_model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
	return loaded_model

Função que cria a estrutura com os parametros para treinar o modelo

In [8]:
def train(train_generator, val_generator):
	#STEP_SIZE_TRAIN=train_generator.n//train_generator.batch_size
	#STEP_SIZE_VALID=val_generator.n//val_generator.batch_size

	print('[LOG] Intialize Neural Network')

	model = Sequential()

	model.add(Conv2D(filters=32, kernel_size=(3, 3), activation='relu', input_shape=(IMG_SIZE,IMG_SIZE,1)))
	model.add(MaxPooling2D((2,2)))

	model.add(Conv2D(filters=64, kernel_size=(3, 3), activation='relu'))
	model.add(MaxPooling2D((2,2)))

	model.add(Conv2D(filters=128, kernel_size=(3, 3), activation='relu'))
	model.add(MaxPooling2D((2,2)))

	model.add(Flatten())

	model.add(Dense(units=512, activation='relu'))
	model.add(Dense(units=120, activation='relu'))
	model.add(Dense(units=60, activation='relu'))
	model.add(Dense(units=1, activation = 'sigmoid'))

	model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

	model.fit_generator(generator=train_generator,
	                    steps_per_epoch=1,
	                    validation_data=val_generator,
	                    validation_steps=1,
	                    epochs=25
	)

	save_model(model)
	return model

Função para dividir o video em frames e cada frame será analisado pelo modelo para validar se é ou não uma imagem fake (caso tenha 60% de frames não fake, então a função vai retorna que não é fake)

In [9]:
def process_video_frames(video_path):
    face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')
    cap = cv2.VideoCapture(video_path)
    frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
    person_count = 0

    for _ in tqdm(range(frame_count)):
        ret, frame = cap.read()
        if not ret:
            break

        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

        if len(faces) > 0:
            # Processar o frame como uma imagem para o modelo
            img = cv2.resize(gray, (IMG_SIZE, IMG_SIZE))
            img = np.array(img) / 255.0
            img = img.reshape(-1, IMG_SIZE, IMG_SIZE, 1)

            # Usar o modelo para prever se é uma pessoa ou não
            prediction = loaded_model.predict(img)
            if prediction > 0.5:  # Se a previsão for maior que 0.5, consideramos como uma pessoa
                person_count += 1

    cap.release()

    if person_count / frame_count >= 0.6:
        return "É uma pessoa."
    else:
        return "Enviar o caso para a analise."

Funções para identificar se tem alguma frame com a pessoa seria e depois sorrindo

In [29]:
def detect_smile(frame):
    smile_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_smile.xml')
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    smiles = smile_cascade.detectMultiScale(gray, scaleFactor=1.8, minNeighbors=20)
    return len(smiles) > 0

def validate_smile_frames(video_path):
    smile_detected = False
    no_smile_detected = False

    cap = cv2.VideoCapture(video_path)
    frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))

    for _ in tqdm(range(frame_count)):
        ret, frame = cap.read()
        if not ret:
            break

        if detect_smile(frame):
            smile_detected = True
        else:
            no_smile_detected = True

        if smile_detected and no_smile_detected:
            cap.release()
            return "Cadastro aceito."

    cap.release()
    return "Enviado para análise."

Treinado o modelo para verificar se é uma imagem fake ou não

In [None]:
train_generator, val_generator = collect()
model = train(train_generator, val_generator)

Found 24 images belonging to 2 classes.
Found 11 images belonging to 2 classes.
[LOG] Intialize Neural Network


  model.fit_generator(generator=train_generator,


Epoch 1/25
Epoch 2/25
Epoch 3/25
Epoch 4/25
Epoch 5/25
Epoch 6/25
Epoch 7/25
Epoch 8/25
Epoch 9/25
Epoch 10/25
Epoch 11/25
Epoch 12/25
Epoch 13/25
Epoch 14/25
Epoch 15/25
Epoch 16/25
Epoch 17/25
Epoch 18/25
Epoch 19/25
Epoch 20/25
Epoch 21/25
Epoch 22/25
Epoch 23/25
Epoch 24/25
Epoch 25/25


### 4.3 Métricas de desempenho do modelo (2 pontos)

Métricas do modelo

In [None]:
model.summary()

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d_9 (Conv2D)           (None, 22, 22, 32)        320       
                                                                 
 max_pooling2d_9 (MaxPoolin  (None, 11, 11, 32)        0         
 g2D)                                                            
                                                                 
 conv2d_10 (Conv2D)          (None, 9, 9, 64)          18496     
                                                                 
 max_pooling2d_10 (MaxPooli  (None, 4, 4, 64)          0         
 ng2D)                                                           
                                                                 
 conv2d_11 (Conv2D)          (None, 2, 2, 128)         73856     
                                                                 
 max_pooling2d_11 (MaxPooli  (None, 1, 1, 128)        

## 5 Teste Fim-a-Fim

Simule a operação fim-a-fim, com uma imagem de entrada forjada (foto de foto de um rosto) e outra com uma imagem de rosto, exibindo o resultado da classificação e a pontuação de cada classe.

In [30]:
if __name__ == '__main__':
    video_path = "/content/computer_vision/entrada/20240211_211634.mp4"
    if detect_faces_in_video(video_path):
        print("Rostos identificados no vídeo. Iniciando processamento...")
        loaded_model = load_model()
        result = process_video_frames(video_path)
        print(result)
        if result == "É uma pessoa.":
            validation_result = validate_smile_frames(video_path)
            print(validation_result)
    else:
        print("Rostos não identificados no vídeo.")

100%|██████████| 144/144 [01:35<00:00,  1.51it/s]


Rostos identificados no vídeo. Iniciando processamento...


  0%|          | 0/144 [00:00<?, ?it/s]



  1%|          | 1/144 [00:00<01:51,  1.28it/s]



  1%|▏         | 2/144 [00:01<01:39,  1.43it/s]



  2%|▏         | 3/144 [00:02<01:34,  1.50it/s]



  3%|▎         | 4/144 [00:02<01:32,  1.52it/s]



  3%|▎         | 5/144 [00:03<01:31,  1.53it/s]



  4%|▍         | 6/144 [00:04<01:30,  1.53it/s]



  5%|▍         | 7/144 [00:04<01:30,  1.52it/s]



  6%|▌         | 8/144 [00:05<01:29,  1.52it/s]



  6%|▋         | 9/144 [00:06<01:33,  1.44it/s]



  7%|▋         | 10/144 [00:07<01:47,  1.25it/s]



  8%|▊         | 11/144 [00:08<01:57,  1.14it/s]



  8%|▊         | 12/144 [00:09<01:53,  1.16it/s]



  9%|▉         | 13/144 [00:09<01:45,  1.24it/s]



 10%|▉         | 14/144 [00:10<01:38,  1.31it/s]



 10%|█         | 15/144 [00:11<01:35,  1.36it/s]



 11%|█         | 16/144 [00:11<01:32,  1.39it/s]



 12%|█▏        | 17/144 [00:12<01:29,  1.42it/s]



 12%|█▎        | 18/144 [00:13<01:27,  1.44it/s]



 13%|█▎        | 19/144 [00:13<01:26,  1.45it/s]



 14%|█▍        | 20/144 [00:14<01:24,  1.46it/s]



 15%|█▍        | 21/144 [00:15<01:23,  1.47it/s]



 15%|█▌        | 22/144 [00:15<01:23,  1.46it/s]



 16%|█▌        | 23/144 [00:16<01:22,  1.47it/s]



 17%|█▋        | 24/144 [00:17<01:22,  1.45it/s]



 17%|█▋        | 25/144 [00:17<01:22,  1.45it/s]



 18%|█▊        | 26/144 [00:18<01:20,  1.46it/s]



 19%|█▉        | 27/144 [00:19<01:30,  1.30it/s]



 19%|█▉        | 28/144 [00:20<01:40,  1.16it/s]



 20%|██        | 29/144 [00:21<01:44,  1.11it/s]



 21%|██        | 30/144 [00:22<01:35,  1.20it/s]



 22%|██▏       | 31/144 [00:22<01:28,  1.28it/s]



 22%|██▏       | 32/144 [00:23<01:23,  1.34it/s]



 23%|██▎       | 33/144 [00:24<01:20,  1.38it/s]



 24%|██▎       | 34/144 [00:24<01:17,  1.41it/s]



 24%|██▍       | 35/144 [00:25<01:16,  1.43it/s]



 25%|██▌       | 36/144 [00:26<01:15,  1.44it/s]



 26%|██▌       | 37/144 [00:26<01:13,  1.46it/s]



 26%|██▋       | 38/144 [00:27<01:12,  1.45it/s]



 27%|██▋       | 39/144 [00:28<01:12,  1.45it/s]



 28%|██▊       | 40/144 [00:28<01:11,  1.46it/s]



 28%|██▊       | 41/144 [00:29<01:10,  1.46it/s]



 29%|██▉       | 42/144 [00:30<01:10,  1.45it/s]



 30%|██▉       | 43/144 [00:31<01:09,  1.46it/s]



 31%|███       | 44/144 [00:31<01:12,  1.38it/s]



 31%|███▏      | 45/144 [00:33<01:24,  1.17it/s]



 32%|███▏      | 46/144 [00:34<01:29,  1.09it/s]



 33%|███▎      | 47/144 [00:34<01:24,  1.15it/s]



 33%|███▎      | 48/144 [00:35<01:18,  1.23it/s]



 34%|███▍      | 49/144 [00:36<01:13,  1.29it/s]



 35%|███▍      | 50/144 [00:36<01:10,  1.33it/s]



 35%|███▌      | 51/144 [00:37<01:08,  1.36it/s]



 36%|███▌      | 52/144 [00:38<01:06,  1.39it/s]



 37%|███▋      | 53/144 [00:38<01:04,  1.41it/s]



 38%|███▊      | 54/144 [00:39<01:03,  1.42it/s]



 38%|███▊      | 55/144 [00:40<01:02,  1.43it/s]



 39%|███▉      | 56/144 [00:41<01:01,  1.44it/s]



 40%|███▉      | 57/144 [00:41<01:00,  1.44it/s]



 40%|████      | 58/144 [00:42<00:59,  1.45it/s]



 41%|████      | 59/144 [00:43<00:58,  1.45it/s]



 42%|████▏     | 60/144 [00:43<00:58,  1.44it/s]



 42%|████▏     | 61/144 [00:44<01:00,  1.37it/s]



 43%|████▎     | 62/144 [00:45<01:09,  1.17it/s]



 44%|████▍     | 63/144 [00:46<01:13,  1.11it/s]



 44%|████▍     | 64/144 [00:47<01:09,  1.16it/s]



 45%|████▌     | 65/144 [00:48<01:04,  1.23it/s]



 46%|████▌     | 66/144 [00:48<01:00,  1.29it/s]



 47%|████▋     | 67/144 [00:49<00:57,  1.33it/s]



 47%|████▋     | 68/144 [00:50<00:55,  1.36it/s]



 48%|████▊     | 69/144 [00:51<00:54,  1.38it/s]



 49%|████▊     | 70/144 [00:51<00:53,  1.39it/s]



 49%|████▉     | 71/144 [00:52<00:51,  1.41it/s]



 50%|█████     | 72/144 [00:53<00:50,  1.42it/s]



 51%|█████     | 73/144 [00:53<00:49,  1.43it/s]



 51%|█████▏    | 74/144 [00:54<00:49,  1.42it/s]



 52%|█████▏    | 75/144 [00:55<00:48,  1.43it/s]



 53%|█████▎    | 76/144 [00:55<00:47,  1.43it/s]



 53%|█████▎    | 77/144 [00:56<00:46,  1.43it/s]



 54%|█████▍    | 78/144 [00:57<00:48,  1.36it/s]



 55%|█████▍    | 79/144 [00:58<00:54,  1.19it/s]



 56%|█████▌    | 80/144 [00:59<00:58,  1.09it/s]



 56%|█████▋    | 81/144 [01:00<00:56,  1.12it/s]



 57%|█████▋    | 82/144 [01:01<00:51,  1.21it/s]



 58%|█████▊    | 83/144 [01:01<00:48,  1.27it/s]



 58%|█████▊    | 84/144 [01:02<00:45,  1.31it/s]



 59%|█████▉    | 85/144 [01:03<00:43,  1.35it/s]



 60%|█████▉    | 86/144 [01:03<00:42,  1.38it/s]



 60%|██████    | 87/144 [01:04<00:41,  1.38it/s]



 61%|██████    | 88/144 [01:05<00:40,  1.39it/s]



 62%|██████▏   | 89/144 [01:05<00:39,  1.41it/s]



 62%|██████▎   | 90/144 [01:06<00:38,  1.41it/s]



 63%|██████▎   | 91/144 [01:07<00:37,  1.43it/s]



 64%|██████▍   | 92/144 [01:08<00:36,  1.43it/s]



 65%|██████▍   | 93/144 [01:08<00:35,  1.44it/s]



 65%|██████▌   | 94/144 [01:09<00:34,  1.45it/s]



 66%|██████▌   | 95/144 [01:10<00:35,  1.37it/s]



 67%|██████▋   | 96/144 [01:11<00:40,  1.18it/s]



 67%|██████▋   | 97/144 [01:12<00:43,  1.09it/s]



 68%|██████▊   | 98/144 [01:13<00:40,  1.14it/s]



 69%|██████▉   | 99/144 [01:13<00:36,  1.22it/s]



 69%|██████▉   | 100/144 [01:14<00:34,  1.29it/s]



 70%|███████   | 101/144 [01:15<00:32,  1.33it/s]



 71%|███████   | 102/144 [01:15<00:30,  1.37it/s]



 72%|███████▏  | 103/144 [01:16<00:29,  1.40it/s]



 72%|███████▏  | 104/144 [01:17<00:28,  1.42it/s]



 73%|███████▎  | 105/144 [01:18<00:27,  1.43it/s]



 74%|███████▎  | 106/144 [01:18<00:26,  1.45it/s]



 74%|███████▍  | 107/144 [01:19<00:25,  1.45it/s]



 75%|███████▌  | 108/144 [01:20<00:24,  1.45it/s]



 76%|███████▌  | 109/144 [01:20<00:23,  1.46it/s]



 76%|███████▋  | 110/144 [01:21<00:23,  1.45it/s]



 77%|███████▋  | 111/144 [01:22<00:22,  1.45it/s]



 78%|███████▊  | 112/144 [01:22<00:22,  1.44it/s]



 78%|███████▊  | 113/144 [01:23<00:25,  1.21it/s]



 79%|███████▉  | 114/144 [01:25<00:27,  1.11it/s]



 80%|███████▉  | 115/144 [01:25<00:25,  1.13it/s]



 81%|████████  | 116/144 [01:26<00:22,  1.22it/s]



 81%|████████▏ | 117/144 [01:27<00:20,  1.29it/s]



 82%|████████▏ | 118/144 [01:27<00:19,  1.34it/s]



 83%|████████▎ | 119/144 [01:28<00:18,  1.38it/s]



 83%|████████▎ | 120/144 [01:29<00:16,  1.42it/s]



 84%|████████▍ | 121/144 [01:29<00:16,  1.44it/s]



 85%|████████▍ | 122/144 [01:30<00:15,  1.44it/s]



 85%|████████▌ | 123/144 [01:31<00:14,  1.45it/s]



 86%|████████▌ | 124/144 [01:31<00:13,  1.45it/s]



 87%|████████▋ | 125/144 [01:32<00:13,  1.46it/s]



 88%|████████▊ | 126/144 [01:33<00:12,  1.47it/s]



 88%|████████▊ | 127/144 [01:33<00:11,  1.47it/s]



 89%|████████▉ | 128/144 [01:34<00:10,  1.47it/s]



 90%|████████▉ | 129/144 [01:35<00:10,  1.48it/s]



 90%|█████████ | 130/144 [01:36<00:10,  1.32it/s]



 91%|█████████ | 131/144 [01:37<00:11,  1.17it/s]



 92%|█████████▏| 132/144 [01:38<00:10,  1.10it/s]



 92%|█████████▏| 133/144 [01:39<00:09,  1.19it/s]



 93%|█████████▎| 134/144 [01:39<00:07,  1.26it/s]



 94%|█████████▍| 135/144 [01:40<00:06,  1.31it/s]



 94%|█████████▍| 136/144 [01:41<00:05,  1.35it/s]



 95%|█████████▌| 137/144 [01:41<00:05,  1.38it/s]



 96%|█████████▌| 138/144 [01:42<00:04,  1.40it/s]



 97%|█████████▋| 139/144 [01:43<00:03,  1.42it/s]



 97%|█████████▋| 140/144 [01:43<00:02,  1.44it/s]



 98%|█████████▊| 141/144 [01:44<00:02,  1.43it/s]



 99%|█████████▊| 142/144 [01:45<00:01,  1.44it/s]



 99%|█████████▉| 143/144 [01:45<00:00,  1.45it/s]



100%|██████████| 144/144 [01:46<00:00,  1.35it/s]


É uma pessoa.


  1%|          | 1/144 [00:00<01:38,  1.45it/s]

Cadastro aceito.





>Com a implementação da solução na forma de uma aplicação do [Streamlit](https://www.streamlit.io/) (veja a pata streamlit-app e use o template) vale 1 ponto adicional.

**Pergunta**: Se utilizou o Streamlit, compartilhe a URL do aplicativo publicado:

**Resposta**:

## 6 Conclusões (2,5 pontos)

**Pergunta**: Dado todo o estudo e pesquisa, quais foram as conclusões sobre a solução, o que funcionou, o que não funcionou e quais os detalhes que observariam numa nova versão e melhorias do processo?

**Resposta**:

É possível concluir que tanto a prova de vida, quanto a detecção rostos ou parte do rosto em uma imagem ou video, é possível utilizando alguns recursos atraves de bibliteca como CV2, Keras e modelos como haarcascade, implementando em soluções reais, para solucionar risco previnindo possiveis fraudes.

O que funcionou: Tivemos sucesso no treinamento do modelo para identificar o rosto real de um rosto fake e a validação dos modelos de rosto e sorriso.

O que não funcionou: Apresentar em tempo real as sequencias de imagens do video, com a aplicação da identificação das área dos rostos e sorrisos, apresentado para o cliente a execução do processo de seu video.

Melhorias:
- Otimizar o código para rodar em tempo real.
- Adicionar mais validações como os olhos piscando.