# MBA FIAP Inteligência Artificial & Machine Learning

## Visão Computacional: Análise de Imagens Médicas

> Atenção: este notebook foi desenhado para funcionar no **Google Collab**.


## 1. Introdução

Uma determinada fintech focada em consumidores finais pessoa física constataou um grande número de fraudes em transações bancárias.

O setor de fraudes apontou que existem clientes que se queixaram de não contratar serviços específicos, como o crédito pessoal, e após isso transferir para outras contas desconhecidas. 

Após análises pelas equipes de segurança, os protocolos de utilização da senha foram realizados em conformidade, ou seja, cada cliente autenticou com sua própria senha de maneira regular.

Em função disso, o banco precisa arcar com reembolsos e medidas de contenção para evitar processos judiciais, pois os clientes alegam terem sido invadidos por hackers ou algo parecido.

Uma das formas de solucionar ou minimizar este problema é com a utilização de outras formas de autenticação, sobretudo em operações críticas, como a obtenção de crédito pessoal.

Desta forma podemos implementar uma verificação de identidade com prova de vida (liveness), que utilize uma verificação e identificação facial. 

Caso o cliente não seja autenticado, ele será atendido por uma esteira dedicada e as evidências da não identificação serão encaminhadas para a área de IA para validação dos parâmetros e limiares para aperfeiçoamento do modelo.

Será necessário construir:

* Detector de faces
* Identificação de faces (podendo ser um comparador entre um rosto de documento e outra da prova de vida)
* Detecção de vivacidade (liveness) para evitar que um fraudador utilize uma foto estática.


>Formas alternativas de prover a identificação e prova de vivacidade, além destas que foram solicitadas poderão ser submetidas.


<p align="center">
    <img src="imagens/liveness.jpg">
</p>

Imagem retirada do [Grunge](https://www.grunge.com/192826/company-testing-robocop-facial-recognition-software-with-us-police/).

## 2. Instruções

Este projeto final tem como objetivo explorar os conhecimentos adquiridos nas aulas práticas.

Iremos constuir uma forma de validar se uma determinada imagem foi ou não adulterada e se trata de uma produção fraudade.

Existem diversas formas de validar a vivacidade, e neste sentido conto com a criatividade de vocês dado que já dominam encontrar uma face numa imagem, aplicar marcos faciais e até mesmo construir uma rede neural convulacional.

A abordagem mais simples é pela construção de uma rede neural com imagens de fotos de rostos de outras fotos e fotos de rostos sem modificações. Tal classificador deverá classificar se dada imagem possui vivacidade ou não com uma pontuação de probabilidade.

Referências que abordam o tema para servir de inspiração:

1. [PyImageSearch](https://pyimagesearch.com/2019/03/11/liveness-detection-with-opencv/), Liveness detection with OpenCV;
2. [Kickertech](https://kickertech.com/face-liveness-detection-via-opencv-and-tensorflow/), Liveness detection via OpenCV and Tensorflow.
3. [Towards Data Science](https://towardsdatascience.com/real-time-face-liveness-detection-with-python-keras-and-opencv-c35dc70dafd3?gi=24f8e1b740f9), Real-time face liveness detection with Python, Keras and OpenCV.

Este projeto poderá ser feita por grupos de até 4 pessoas.
Caso este projeto seja substitutivo, deverá ser realizado por apenas uma pessoa.

| Nome dos Integrantes        | RM            | Turma |
| :---------------------------| :------------ | :---: |
| Izabela Ramos Ferreira      | RM 352447     | 5DTSR |
| Kaique Vinicius Lima Soares | RM 351437     | 5DTSR |
| Walder Octacilio Garbellott | RM 352469     | 5DTSR |


## 3. Abordagem e organização da solução do problema (2 pontos)

Como o grupo pretende deteccar a prova de vivacidade de uma determinada imagem? Quais os passos e os building blocks deste processo?

**Resposta**: 


Para detectar a prova de vivacidade (liveness) de uma determinada imagem, utilizaremos uma abordagem baseada em aprendizado de máquina, especificamente com uma rede neural convolucional (CNN) para classificar as imagens como reais ou fraudulentas. A detecção de vivacidade é essencial para garantir que a imagem apresentada seja de uma pessoa viva e não uma tentativa de fraude utilizando fotos, vídeos ou máscaras.

### Passos e Building Blocks do Processo

#### 1. Coleta e Preparação dos Dados
- **Coleta de Dados:** Reunir um conjunto diversificado de imagens contendo rostos reais (de pessoas vivas) e imagens fraudulentas (como fotos de fotos, vídeos ou máscaras).
- **Pré-processamento:** Normalizar e padronizar as imagens, redimensionando para um tamanho uniforme (por exemplo, 224x224 pixels) e aplicando data augmentation (como rotação, espelhamento, e ajustes de brilho) para aumentar a robustez do modelo.
- **Divisão dos Dados:** Dividir o conjunto de dados em conjuntos de treinamento, validação e teste.

#### 2. Detector de Faces
- **Implementação:** Utilizar uma biblioteca como OpenCV, dlib ou MTCNN para detectar e extrair regiões de interesse (ROIs) contendo rostos nas imagens.
- **Extração de Faces:** Aplicar o detector de faces para isolar as faces das imagens coletadas, garantindo que apenas as áreas relevantes sejam usadas no treinamento do modelo.

#### 3. Extração de Características Faciais
- **Landmarks Faciais:** Utilizar técnicas de landmarks faciais para mapear pontos-chave no rosto, como olhos, nariz e boca.
- **Embeddings Faciais:** Gerar embeddings faciais usando redes neurais pré-treinadas como FaceNet ou VGGFace para representar características únicas de cada rosto.

#### 4. Construção do Modelo de Detecção de Vivacidade
- **Arquitetura da CNN:** Desenvolver uma rede neural convolucional (CNN) personalizada ou utilizar uma arquitetura pré-treinada (como ResNet, VGG ou MobileNet) para classificar as imagens.
- **Treinamento do Modelo:** Treinar a CNN com o conjunto de dados preparado, utilizando técnicas de data augmentation para melhorar a generalização do modelo.
- **Classificação de Vivacidade:** O modelo deverá classificar cada imagem com uma pontuação de probabilidade indicando a vivacidade (real ou fraudulenta).

#### 5. Avaliação e Ajuste do Modelo
- **Métricas de Avaliação:** Utilizar métricas como acurácia, precisão, recall e F1-score para avaliar o desempenho do modelo no conjunto de validação.
- **Ajuste de Hiperparâmetros:** Realizar tuning de hiperparâmetros (como taxa de aprendizado, número de camadas e neurônios) para otimizar o desempenho do modelo.
- **Fine-tuning:** Ajustar a rede neural pré-treinada (se utilizada) para adaptar melhor ao nosso conjunto de dados específico.

#### 6. Implementação e Integração
- **Sistema de Autenticação:** Integrar o modelo de detecção de vivacidade no sistema de autenticação da fintech.
- **Fluxo de Verificação:** Implementar um fluxo de verificação onde o modelo analisa a imagem apresentada durante o processo de autenticação e retorna uma decisão de vivacidade.

#### 7. Validação e Aprimoramento Contínuo
- **Monitoramento:** Monitorar o desempenho do sistema de detecção de vivacidade em ambiente de produção.
- **Feedback Loop:** Coletar feedback e dados adicionais para ajustar e melhorar continuamente o modelo.
- **Atualização do Modelo:** Realizar atualizações periódicas do modelo com novos dados e técnicas para garantir que o sistema permaneça eficaz contra novas tentativas de fraude.


In [None]:

## Demonstração

import cv2
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Carregar e pré-processar os dados
def load_and_preprocess_data(data_dir):
    datagen = ImageDataGenerator(rescale=1./255, validation_split=0.2)
    train_generator = datagen.flow_from_directory(
        data_dir,
        target_size=(224, 224),
        batch_size=32,
        class_mode='binary',
        subset='training'
    )
    validation_generator = datagen.flow_from_directory(
        data_dir,
        target_size=(224, 224),
        batch_size=32,
        class_mode='binary',
        subset='validation'
    )
    return train_generator, validation_generator

# Construção do modelo CNN
def build_model():
    model = Sequential([
        Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)),
        MaxPooling2D((2, 2)),
        Conv2D(64, (3, 3), activation='relu'),
        MaxPooling2D((2, 2)),
        Conv2D(128, (3, 3), activation='relu'),
        MaxPooling2D((2, 2)),
        Flatten(),
        Dense(128, activation='relu'),
        Dropout(0.5),
        Dense(1, activation='sigmoid')
    ])
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

# Diretório de dados
data_dir = 'path_to_your_dataset'

# Carregar os dados
train_generator, validation_generator = load_and_preprocess_data(data_dir)

# Construir o modelo
model = build_model()

# Treinar o modelo
history = model.fit(
    train_generator,
    epochs=10,
    validation_data=validation_generator
)

# Avaliar o modelo
loss, accuracy = model.evaluate(validation_generator)
print(f'Acurácia: {accuracy * 100:.2f}%')

# Salvar o modelo treinado
model.save('liveness_detection_model.h5')

## 4 Desenvolvimento da solução (5,5 pontos)

Detalhe o passo-a-passo do algoritmo de deteção de vivacidade.
Se optar pela construção e treinamento de um modelo de redes neurais convulucionais, apresente a arquitetura, prepare os dados de treinamento, realize o treinamento.

**resposta**

Passo 1: Coleta e Preparação dos Dados

Coleta de Dados: Reunir imagens contendo rostos reais e imagens fraudulentas (fotos de fotos, vídeos ou máscaras).
Pré-processamento: Redimensionar todas as imagens para 224x224 pixels e normalizá-las.
Data Augmentation: Aplicar técnicas de aumento de dados como rotação, espelhamento e ajustes de brilho para aumentar a robustez do modelo.

Divisão dos Dados: Dividir os dados em conjuntos de treinamento, validação e teste (80% treinamento, 10% validação, 10% teste).

Passo 2: Implementação do Detector de Faces

Utilização de Bibliotecas: Utilizar bibliotecas como OpenCV, dlib ou MTCNN para detectar faces nas imagens.
Extração de ROIs: Isolar e extrair as regiões contendo rostos nas imagens.

Passo 3: Extração de Características Faciais

Landmarks Faciais: Mapear pontos-chave no rosto (olhos, nariz, boca) utilizando técnicas de landmarks faciais.
Embeddings Faciais: Gerar embeddings faciais utilizando redes neurais pré-treinadas como FaceNet ou VGGFace.

Passo 4: Construção e Treinamento do Modelo de Redes Neurais Convolucionais (CNN)




In [None]:
# Arquitetura da CNN:

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

def build_model():
    model = Sequential([
        Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)),
        MaxPooling2D((2, 2)),
        Conv2D(64, (3, 3), activation='relu'),
        MaxPooling2D((2, 2)),
        Conv2D(128, (3, 3), activation='relu'),
        MaxPooling2D((2, 2)),
        Flatten(),
        Dense(128, activation='relu'),
        Dropout(0.5),
        Dense(1, activation='sigmoid')
    ])
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model


In [None]:
# Preparação dos Dados de Treinamento:

from tensorflow.keras.preprocessing.image import ImageDataGenerator

def load_and_preprocess_data(data_dir):
    datagen = ImageDataGenerator(rescale=1./255, validation_split=0.2)
    train_generator = datagen.flow_from_directory(
        data_dir,
        target_size=(224, 224),
        batch_size=32,
        class_mode='binary',
        subset='training'
    )
    validation_generator = datagen.flow_from_directory(
        data_dir,
        target_size=(224, 224),
        batch_size=32,
        class_mode='binary',
        subset='validation'
    )
    return train_generator, validation_generator


In [None]:
# Treinamento do Modelo:

# Diretório de dados
data_dir = ''

# Carregar os dados
train_generator, validation_generator = load_and_preprocess_data(data_dir)

# Construir o modelo
model = build_model()

# Treinar o modelo
history = model.fit(
    train_generator,
    epochs=10,
    validation_data=validation_generator
)


In [None]:
# Avaliação do Modelo:

loss, accuracy = model.evaluate(validation_generator)
print(f'Acurácia: {accuracy * 100:.2f}%')

In [None]:
# Salvar o modelo treinado
model.save('liveness_detection_model.h5')

### 4.1 Organização de dados para treinamento de modelo de liveness (2 pontos)

In [None]:
#IMPLEMENTAR
import cv2
import os

def resize_images(input_dir, output_dir, size=(224, 224)):
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
    for filename in os.listdir(input_dir):
        img = cv2.imread(os.path.join(input_dir, filename))
        if img is not None:
            resized_img = cv2.resize(img, size)
            cv2.imwrite(os.path.join(output_dir, filename), resized_img)

resize_images('path_to_raw_images/liveness', 'path_to_preprocessed_images/liveness')
resize_images('path_to_raw_images/fraudulent', 'path_to_preprocessed_images/fraudulent')


In [None]:
# Normalização das Imagens: Normalizar os valores dos pixels para o intervalo [0, 1].
from tensorflow.keras.preprocessing.image import ImageDataGenerator

datagen = ImageDataGenerator(rescale=1./255)

In [None]:
# Data Augmentation: Aplicar técnicas de data augmentation para aumentar a diversidade do conjunto de treinamento, como rotação, espelhamento, zoom e ajuste de brilho.

datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
)

# Estrutura de Diretórios: Organizar os dados em diretórios separados para treinamento, validação e teste.
# path_to_preprocessed_images/
#     liveness/
#         img1.jpg
#         img2.jpg
#         ...
#     fraudulent/
#         img1.jpg
#         img2.jpg
#         ...


In [None]:
# Treinamento, Validação e Teste: Dividir os dados em conjuntos de treinamento (80%), validação (10%) e teste (10%).

from sklearn.model_selection import train_test_split

liveness_images = os.listdir('path_to_preprocessed_images/liveness')
fraudulent_images = os.listdir('path_to_preprocessed_images/fraudulent')

# Criar listas de caminhos completos das imagens
liveness_images = ['path_to_preprocessed_images/liveness/' + img for img in liveness_images]
fraudulent_images = ['path_to_preprocessed_images/fraudulent/' + img for img in fraudulent_images]

# Combinar as listas e criar etiquetas
all_images = liveness_images + fraudulent_images
labels = [0] * len(liveness_images) + [1] * len(fraudulent_images)

# Dividir os dados
train_images, test_images, train_labels, test_labels = train_test_split(all_images, labels, test_size=0.2, random_state=42)
train_images, val_images, train_labels, val_labels = train_test_split(train_images, train_labels, test_size=0.1, random_state=42)

# Utilização do ImageDataGenerator: Usar o ImageDataGenerator para carregar e preparar os dados durante o treinamento.

train_datagen = ImageDataGenerator(rescale=1./255)
val_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
    'path_to_train_data',
    target_size=(224, 224),
    batch_size=32,
    class_mode='binary'
)

validation_generator = val_datagen.flow_from_directory(
    'path_to_validation_data',
    target_size=(224, 224),
    batch_size=32,
    class_mode='binary'
)

test_generator = test_datagen.flow_from_directory(
    'path_to_test_data',
    target_size=(224, 224),
    batch_size=32,
    class_mode='binary'
)


### 4.2 Treinamento de modelo de liveness (1,5 pontos)

In [None]:
#IMPLEMENTAR

### 4.3 Métricas de desempenho do modelo (2 pontos)

In [None]:
#IMPLEMENTAR

## 5 Teste Fim-a-Fim

Simule a operação fim-a-fim, com uma imagem de entrada forjada (foto de foto de um rosto) e outra com uma imagem de rosto, exibindo o resultado da classificação e a pontuação de cada classe.

In [None]:
#IMPLEMENTAR

>Com a implementação da solução na forma de uma aplicação do [Streamlit](https://www.streamlit.io/) (veja a pata streamlit-app e use o template) vale 1 ponto adicional.

**Pergunta**: Se utilizou o Streamlit, compartilhe a URL do aplicativo publicado:

**Resposta**:

## 6 Conclusões (2,5 pontos)

**Pergunta**: Dado todo o estudo e pesquisa, quais foram as conclusões sobre a solução, o que funcionou, o que não funcionou e quais os detalhes que observariam numa nova versão e melhorias do processo?

**Resposta**: