# MBA FIAP Inteligência Artificial & Machine Learning

## Visão Computacional: Análise de Imagens Médicas

> Atenção: este notebook foi desenhado para funcionar no **Google Collab**.


## 1. Introdução

Uma determinada fintech focada em consumidores finais pessoa física constataou um grande número de fraudes em transações bancárias.

O setor de fraudes apontou que existem clientes que se queixaram de não contratar serviços específicos, como o crédito pessoal, e após isso transferir para outras contas desconhecidas.

Após análises pelas equipes de segurança, os protocolos de utilização da senha foram realizados em conformidade, ou seja, cada cliente autenticou com sua própria senha de maneira regular.

Em função disso, o banco precisa arcar com reembolsos e medidas de contenção para evitar processos judiciais, pois os clientes alegam terem sido invadidos por hackers ou algo parecido.

Uma das formas de solucionar ou minimizar este problema é com a utilização de outras formas de autenticação, sobretudo em operações críticas, como a obtenção de crédito pessoal.

Desta forma podemos implementar uma verificação de identidade com prova de vida (liveness), que utilize uma verificação e identificação facial.

Caso o cliente não seja autenticado, ele será atendido por uma esteira dedicada e as evidências da não identificação serão encaminhadas para a área de IA para validação dos parâmetros e limiares para aperfeiçoamento do modelo.

Será necessário construir:

* Detector de faces
* Identificação de faces (podendo ser um comparador entre um rosto de documento e outra da prova de vida)
* Detecção de vivacidade (liveness) para evitar que um fraudador utilize uma foto estática.


>Formas alternativas de prover a identificação e prova de vivacidade, além destas que foram solicitadas poderão ser submetidas.


<p align="center">
    <img src="https://github.com/michelpf/fiap-ml-visao-computacional-detector-liveness/blob/master/notebook/imagens/liveness.jpg?raw=1">
</p>

Imagem retirada do [Grunge](https://www.grunge.com/192826/company-testing-robocop-facial-recognition-software-with-us-police/).

## 2. Instruções

Este projeto final tem como objetivo explorar os conhecimentos adquiridos nas aulas práticas.

Iremos constuir uma forma de validar se uma determinada imagem foi ou não adulterada e se trata de uma produção fraudade.

Existem diversas formas de validar a vivacidade, e neste sentido conto com a criatividade de vocês dado que já dominam encontrar uma face numa imagem, aplicar marcos faciais e até mesmo construir uma rede neural convulacional.

A abordagem mais simples é pela construção de uma rede neural com imagens de fotos de rostos de outras fotos e fotos de rostos sem modificações. Tal classificador deverá classificar se dada imagem possui vivacidade ou não com uma pontuação de probabilidade.

Referências que abordam o tema para servir de inspiração:

1. [PyImageSearch](https://pyimagesearch.com/2019/03/11/liveness-detection-with-opencv/), Liveness detection with OpenCV;
2. [Kickertech](https://kickertech.com/face-liveness-detection-via-opencv-and-tensorflow/), Liveness detection via OpenCV and Tensorflow.
3. [Towards Data Science](https://towardsdatascience.com/real-time-face-liveness-detection-with-python-keras-and-opencv-c35dc70dafd3?gi=24f8e1b740f9), Real-time face liveness detection with Python, Keras and OpenCV.

Este projeto poderá ser feita por grupos de até 4 pessoas.
Caso este projeto seja substitutivo, deverá ser realizado por apenas uma pessoa.

| Nome dos Integrantes     | RM             | Turma |
| :----------------------- | :------------- | :-----: |
| Pedro Ernesto            | RM 347938      | XIA |
| Tulio Vivaldini          | RM 348249      | XIA |
| Mayara Pardo Martins     | RM 347576      | XIA |
| Elton da Silva Pinheiro  | RM 348230      | XIA |

## 3. Abordagem e organização da solução do problema (2 pontos)

Como o grupo pretende deteccar a prova de vivacidade de uma determinada imagem? Quais os passos e os building blocks deste processo?

**Resposta**:

## 4 Desenvolvimento da solução (5,5 pontos)

Detalhe o passo-a-passo do algoritmo de deteção de vivacidade.
Se optar pela construção e treinamento de um modelo de redes neurais convulucionais, apresente a arquitetura, prepare os dados de treinamento, realize o treinamento.

### 4.1 Organização de dados para treinamento de modelo de liveness (2 pontos)

In [None]:
#IMPLEMENTAR
#Vamos ler os VIDEOS e separar em FRAMES PARA FAZER O LIVENESS
#SAO SEPARADOS APOS O CORTE DE FRAMES EM DUAS PASTAS   ----------IMAGENS_ML_VERDADEIRA E IMAGENS_ML_FALSAS

import os
import subprocess


def save_frames_every_second(video_path, output_directory):
    # Certifique-se de que o diretório de saída exista
    os.makedirs(output_directory, exist_ok=True)

    # Caminho completo para o executável do FFmpeg
    # Substitua pelo caminho real
    ffmpeg_executable = r'C:\Program Files (x86)\TubeDigger\ffmpeg.exe'

    # Use subprocess para chamar o comando ffmpeg e extrair frames a cada segundo
    command = [
        ffmpeg_executable,
        '-i', video_path,
        '-vf', 'fps=10000',
        os.path.join(output_directory, 'frame%d.jpg')
    ]
    subprocess.run(command)


# Exemplo de uso
video_path = "D:\FILME_ML/15_True.mp4"
output_directory = "E:\IMAGENS_ML_VERDADEIRA"
save_frames_every_second(video_path, output_directory)

### 4.2 Treinamento de modelo de liveness (1,5 pontos)

In [None]:
##ESSE TÓPICO ESTA JUNTO COM O PRÓXIMO QUE É O 4.3

### 4.3 Métricas de desempenho do modelo (2 pontos)

In [None]:
import os
import cv2
import numpy as np
from imutils import paths
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import accuracy_score
from tensorflow.keras.preprocessing.image import img_to_array
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.regularizers import l2

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.regularizers import l2
from tensorflow.keras.utils import to_categorical
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from imutils import paths
import cv2
import os
from tensorflow.keras.preprocessing.image import img_to_array
import numpy as np

# Função para carregar as imagens e rótulos


def load_images_and_labels(data_folder):
    image_paths = list(paths.list_images(data_folder))
    data = []
    labels = []

    for image_path in image_paths:
        label = image_path.split(os.path.sep)[-2]
        image = cv2.imread(image_path)
        image = cv2.resize(image, (32, 32))  # Ajuste conforme necessário
        image = img_to_array(image)
        data.append(image)
        labels.append(label)

    return np.array(data), np.array(labels)


# Carregar dados de faces reais e faces falsas
real_data, real_labels = load_images_and_labels('D:\IMAGENS_ML_VERDADEIRA')
fake_data, fake_labels = load_images_and_labels('D:\IMAGENS_ML_FALSA')

# Pré-processamento e divisão dos dados
data = np.vstack([real_data, fake_data])
labels = np.hstack([real_labels, fake_labels])
le = LabelEncoder().fit(labels)
labels = to_categorical(le.transform(labels))
(trainX, testX, trainY, testY) = train_test_split(
    data, labels, test_size=0.25, random_state=42)

# Verificar as dimensões dos dados
print("Dimensões dos dados de treinamento:", trainX.shape)
print("Dimensões dos dados de teste:", testX.shape)

# Inicializar o modelo
model = Sequential()

# Primeira camada convolucional
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
model.add(MaxPooling2D(2, 2))

# Segunda camada convolucional
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(2, 2))

# Terceira camada convolucional
model.add(Conv2D(128, (3, 3), activation='relu'))
model.add(MaxPooling2D(2, 2))

# Camada de achatamento (Flatten)
model.add(Flatten())

# Camada de dropout
model.add(Dropout(0.7))

# Camada densa com regularização L2
model.add(Dense(64, activation='relu', kernel_regularizer=l2(0.01)))

# Camada de saída
model.add(Dense(2, activation='softmax'))

# Compilar o modelo
model.compile(optimizer='adam', loss='binary_crossentropy',
              metrics=['accuracy'])

# Treinar o modelo
model.fit(trainX, trainY, epochs=5, batch_size=100,
          validation_data=(testX, testY))

# Avaliar a acurácia no conjunto de teste
predictions = model.predict(testX, batch_size=100)
predicted_labels = np.argmax(predictions, axis=1)
true_labels = np.argmax(testY, axis=1)
accuracy = accuracy_score(true_labels, predicted_labels)
print(f'Acurácia: {accuracy}')

## 5 Teste Fim-a-Fim

Simule a operação fim-a-fim, com uma imagem de entrada forjada (foto de foto de um rosto) e outra com uma imagem de rosto, exibindo o resultado da classificação e a pontuação de cada classe.

In [None]:
#IMPLEMENTAR
############# TESTE CLASSIFICADOR ##############################

from tensorflow.keras.preprocessing.image import load_img, img_to_array
import numpy as np

# Corrigir o caminho da imagem
# Substitua pelo caminho real da sua imagem
image_path = "D:\IMAGEM_ML_TESTE\michelzao.jpg"

# Mapear os rótulos de classe para nomes (verdadeira e falsa)
class_names = {0: 'Verdadeira', 1: 'Falso'}

# Carregar a imagem que você deseja testar
try:
    # Ajuste o tamanho conforme necessário
    img = load_img(image_path, target_size=(32, 32))
    img_array = img_to_array(img)
    # Adicionar dimensão extra para o batch
    img_array = np.expand_dims(img_array, axis=0)

    # Normalizar os valores dos pixels para estar no intervalo [0, 1]
    img_array /= 255.0

    # Fazer a previsão usando o modelo treinado
    predictions = model.predict(img_array)

    # Obter a classe prevista
    predicted_class = np.argmax(predictions)

    # Exibir a classe prevista, a probabilidade associada e o nome da classe
    print(f"Classe prevista: {predicted_class}")
    print(f"Probabilidade: {predictions[0][predicted_class]}")
    print(f"Classe: {class_names[predicted_class]}")

except FileNotFoundError:
    print(f"A imagem não foi encontrada no caminho especificado: {image_path}")
except Exception as e:
    print(f"Ocorreu um erro ao processar a imagem: {e}")

>Com a implementação da solução na forma de uma aplicação do [Streamlit](https://www.streamlit.io/) (veja a pata streamlit-app e use o template) vale 1 ponto adicional.

**Pergunta**: Se utilizou o Streamlit, compartilhe a URL do aplicativo publicado:

**Resposta**:

## 6 Conclusões (2,5 pontos)

**Pergunta**: Dado todo o estudo e pesquisa, quais foram as conclusões sobre a solução, o que funcionou, o que não funcionou e quais os detalhes que observariam numa nova versão e melhorias do processo?

**Resposta**: O devido exercício de pesquisa foi desafiador para o acadêmico, pois alem de realizar a divisão dos frames para ter várias imagens. Teve todo o entendimento sobre parte de redes neurais e seus desafios para ajustes. O que funcionou muito bem foi a utilização das redes simples, o que talvez faria sentido melhorar é utilizar redes recorrentes e fazer suas inferências para uma versão e melhoria do processo.