***
# `Project:` Prevendo a Ocorrências de Crises Epiléticas

## `Date:` dezembro, 2021

## `Data Scientist:` Walter Trevisan
***

## `Deploy do Modelo Preditivo`

Nesta etapa, vamos utilizar o **modelo preditivo escolhido** para prever se **novos pacientes** terão (ou não) crises epiléticas de acordo com as informações obtidas no resultado do exame **EEG**.

Então, neste etapa vamos realizar as seguintes atividades:

1. Carregar os dados de um **novo paciente**;

2. Preparar os dados do **novo paciente**;

3. Prever se o novo paciente terá (ou não) uma crise epilética;

4. Conclusão final.

## Setup:

Primeiro, vamos carregar os **pacotes e funções** que serão utilizadas neste **notebook**.

In [1]:
# As novas versões do Pandas e Matplotlib trazem diversas mensagens de aviso ao desenvolvedor.
# Então, vamos desativar essas mensagens.
import sys # O pacote "sys" permite manipulações com o sistema operacional:
import os  # Operation System (Packages and Functions)
import warnings
if not sys.warnoptions:
    warnings.simplefilter("ignore")
warnings.simplefilter(action='ignore', category=FutureWarning)
warnings.filterwarnings("ignore", category=FutureWarning)

# Importa função para verificarmos a versão da linguagem python:
from platform import python_version

# Importando os pacote NumPy:
import numpy as np
# Importando os pacote Pandas:
import pandas as pd

# Definindo o diretório raiz (Root) onde serão armazenados todas as informações
# (Imagens, Gráficos, Objetos, Dados, Modelos de ML, etc...) do projeto.
# Diretório Raiz (Root) do Projeto:
ROOT_DIR = "."

# Path: onde ficarão armazenados os "Objetos" (Estrututras de Dados) relacionados ao Projeto:
OBJ_PATH = os.path.join(ROOT_DIR, "objects")
# Criando o diretório, se ele não existir:
os.makedirs(OBJ_PATH, exist_ok=True)

# Path: onde ficarão armazenados os "datasets" (arquivos "csv") e os "objetos" (Data Frames) do Projeto:
DATA_PATH = os.path.join(ROOT_DIR, "data")
# Path do arquivo "csv" que contém o conjunto de dados do Projeto:
DATA_FILE_PATH = os.path.join(DATA_PATH, "novo_paciente.csv")
# Criando o diretório, se ele não existir:
os.makedirs(DATA_PATH, exist_ok=True)

# Path: onde serão armazenadas as "Imagens" (Figuras e Gráficos) do Projeto:
GRAPHICS_PATH = os.path.join(ROOT_DIR, "images", "graphics")
# Criando o diretório, se ele não existir:
os.makedirs(GRAPHICS_PATH, exist_ok=True)

# Path: onde ficarão armazenados os "Modelos Preditivos" (Machine Learning) relacionados ao Projeto:
ML_PATH = os.path.join(ROOT_DIR, "models")
# Criando o diretório, se ele não existir:
os.makedirs(ML_PATH, exist_ok=True)

# Path: onde estão armazenadas as classes e funções que serão utilizadas neste notebook:
LIB_PATH = os.path.join(ROOT_DIR, "library")

# Adicionando o diretório "./library" ao 'path' do Sistema, para podermos importar classes e funções que serão
# utilizadas neste notebook:
sys.path.append(LIB_PATH)

# Importando para este notebook, as classes e funções definidas no módulo "data_science_library.py":
import data_science_library as dslib

print("Setup Complete!")

Setup Complete!


In [2]:
# Versões dos pacotes usados neste jupyter notebook:
print("Versões dos pacotes usados neste jupyter notebook:")
print("Python      : {}".format(python_version()))
print("Numpy       : {}".format(np.__version__))
print("Pandas      : {}".format(pd.__version__))

Versões dos pacotes usados neste jupyter notebook:
Python      : 3.7.11
Numpy       : 1.21.2
Pandas      : 1.3.4


## 1- Carregar os dados de um novo paciente

In [3]:
# Carregando o arquivo "novo_paciente.csv" com dados do "novo paciente":
df_data = pd.read_csv(filepath_or_buffer=DATA_FILE_PATH)
# Visualizando os primeiros registros:
df_data.head()

Unnamed: 0,X1,X2,X3,X4,X5,X6,X7,X8,X9,X10,...,X169,X170,X171,X172,X173,X174,X175,X176,X177,X178
0,51,43,34,21,13,12,6,4,1,-4,...,-41,-16,2,22,33,45,56,67,69,63


Os dados acima representam os valores obtidos no exame **EEG** do **novo paciente**.

## 2- Preparar os dados do novo paciente

Então, vamos normalizar os dados utilizando o objeto **`scaler`** que foi criado na versão **`v1`** do modelos preditivos.

In [4]:
# Carregando o objeto "scaler" para normalizar as variáveis preditoras:
scaler = dslib.pickle_object_load(
    path=OBJ_PATH, file="scaler_v1.pck",
    msg="O arquivo 'scaler_v1.pck' (data frame) foi carregado com sucesso!"
)

O arquivo 'scaler_v1.pck' (data frame) foi carregado com sucesso!


In [5]:
# Normalizando os dados de entrada:
data_scaled = scaler.transform(df_data.values)
# Visualizando alguns valores:
data_scaled[0,:20]

array([ 0.37820799,  0.32428482,  0.26888417,  0.184615  ,  0.12757652,
        0.11499579,  0.07422715,  0.06258713,  0.04391695,  0.01114486,
       -0.0465725 , -0.09363213, -0.11746084, -0.11128414, -0.0786593 ,
       -0.06016294, -0.06322109, -0.07841982, -0.05706792, -0.04746901])

## 3- Prever se o novo paciente terá (ou não) uma crise epilética

Para fazer a previsão vamos utilizar o **melhor modelo preditivo** que foi escolhido na etapa de *machine learning*.

In [6]:
# Carregando o melhor modelo preditivo escolhido ("rfc_best_modelo_v1.pck"):
best_model = dslib.pickle_object_load(
    path=ML_PATH, file="rfc_best_model_v1.pck",
    msg="O arquivo 'rfc_best_model_v1.pck' (modelo 'RFC') foi carregado com sucesso!"
)

O arquivo 'rfc_best_model_v1.pck' (modelo 'RFC') foi carregado com sucesso!


In [7]:
# Fazendo a previsão:
prob = best_model.predict_proba(data_scaled)
result = best_model.predict(data_scaled)

In [8]:
# Print dos resultados:
print("Probabilidade do novo paciente não ter uma crise epilética:{}%".format(prob[0,0]*100))
print("Probabilidade do novo paciente ter uma crise epilética:{}%".format(prob[0,1]*100))
print("Categoria prevista pelo modelo:{}".format(result[0]))

Probabilidade do novo paciente não ter uma crise epilética:100.0%
Probabilidade do novo paciente ter uma crise epilética:0.0%
Categoria prevista pelo modelo:0


**Análise:** de acordo com os resultados do exame **EEG*, o **novo paciente não terá uma crise epilética!**

## 4- Conclusão final

Portanto, o modelo preditivo criado atende de forma satisfatória o problema de negócio para o qual ele foi criado, ou seja, se o modelo preditivo for colocado em produção para prever se um paciente terá (ou não) uma crise epilética, poderemos esperar que ele tenha um bom desempenho.

## <font color='black'>FIM</font>