# Algoritmo Vencedor - GaussianNB

### Imports necessários

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import classification_report
from sklearn.preprocessing import LabelEncoder, MinMaxScaler
import pandas as pd

### Leitura do arquivo

In [None]:
dados = pd.read_csv('Casos_e_obitos_ESP.csv', sep=';')

### Exclusão de linhas com valores faltantes

In [None]:
dados.dropna(inplace=True)

### Seleção de atributos (x) e variável alvo (y)

In [None]:
X = dados[['Asma', 'Cardiopatia', 'Data_Inicio_Sintomas', 'Diabetes', 'Diagnostico_Covid19', 'Doenca_Hematologica',
           'Doenca_Hepatica', 'Doenca_Neurologica', 'Doenca Renal', 'Genero', 'Idade', 'Imunodepressao', 'Municipio',
           'Obesidade', 'Outros_Fatores_De_Risco', 'Pneumopatia', 'Puérpera', 'Síndrome_De_Down']].copy()
y = dados['Obito'].copy()

### Inicialização de um codificador de rótulos

In [None]:
le = LabelEncoder()

### Normalização dos dados

In [None]:
for column in X.columns:
    if X[column].dtype == 'object':
        X[column] = le.fit_transform(X[column].astype(str))

In [None]:
scaler = MinMaxScaler()

In [None]:
X_normalizado = scaler.fit_transform(X)

### Divisão dos dados em treinamento e teste

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

### Instância do classificador Gaussian Naive Bayes

In [None]:
clf = GaussianNB()

### Treinamento do classificador

In [None]:
clf.fit(X_train, y_train)

### Previsões no conjunto de teste

In [None]:
y_pred = clf.predict(X_test)

### Criação de CSV com o relatório

In [None]:
report_dict = classification_report(y_test, y_pred, output_dict=True)
df = pd.DataFrame(report_dict).transpose()
df.to_csv('classification_report.csv', index=True)