# Aplicando uma árvore de decisão sobre os dados de casos confirmados de COVID-19

### Importar as bibliotecas necessárias para a análise

In [None]:
import pandas as pd
import numpy  as np

from sklearn import model_selection as ms
from sklearn import tree
from sklearn.model_selection import cross_val_score
from sklearn.metrics import accuracy_score, confusion_matrix

### Importar o arquivo

In [None]:
dataFrameCasos = pd.read_csv('./Dados/CasosConfirmados.csv', sep=',')
dataFrameCasos.head()

In [None]:
df1 = dataFrameCasos.copy()

### Ajustar as variáveis que vão ser utilizadas como parâmetros

In [None]:
df1["SEXO"] = df1.SEXO.replace({
    'MASCULINO': 1,
    'FEMININO': 2,
    'NAO INFORMADO': 3
})

df1["COMORBIDADE"] = df1.COMORBIDADE.replace({
    'SIM': 1,
    'NAO': 2,
    'NAO INFORMADO': 3
})

df1["INTERNACAO"] = df1.INTERNACAO.replace({
    'SIM': 1,
    'NAO': 2,
    'NAO INFORMADO': 3
})

### Separar os dados entre parâmetros e resposta

In [None]:
X = df1[['SEXO', 'IDADE', 'COMORBIDADE']].copy()

Y = df1['INTERNACAO'].copy()

In [None]:
X.head()

In [None]:
Y.head()

### Gerar os dados de teste e treino

In [None]:
x_train, x_test, y_train, y_test = ms.train_test_split( X, Y, test_size=0.2, random_state=42 )

### Definir o modelo da árvore

In [None]:
clf = tree.DecisionTreeClassifier( random_state=1994,
                                   criterion='gini',
                                   max_depth=8
                                 )

### Mais alguns ajustes nas variáveis

In [None]:
x_train = x_train.fillna(x_train.mean())
x_test = x_test.fillna(x_test.mean())
X = X.fillna(X.mean())

### Aqui temos o treinamento do algorítimo e logo em seguida a previsão

In [None]:
arvore = clf.fit(x_train, y_train)

In [None]:
predict = arvore.predict(x_test)

### Agora vamos avaliar o modelo criado

In [None]:
scores_dt = cross_val_score(arvore, X, Y,
                            scoring='accuracy', cv=3)

print(scores_dt.mean())

In [None]:
accuracy_score(y_test, predict)*100

In [None]:
confusion_matrix(y_test, predict)