# Modelos de séries temporais do Covid-19

Francisco Rosa Dias de Miranda

PREDICT-ICMC

Universidade de São Paulo

In [None]:
import pandas as pd
from pycaret.time_series import *

## Leitura dos Dados

Vamos utilizar nesse exemplo uma amostra com 30.000 observações de pacientes internados no estado de São Paulo entre 28/02/2020 e 31/07/2021, já pré-processada. A proporção de óbitos no conjunto de dados está na proporção 70:30, para termos dados menos desbalanceados.

In [None]:
dados = pd.read_csv("https://github.com/predict-icmc/covid19/raw/master/leitura-dados/ae.csv")
dados.head()

In [None]:
# drop columns that are not needed
drop = ['Unnamed: 0','IGNORADO', 'INDEFINIDO', 'MASCULINO']
dados = dados.drop(drop, axis=1)

## Data splitting

Vamos dividir nossos dados em treino e teste, este último contendo 80% da amostra. Esse passo não é necessário, mas faremos para testar nosso classificador.

In [None]:
# split 20% of amos_aleat to test and 80% to train
test = dados.sample(frac=0.2, random_state=42)
train = dados.drop(dados.index)

## Definição dos atributos

O dicionário de dados para este conjunto pode ser encontrado em:

Utilizaremos os fatores de risco como variáveis categóricas e a idade como variável numérica.

Nossa variável resposta é `óbito`.

In [None]:
categorical = ['asma', 'cardiopatia', 'diabetes', 'doenca_hematologica', 'doenca_hepatica',
'doenca_neurologica', 'doenca_renal', 'imunodepressao', 'obesidade', 'outros_fatores_de_risco',
'pneumopatia','puerpera','sindrome_de_down', "FEMININO"]

numeric = ['idade']

## Setup

In [None]:
clf = setup(data = train, target='obito', test_data=test,
            categorical_features = categorical,
            numeric_features = numeric,
            remove_multicollinearity = True, 
            feature_selection = True,
            session_id = 4336)

## Comparando os modelos

In [None]:
compare_models()

## Criando modelo: regressão logística

In [None]:
lr = create_model('lr')

## Tunando o modelo de regressão logística

In [None]:
tuned_lr = tune_model(lr)
print(tuned_lr)

## Avaliando ao modelo

In [None]:
evaluate_model(tuned_lr)

## Previsões dentro da amostra de treino

In [None]:
predict_model(tuned_lr)

## Finalizando o modelo

In [None]:
final_tuned_lr = finalize_model(tuned_lr)
print(final_tuned_lr)

## Previsões na amostra de teste

In [None]:
unseen_predictions_ale = predict_model(final_tuned_lr, data=test)
unseen_predictions_ale.tail()

## Interpretar o modelo

In [None]:
interpret_model(final_tuned_lr)

## Referências


- **pycaret.org**. PyCaret, April 2020. URL https://pycaret.org/about. PyCaret version 1.0.0.
