In [1]:
from matplotlib import pyplot as plt
import pandas as pd

### Visualização de Dados Faltosos

In [2]:
def visualizarQntFaltosos(covidData):
    faltantes = covidData.isnull().sum()
    faltantes_percentual = (covidData.isnull().sum() / len(covidData['source_id'])) * 100
    return faltantes_percentual
    
def plotarQntFaltosos(dados):
    nomes = dados.index
    valores = dados.values
    plt.barh(nomes, valores)
    plt.show

### Pré-processamento -- Classificação Final

```Descartado, Confirmado [Laboratorial, Clínico-Epidemiológico, Critério Clínico] e  Síndrome Gripal Não Especificada```

In [3]:
# Remover os dados faltosos da coluna ClassificacaoFinal
def __classFinRemoverFaltos__(covidData, classificacao):
    atributosVazios = covidData.loc[covidData[classificacao].isnull()]
    covidData = covidData.drop(atributosVazios.index)
    return covidData

# Agrupar as instâncias confirmadas
def __classFinAgruparConfirmados__(covidData, classificacao):
    covidData.loc[covidData[classificacao].str.contains(pat = 'Confirmado'), [classificacao]] = 'Confirmado';
    return covidData

# Remover os dados diferentes de confirmados
def __classFinRemoverOutliers__(covidData, classificacao):
    dadosNaoConfirmados = covidData.loc[((covidData[classificacao] != 'Confirmado'))]
    covidData = covidData.drop(dadosNaoConfirmados.index)
    return covidData

In [4]:
# Pré-processamento Geral
def classFinPreprocessamento(covidData, alvo):
    covidData = __classFinRemoverFaltos__(covidData, alvo)
    covidData = __classFinAgruparConfirmados__(covidData, alvo)
    covidData = __classFinRemoverOutliers__(covidData, alvo)
    return covidData

### Pré-processamento -- Evolução

``` Pode conter (Cancelado, Cura, Ignorado, Em tratamento domiciliar, Óbito, Internado, Internado em UTI ```

In [5]:
# Remover os dados faltosos da coluna Evolução
def __evolucaoRemoverFaltosos__(covidData, evolucao):
    atributosVazios = covidData.loc[covidData[evolucao].isnull()]
    covidData = covidData.drop(atributosVazios.index)
    return covidData

# Remover instâncias com valores Cancelado ou Ignorado
def __evolucaoRemoverCanceladoIgnorado__(covidData, evolucao):
    dadosIgnoradosCancelados = covidData.loc[((covidData[evolucao] == 'Ignorado') | 
                                              (covidData[evolucao] == 'Cancelado'))]
    covidData = covidData.drop(dadosIgnoradosCancelados.index)
    return covidData

# Agrupar as instâncias de Internação
def __evolucaoAgruparInternados__(covidData, evolucao):
    covidData.loc[covidData[evolucao] == 'Internado em UTI', [evolucao]] = 'Internado';
    return covidData

# Agrupar as instâncias Curadas
def __evolucaoAgruparCurados__(covidData, evolucao):
    covidData.loc[covidData[evolucao] == 'Em tratamento domiciliar', [evolucao]] = 'Cura';
    return covidData

In [6]:
# Pré-processamento Geral
def evolucaoPreprocessamento(covidData, alvo):
    covidData = __evolucaoRemoverFaltosos__(covidData, alvo)
    covidData = __evolucaoRemoverCanceladoIgnorado__(covidData, alvo)
    covidData = __evolucaoAgruparInternados__(covidData, alvo)
    covidData = __evolucaoAgruparCurados__(covidData, alvo)
    return covidData

### Pré-processamento -- Sintomas

In [7]:
# Pré-processamento Geral

descricaoSintomas = {"assintomatico": 'Assintomático', 
                     "febre": 'Febre', 
                     "dorDeGarganta": 'Dor de Garganta', 
                     "dispneia": 'Dispneia', 
                     "tosse": 'Tosse', 
                     "coriza": 'Coriza', 
                     "dorDeCabeca": 'Dor de Cabeça', 
                     "disturbiosGustatorios": 'Distúrbios gustatórios', 
                     "disturbiosOlfativos": 'Distúrbios olfativos'}

def sintomasPreprocessamento(covidData, sintomas):
    for chave in descricaoSintomas.keys():
        covidData[chave] = covidData[sintomas].apply(lambda x: 1 if descricaoSintomas[chave] in x else 0)
    return covidData

### Pré-processamento -- Comorbidades