In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import keras
import tensorflow as tf
from sklearn.preprocessing import MinMaxScaler #scaling de los datos entre 0 y 1
from sklearn.metrics import mean_squared_error

Using TensorFlow backend.


In [2]:
data_msal = 'Datos2/Covid19Casos.csv'
data_mobility = 'Datos2/Global_Mobility_Report.csv'

# funciones auxiliares (armadas para mi tesis)

In [54]:
def new_cases_per_day(fecha_sintomas,graph=False,ret=False):
    """
    args: 
    -fecha_sintomas: day of beginning of symptomps for each case, can't be NaN or NaT (already processed)
    -graph: defaults to False. if True, makes graph of new cases per day 
    -ret: defaults to False. if True, returns days-cases per day  np.array casos_por_dia
    given the days of beginning of symptoms, processes to get np.array of cases per day and days since epidemic
    can graph and return this vector with the defaults explained before
    latest update = checked the days again, it works perfectly splendid
    """
    counts = np.bincount(fecha_sintomas)
    ultima_fecha = max(fecha_sintomas)
    aux = range(ultima_fecha+1)
    casos_por_dia = np.vstack((aux,counts[aux])).T #(days since inicio_epidemia x (fecha_inicio_sintomas == days))
    if graph == True:
        plt.xlabel("Dia")
        plt.ylabel("Casos")
        plt.axvspan(ultima_fecha-10, ultima_fecha+3, facecolor='r', alpha=0.5,label="últimos 10 días")
        plt.plot(casos_por_dia[:,0],casos_por_dia[:,1],'-ob',label="casos hasta dia: "+str(ultima_fecha))
        plt.style.use('ggplot')
        plt.legend()
        #plt.savefig("casos_por_dia_bariloche.pdf")
    if ret == True:
        return casos_por_dia   

In [55]:
def cumulative_cases(fecha_sintomas,graph=False,ret=False):
    """
    args: 
    -fecha_sintomas: day of beginning of symptomps for each case, can't be NaN or NaT (already processed)
    -graph: defaults to False. if True, makes graph of new cases per day 
    -ret: defaults to False. if True, returns days-cumulative cases per day np array
    given the days of beginning of symptoms, processes to get np.array of cumulative cases per day and days since epidemic
    can graph and return this vector with the defaults explained before
    latest update = checked the days again, it works perfectly splendid
    """
    ultima_fecha = max(fecha_sintomas)
    casos_por_dia = new_cases_per_day(fecha_sintomas,ret=True)
    casos_acumulados_por_dia = np.copy(casos_por_dia)
    casos_acumulados_por_dia[:,1] = np.cumsum(casos_por_dia[:,1]) 
    if graph == True:
        plt.xlabel("Dia")
        plt.ylabel("Casos acumulados")
        plt.axvspan(ultima_fecha-10, ultima_fecha+3, facecolor='r', alpha=0.5,label="últimos 10 días")
        plt.scatter(casos_acumulados_por_dia[:,0],casos_acumulados_por_dia[:,1],c='b',label="casos acumulados hasta dia: "+str(ultima_fecha))
        plt.legend()
        plt.style.use('ggplot')
        plt.savefig("casos_acumulados_bariloche.pdf")
    if ret == True:
        return casos_acumulados_por_dia 

In [56]:
def change_dates(df):
    #changes fecha_inicio_sintomas according to new criteria
    filt_df1 = (df.fecha_inicio_sintomas.isnull()) #filter fecha_inicio_sintomas = inexistant
    df_sin_fecha = df.loc[filt_df1]
    n_size = df_sin_fecha.shape[0]
    df.loc[filt_df1,"fecha_inicio_sintomas"] = df.loc[filt_df1,"fecha_apertura"] - np.random.randint(0,9,n_size)

# ejercicio en si // trato de hacer todo primero para capital 

# primero manejo los datos de movilidad

In [3]:
data1 = pd.read_csv(data_mobility,sep=",",quotechar='"',dtype={'iso_3166_2_code':str},
                   parse_dates=["date"],na_values=['']) #data loading
df1 = pd.DataFrame(data1)

  interactivity=interactivity, compiler=compiler, result=result)


In [4]:
df1 = df1[df1.iso_3166_2_code == 'AR-C']

In [5]:
df1 = df1.drop(['country_region_code','country_region','sub_region_1','sub_region_2','metro_area','iso_3166_2_code','census_fips_code'],axis=1)

In [10]:
primer_dia = min(df1["date"])
df1 = df1.drop(['date'],axis=1)

# ahora manejo los datos del msal

In [49]:
data2 = pd.read_csv(data_msal,sep=",",quotechar='"',
                   parse_dates=["fecha_inicio_sintomas","fecha_apertura","fecha_internacion","fecha_cui_intensivo",
                               "fecha_fallecimiento","fecha_diagnostico","ultima_actualizacion"]
                    ,na_values=['']) #data loading

In [50]:
df2 = pd.DataFrame(data2)

In [51]:
df2 = df2[df2.residencia_provincia_nombre == 'CABA']

In [52]:
df2 = df2.drop(["id_evento_caso","sexo","edad","edad_años_meses","residencia_pais_nombre",
          "residencia_provincia_nombre","residencia_departamento_nombre",
         "carga_provincia_nombre","carga_provincia_id","origen_financiamiento",
         "residencia_provincia_id","residencia_departamento_id","ultima_actualizacion",
        "asistencia_respiratoria_mecanica","sepi_apertura"],axis=1)

In [53]:
df2

Unnamed: 0,fecha_inicio_sintomas,fecha_apertura,fecha_internacion,cuidado_intensivo,fecha_cui_intensivo,fallecido,fecha_fallecimiento,clasificacion,clasificacion_resumen,fecha_diagnostico
0,NaT,2020-06-01,NaT,NO,NaT,NO,NaT,Caso Descartado,Descartado,2020-06-09
6,2020-05-31,2020-06-01,NaT,NO,NaT,NO,NaT,Caso Descartado,Descartado,2020-06-01
8,NaT,2020-06-01,NaT,NO,NaT,NO,NaT,Caso confirmado por laboratorio - No activo (p...,Confirmado,2020-06-01
10,2020-05-26,2020-06-01,2020-05-31,NO,NaT,NO,NaT,Caso confirmado por laboratorio - No Activo po...,Confirmado,2020-05-31
13,2020-05-18,2020-06-01,NaT,NO,NaT,NO,NaT,Caso confirmado por laboratorio - No activo (p...,Confirmado,2020-06-01
...,...,...,...,...,...,...,...,...,...,...
3283418,2020-05-15,2020-06-01,NaT,NO,NaT,NO,NaT,Caso Descartado,Descartado,2020-06-01
3283422,NaT,2020-06-01,NaT,NO,NaT,NO,NaT,Caso Descartado,Descartado,2020-06-02
3283428,2020-05-28,2020-06-01,2020-05-31,NO,NaT,NO,NaT,Caso confirmado por laboratorio - No Activo po...,Confirmado,2020-06-01
3283433,NaT,2020-06-01,NaT,NO,NaT,NO,NaT,Caso Descartado,Descartado,2020-06-01


# primero lo convencional, casos en funcion del tiempo

# determinaciones en funcion del tiempo

# fallecimientos en funcion del tiempo