# Tarea 2 MA-5701

Integrantes:

    - Sebastian Lopez
    - Kurt Walsen
    - Francisco Vásquez

# Previos

## Importación de Librerías

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.ticker as tick
import gurobipy as gb
import scipy.optimize as opti

from sklearn.metrics import mean_squared_error

## Parámetros Generales

In [None]:
pd.set_option('display.max_rows', 50)
pd.set_option('display.max_columns', 50)
pd.set_option('display.width', 50)

# Parámetros para gráficos
plt.style.use('seaborn')

plt.rcParams.update({'font.size': 25})      
plt.rc('axes', labelsize=20)
plt.rc('legend', fontsize=18)  
plt.rc('xtick', labelsize=20) 
plt.rc('ytick', labelsize=20) 
plt.rcParams['axes.titlesize'] = 25
plt.rcParams["figure.figsize"] = (15,6)

# Trabajo de Datos

## Importación

In [None]:
df = pd.read_csv('data/data_modificada.csv')

## Trabajo previo

In [None]:
df.head()

In [None]:
df.Fecha = pd.to_datetime(df.Fecha)
df = df.sort_values(by = 'Fecha')

# Visualizaciones

In [None]:
def plot_columna(columna):
    data = df.set_index('Fecha')[columna]
    
    fig, ax = plt.subplots()
    
    grafico = data.plot(kind = 'line', ax = ax,
                       style = '.-', linewidth = 2,
                       ms = 10)
    
    plt.gca().yaxis.set_major_formatter(tick.FuncFormatter(lambda x,y: str(int(x//1000)) + 'M' ))
    
    ax.set_ylabel('Cantidad de {}'.format(columna))
    ax.set_xlabel('Fecha')
    
    plt.title('Cantidad de {} por Fecha'.format(columna))
    plt.tight_layout()
    plt.savefig('graficos/graf_cantidad_{}_fecha.pdf'.format(columna.replace(' ','')),
               format = 'pdf',
               dpi = 600)
    plt.show()

In [None]:
plot_columna('Recuperados')

In [None]:
plot_columna('Casos Totales')

# Modelo

## Modelo Infectados General

In [None]:
def func_to_optimize_infectados(params):
    alpha = params[0]
    beta = params[1]
    sigma = params[2]
    
    val = 0
    
    for dia, n_infectados in enumerate(df['Casos Totales']):
        logit = (alpha)/(1 + beta * np.exp(-dia / sigma))
        val = val + np.power(n_infectados - logit, 2)
    
    return val

In [None]:
constraints_infectados = (#{'type': 'ineq',
               #'fun': lambda param: param[0]... >= 0},
              {'type': 'eq',
               'fun': lambda param: param[0] - 250000})
        
bnds_infectados = ((0, None), (0, None), (0, None))

x0_infectados_general = [1000000., 200., 10.]

In [None]:
mod_infectados_general = opti.minimize(fun = func_to_optimize_infectados,
                                       x0 = x0_infectados_general,
                                       bounds = bnds_infectados)

## Modelo Infectados Máximo 250M

In [None]:
x0_infectados_cota = [250000., 1000., 1000.]
mod_infectados_cota = opti.minimize(fun = func_to_optimize_infectados,
                               x0 = x0_infectados_cota,
                               constraints = constraints_infectados,
                                    bounds = bnds_infectados)

## Modelo Fallecidos General

In [None]:
def func_to_optimize_fallecidos(params):
    alpha = params[0]
    beta = params[1]
    sigma = params[2]
    
    val = 0
    
    for dia, n_infectados in enumerate(df['Fallecidos']):
        logit = (alpha)/(1 + beta * np.exp(-dia / sigma))
        val = val + np.power(n_infectados - logit, 2)
    
    return val

In [None]:
constraints_fallecidos = (#{'type': 'ineq',
               #'fun': lambda param: param[0]... >= 0},
              {'type': 'eq',
               'fun': lambda param: param[0] - 250000})
        
bnds_fallecidos = ((0, None), (0, None), (0, None))

x0_fallecidos_general = [1500., 50., 20.]

In [None]:
mod_fallecidos_general = opti.minimize(fun = func_to_optimize_fallecidos,
                                       x0 = x0_fallecidos_general,
                                       bounds = bnds_fallecidos)

# Resultados

## Auxiliar Predicciones

In [None]:
def predicciones(params, vec_dias):
    alpha = params[0]
    beta = params[1]
    sigma = params[2]
    
    fun = lambda t: (alpha)/(1 + beta * np.exp(-t / sigma))
    
    return list(map(fun, vec_dias))

In [None]:
def plot_diferencias(columna, predicciones, extra = False):
    dia = df['Dia']
    original = df[columna]
    
    fig, ax = plt.subplots()
    
    grafico_real = plt.scatter(dia, original, alpha = 0.8, s = 15, label = '{} Real'.format(columna),
                              c = 'green')
    
    grafico_predicciones = plt.plot(dia, predicciones, label = 'Predicción', c = 'royalblue')
    
    if columna == 'Fallecidos':
        plt.gca().yaxis.set_major_formatter(tick.FuncFormatter(lambda x,y: str(int(x)) ))
    else:
        plt.gca().yaxis.set_major_formatter(tick.FuncFormatter(lambda x,y: str(int(x//1000)) + 'M' ))
    
    ax.set_ylabel('Cantidad de {}'.format(columna))
    ax.set_xlabel('Día')
    
    plt.legend(loc=2)
    plt.tight_layout()
    
    if extra:
        plt.title('Predicción de {} por día, Máximo 250M'.format(columna))
        plt.savefig('graficos/graf_prediccion_{}_dia_250M.pdf'.format(columna.replace(' ','')),
               format = 'pdf',
               dpi = 600)      
    else:
        plt.title('Predicción de {} por día'.format(columna))
        plt.savefig('graficos/graf_prediccion_{}_dia.pdf'.format(columna.replace(' ','')),
               format = 'pdf',
               dpi = 600)
    plt.show()

In [None]:
def pred_largo_plazo(params, dias, columna, extra = False):
    # Generar predicciones
    pred = predicciones(params, range(1,dias+1))
    
    dia = df['Dia']
    original = df[columna]
    
    fig, ax = plt.subplots()
    
    grafico_real = plt.scatter(dia, original, alpha = 0.8, s = 15, label = '{} Real'.format(columna),
                              c = 'green')
    
    
    grafico_predicciones = plt.plot(range(1, dias+1), pred, label = 'Predicción', c = 'royalblue')
    
    
    if columna == 'Fallecidos':
        plt.gca().yaxis.set_major_formatter(tick.FuncFormatter(lambda x,y: str(int(x)) ))
    else:
        plt.gca().yaxis.set_major_formatter(tick.FuncFormatter(lambda x,y: str(int(x//1000)) + 'M' ))
    
    ax.set_ylabel('Cantidad de {}'.format(columna))
    ax.set_xlabel('Día')
    
    plt.legend(loc=2)
    plt.tight_layout()
    
    if extra:
        plt.title('Predicción de {} a {} dias, Máximo 250M'.format(columna, dias))
        plt.savefig('graficos/graf_prediccion_{}_a_{}_dias_250M.pdf'.format(columna.replace(' ',''), dias),
                   format = 'pdf',
                   dpi = 600)
    else:
        plt.title('Predicción de {} a {} dias'.format(columna, dias))
        plt.savefig('graficos/graf_prediccion_{}_a_{}_dias.pdf'.format(columna.replace(' ',''), dias),
                   format = 'pdf',
                   dpi = 600)
    plt.show()

## Predicciones Infectados General

In [None]:
print('Parámetros encontrados:\n Lambda: {} \n Beta: {} \n Sigma: {}'.format(mod_infectados_general.x[0],
                                                                            mod_infectados_general.x[1],
                                                                            mod_infectados_general.x[2]))

In [None]:
# Prediccion con los parámetros obtenidos de mod_infectados
total_pred = predicciones(mod_infectados_general.x, df['Dia'])

In [None]:
rmse_infectados = np.sqrt(mean_squared_error(df['Casos Totales'], total_pred))
print('El RMSE obtenido con las predicciones es de\n RMSE: {}'.format(rmse_infectados))

In [None]:
plot_diferencias('Casos Totales', total_pred)

In [None]:
pred_largo_plazo(mod_infectados_general.x, 200, 'Casos Totales')

## Predicciones Infectados Cota

In [None]:
print('Parámetros encontrados:\n Lambda: {} \n Beta: {} \n Sigma: {}'.format(mod_infectados_cota.x[0],
                                                                            mod_infectados_cota.x[1],
                                                                            mod_infectados_cota.x[2]))

In [None]:
# Prediccion con los parámetros obtenidos de mod_infectados
total_pred_cota = predicciones(mod_infectados_cota.x, df['Dia'])

In [None]:
rmse_infectados_cota = np.sqrt(mean_squared_error(df['Casos Totales'], total_pred_cota))
print('El RMSE obtenido con las predicciones es de\n RMSE: {}'.format(rmse_infectados_cota))

In [None]:
plot_diferencias('Casos Totales', total_pred_cota, extra = True)

In [None]:
pred_largo_plazo(mod_infectados_cota.x, 200, 'Casos Totales', extra = True)

## Predicciones Fallecidos

In [None]:
print('Parámetros encontrados:\n Lambda: {} \n Beta: {} \n Sigma: {}'.format(mod_fallecidos_general.x[0],
                                                                            mod_fallecidos_general.x[1],
                                                                            mod_fallecidos_general.x[2]))

In [None]:
# Prediccion con los parámetros obtenidos de mod_fallecidos
fallecidos_pred = predicciones(mod_fallecidos_general.x, df['Dia'])

In [None]:
rmse_fallecidos = np.sqrt(mean_squared_error(df['Fallecidos'], fallecidos_pred))
print('El RMSE obtenido con las predicciones es de\n RMSE: {}'.format(rmse_fallecidos))

In [None]:
plot_diferencias('Fallecidos', fallecidos_pred)

In [None]:
pred_largo_plazo(mod_fallecidos_general.x, 130, 'Fallecidos')