# Complemento 2: Series de Tiempo para Analizar y Predecir Casos COVID19
La idea de esta actividad es aplicar un modelo de series de tiempo para analizar y predecir el comportamiento del número de nuevos casos COVID19, según una muestra.

## Contexto: Análisis de Nuevos Casos COVID19

Como en la mayoría de los países donde se registran los nuevos contagios de COVID19, típicamente desde comienzos del 2020, el presente ejemplo utiliza datos de un país ficticio, cuyo comportamiento es tan irregular como la mayoría de los países.

**INSTRUCCIONES**

Todos los alumnos pueden utilizar las preguntas que se indican en las secciones de "Preguntas", más adelante, como ejercicio de comprensión del uso de Series de Tiempo. Se puede recurrir a ejercicios de otras fuentes, así como al material de clases.

Ejercicio complementario: sin nota.

## Instalación de Librerías de Funciones Necesarias

In [None]:
install.packages("lubridate")
install.packages("forecast")
install.packages("png")

## Determinación de Serie de Tiempo con los Datos

El primer paso consiste en leer y analizar la secuencia de la cifra semanal de (a) nuevos contagios COVID19 y (b) los nuevos fallecidos COVID19.

Esto se logra con simples instrucciones, donde se primero declaran las series de datos de cada uno de estos indicadores semanales y, a continuación, se construye una función que representa.

**Posible ejercicio**: cambiar los valores (magnitudes) de los 25 puntos de datos de cada serie y ver cómo se adapta la curva encontrada por la serie de tiempo.


In [None]:
nuevosContagios <- c(580, 7813, 28266, 59287, 75700,
                87820, 95314, 126214, 218843, 471497,
                936851, 1508725, 2072113, 353566, 282923,
                134566, 85670, 82344, 151299, 180565,
                199828, 135676, 221344, 389009, 489783
                )

fallecidos <- c(17, 270, 565, 1261, 2126,
            3285, 4628, 5951, 7283, 4721,
            8480, 5433, 4635, 3210, 3019,
            2893, 3810, 5502, 7823, 9938,
            11203, 7238, 4362, 2383, 1986)

# Declaración del nombre de archivo con gráficos a mostrar
png(file ="SerieDeTiempoMultivariada.png")

library(lubridate)  # Librería contiene función decimal_date()

# Creación de una Serie de Tiempo Multivariada
# usando la fecha 01-12-2022
mts <- ts(cbind(nuevosContagios, fallecidos),
start = decimal_date(ymd("2022-12-01")), frequency = 365.25 / 7)

# Despliegue del gráfico
plot(mts, xlab ="Suma Semanal",
    main ="Nuevos Casos COVID-19",
    col.main ="darkgreen")

# Guardar el archivo con el gráfico
dev.off()

# A continuación se muestra el gráfico
library(png)

img <- readPNG("SerieDeTiempoMultivariada.png")
grid::grid.raster(img)


## Predicción de Nuevos Valores

La predicción en el contexto de las series de tiempo también se conoce como pronóstico. El modelo de ST construido con los datos reconoce (aproxima) la progresión del valor Y en relación al eje T (tiempo) y, de tal forma, puede predecir el próximo número en una posición del eje T.

**Ejercicio 1**: cambiar entre la predicción para nuevos casos y la de fallecidos. Adicionalmente, cambiar los datos de las respectivas series (cambiar y volver a ejecutar bloque anterior) y determinar cómo cambia en la predicción de este bloque.

En particular, constestar las siguientes preguntas.

1.1.      ¿La nueva predicción de valores va en aumento/disminución y eso coincide con la serie analizada?

1.2.      ¿Hay una diferencia marcada en la predicción cuando se utiliza nuevosContagios en relación a utilizar fallecidos? ¿De haberla, cómo se cuantifica?

In [None]:
library(forecast)

# output to be created as png file
png(file ="SerieDeTiempoMultivariadaPred.png")

# Modelo de predicción usando un modelo ARIMA sobre la Serie de Tiempo Multi para nuevos casos
mts_casos <- ts(cbind(fallecidos), start = decimal_date(ymd("2022-03-01")), frequency = 365.25 / 7)
fit <- auto.arima(mts_casos)

# Predicción de los próximos 5 valores
prediccion <- forecast(fit, 4)

# Dibujo del gráfico con esos nuevos valores y un rango de variación esperable
plot(prediccion, xlab ="Datos Semanales",
ylab ="Nuevos Casos",
main ="COVID-19", col.main ="darkgreen")

# Guardar el archivo con el gráfico
dev.off()

prediccion

# A continuación se muestra el gráfico
library(png)

img <- readPNG("SerieDeTiempoMultivariadaPred.png")
grid::grid.raster(img)