In [1]:
from IPython.core.display import display, HTML
display(HTML("<style>.container { width:95% !important; }</style>"))

# Practica 3 (10%) - Práctica de manejo de módulos y funciones 

#### Integrantes:
- Mauricio Ríos Hernández
- Emanuel Peña Rojas
- Juliet Muñoz García

#### Esquema solución del problema.

<img src="images/esquema.png" width=500 height=250>

#### Diagrama de flujo resumido. 

<img src="images/diagrama.png" width=500 height=250>

#### Importamos librerías útiles.

In [2]:
import pandas as pd
import numpy as np
import plotly.graph_objects as go
# La librería plotly permite realizar gráficas de manera muy versatil puesto que se pueden varíar muchos elementos de las figura.

from ipywidgets import widgets,interact,Layout # widgets sirve para crear figuras para interactuar con el usuario.
                                               # interact permite que determinado subprograma se ejecute continuamente sin la necesidad
                                               # la celda cada vez que los widgets varíen
                                            
from datetime import datetime, timedelta 
#la librería datetime sirve para la manipulación de fechas y datos de diferentes formas
#la función datetime permite transformar un vector de números en fechas como cadena de caracteres. 
#la función deltatime sirve para expresar la diferencia entre dos datos de tiempo.

from plotly.subplots import make_subplots
# El módulo make_subplots permite organizar gráficos en forma de matriz, es decir, en filas y columnas.

from scipy.signal import savgol_filter
# Módulo para suavizar curvas.

## 1. Creación de variables, funciones y objetos.

#### Carga de archivos.

In [3]:
data = pd.read_excel('data/owid-covid-data.xlsx') # Guardamos la base de datos del COVID-19 en DataFrame.
data_country_iso_code = pd.read_excel('data/coutry_iso_code.xlsx') # Guardamos la lista en excel de los códigos ISO de cada país en un df.

# Creamos un df que contega: Código ISO 3166-1 como índice y como columna el país respectivo,puesto que en la BD del COVID 19
#ese es el iso usado.
data_country_iso = pd.DataFrame(columns=['Nombre del país'], index = data_country_iso_code['ISO 3166-1 .1']) 
data_country_iso['Nombre del país'] = list(data_country_iso_code['Nombre del país'])                         

#### Creamos lista de fechas.

In [4]:
fecha_inicio = datetime(2019,12,31)
fecha_fin= datetime(2020,7,1)
#fecha_fin = date.today() si la base de datos se acualizara automaticamente se podría usar este código para que se consultase la fecha del día que se ejecute el cuarderno

# Es necesario llevar los datos tipo datetime a la forma Y-m-d puesto que en la BD del COVID 19 ese es el formato usado.
list_date = [(fecha_inicio + timedelta(days=d)).strftime("%Y-%m-%d") 
                    for d in range((fecha_fin - fecha_inicio).days + 1)]
# Esta lista tendra en un indice respectivo guardadas tcada una de las fechas desde que la BD tiene registro (2019-12-31) 
#hasta la última acualización de la BD.

#### Subprograma derivación numérica.

Se usará diferencia finita centrada de error del orden de O(h^4). Debido a que existe la posibilidad de tomar los dos primeros datos, o los dos ultimos (de la lista de fechas), se debe tomar diferencia finita hacia adelante en caso de los dos primeros y diferencia finita hacia atras en caso de los dos últimos. Se usará las diferencias finitas de error del orden de O(h^2) en caso de diferencia finita hacia adelante y hacia atras. Las ecuaciones de estas diferencias finitas son:

- Diferencia finita centrada:

$$ f'(x_i) \cong \frac{-f(x_i+2h) + 8f(x_i + h) - 8f(x_i-h)+f(x_i-2h) }{12h}$$

- Diferencia finita hacia adelante:

$$ f'(x_i)\cong  \frac{-f(x_i + 2h) + 4f(x_i + h) - 3f(x_i) }{2h}$$
- Diferencia finita hacia atrás:

$$ f'(x_i)\cong  \frac{3f(x_i) - 4f(x_i - h) + f(x_i-2h) }{2h}$$

In [5]:
def derivada(lista):
    lista_derivada=np.zeros(len(lista))
    h = 1                                                                       # recordando que el paso en este caso es constante

    for k in range(len(lista)): # Creamos ciclo, donde por medio de la variable k recorreremos todos los datos del DataFrame, tanto la posición angular y la presión.
        if k <= 1:
                lista_derivada[k] = (-lista[k+2] + 4*lista[k+1] - 3*lista[k]) / 2*h   # Diferencia finita hacia adelante
                                                                                      # de la primera derivada.

        elif k >= (len(lista)-2) :
                lista_derivada[k] = (3*lista[k] - 4*lista[k-1]  + lista[k-2]) / 2*h # Diferencia finita hacia atrás
                                                                                   # de la primera derivada.

        else:
                lista_derivada[k] = (-lista[k+2] +8*lista[k+1]-8*lista[k-1]+lista[k-2]) / 12*h # Diferencia centrada
                                                                                              # centrada de la primera derivada.
    return(lista_derivada)

#### Subprograma de generador de DataFrames de pais.

In [15]:
def gen_coutry_data (iso_code): # Subprograma que genera un df con los datos del COVID-19 introduciendo el valor del código ISO 3166-1.
    list_total_cases = []
    list_new_cases = []         # Generamos listas vacías que guardarán los datos del COVID-19 de determinado país.
    list_total_deaths = []
    list_new_deaths = []
    
    
    list_suavizado_diff_new_cases = []
    list_suavizado_diff_new_deaths = []
    
    for j in range (len(data)):
        if data['iso_code'][j]== iso_code: # Buscamos todas las filas de nuestra BD que el código ISO 3166-1 coincida con el solicitado.
            list_total_cases.append(data['total_cases'][j])
            list_new_cases.append(data['new_cases'][j])
            list_total_deaths.append(data['total_deaths'][j]) # Agregamos los valores de la fila i-ésima de la BD a las listas.
            list_new_deaths.append(data['new_deaths'][j]) 
            
    n = len(list_date)-len(list_new_cases) # Buscamos número de días sin casos ni muertes (sin registro en la BD).
    df_country_name= pd.DataFrame(columns=('date', 'total_cases', 'new_cases','total_deaths', 'new_deaths')) # Creamos df del país según iso.
    df_country_name['date'] = np.zeros(len(list_date))
    df_country_name['total_cases'] =np.zeros(len(list_date))
    df_country_name['new_cases'] = np.zeros(len(list_date))   # Creamos columnas vacías de ceros en el df del país.
    df_country_name['total_deaths'] = np.zeros(len(list_date)) # Columnas con un número de entradas igual a la longitud lista de fechas.
    df_country_name['new_deaths'] =np.zeros(len(list_date))
    
    # ahora como la idea es generar DataFrames con igual número de datos (para evitar errores de clave en la gráficación)
    # las columnas del df del país serán llenadas a partir de la fecha n (donde se tiene el primer registro) con los datos
    # de las anteriores listas y los datos anteriores a la fecha n se tomará como 0 (casos, muertes, casos totales, muertes totales).
    for g in range (len(list_new_cases)): 
            df_country_name['total_cases'][g+n] = list_total_cases[g]
            df_country_name['new_cases'][g+n] = list_new_cases[g]
            df_country_name['total_deaths'][g+n]= list_total_deaths[g]
            df_country_name['new_deaths'][g+n]= list_new_deaths[g]
    df_country_name['date'] = list_date.copy() # Llevamos a una columna de df con las fechas.
    
    df_country_name['suavizado_new_cases'] = savgol_filter(df_country_name['new_cases'], 51, 3)
    df_country_name['suavizado_new_deaths'] = savgol_filter(df_country_name['new_deaths'], 51, 3)
    df_country_name['diff_new_cases'] = derivada(df_country_name['new_cases'])
    df_country_name['diff_new_deaths'] = derivada(df_country_name['new_deaths'])
    df_country_name['suavizado_diff_new_cases'] = savgol_filter(df_country_name['diff_new_cases'], 51, 3)
    df_country_name['suavizado_diff_new_deaths'] = savgol_filter(df_country_name['diff_new_deaths'], 51, 3)
    
    return (df_country_name)

#### Generamos DataFrames con cada país.

In [16]:
# Se genera un diccionario que guarde todos los df de cada país con la clave igual al ISO 3166-1 del país respectivo.
list_country_iso=data_country_iso_code['ISO 3166-1 .1']  # Aquí se demora unos segundos puesto que hay alto procesamiento de datos. <-----
dic_countries_df={}
for i in range(len(list_country_iso)): # Se tendrá tantatos DataFrames como códigos ISO hay en la BD.
    dic_countries_df[list_country_iso[i]]=gen_coutry_data (list_country_iso[i])

LinAlgError: SVD did not converge in Linear Least Squares

#### Generamos DataFrame resumen del COVID-19.

In [None]:
# Se desea tener un df que contenga los valores de muertes totales y casos totales  de cada pa{ispara la ultima fecha de actualización de
# la BD: 
list_summary_deaths = []
list_summary_cases=[]
for i in range(len(dic_countries_df)):
    # Agregamos a la lista de resumen de casos totales y de muertes totales los datos respectivos de cada país para la ultuma fecha:
    list_summary_cases.append(dic_countries_df[data_country_iso_code['ISO 3166-1 .1'][i]]['total_cases'][len(dic_countries_df[data_country_iso_code['ISO 3166-1 .1'][0]])-1])
    list_summary_deaths.append(dic_countries_df[data_country_iso_code['ISO 3166-1 .1'][i]]['total_deaths'][len(dic_countries_df[data_country_iso_code['ISO 3166-1 .1'][0]])-1])

df_summary_covid= pd.DataFrame(columns=('Nombre del país','total_cases','total_deaths'))
df_summary_covid['Nombre del país'] = data_country_iso['Nombre del país']                          # Creación de df.
df_summary_covid['total_cases'] = list_summary_cases
df_summary_covid['total_deaths'] = list_summary_deaths
               
df_summary_covid_ascendent = df_summary_covid.sort_values('total_cases',ascending=False) # Creamos df organizado de desendentemente
df_summary_covid_desendent = df_summary_covid.sort_values('total_cases',ascending=True) # Creamos df organizado de asendentemente
                                                                                        # Según número de casos.

#### Encabezado.

In [None]:
# Se lee imagen y partir de esta se crea objeto widget image del encabezado:
file = open("images/logo_corona.png", "rb")
image = file.read()
img_encabezado= widgets.Image(
    value=image,
    format='png',
    width=1000,
    height=200,
)

#### Tabla.

In [None]:
# Se crea objeto como de figure widget a partir de un objeto table para crear la tabla resumen del aplicativo:
fig_tabla = go.FigureWidget(go.Table(
        header=dict(
            values=[ "Nombre<br>del país", "casos",
                    "Muertes"],
            font=dict(size=12),
            align="left"
        ),
        cells=dict(
            values=[df_summary_covid_ascendent['Nombre del país'],df_summary_covid_ascendent['total_cases'],df_summary_covid_ascendent['total_deaths']],
            align = "left")
    ))


fig_table=fig_tabla.update_layout(margin = {'r':0,'b':20,'t':20,'l':0},
            height=900,         
            width = 180,
            showlegend=False,
            title_text=" ",
            template= 'simple_white'
        )

#### Selector del país.

In [None]:
# Se crea objeto widgets dropdown a partir de una lista donde en cada posición se guarda el codigo iso, nombre del país y número de casos 
# de cada país, como se pide que las opciones de este objeto estén organizados de manera ascendente se usa el df resumen desendet:
list_options=[]
for i in range(len(df_summary_covid_ascendent)-1):
    list_options.append((df_summary_covid_desendent.index[i]+'  ' + df_summary_covid_desendent['Nombre del país'][i] + ' ('+ str (int (df_summary_covid_desendent['total_cases'][i])) +')', len(df_summary_covid_ascendent)-i-1))

country_selector= widgets.Dropdown(
                options=list_options,
                value=2,
                description='País: ',
                layout=Layout(width='30%', height='30px',align = "center")
                )

#### Selector de tiempo.

In [None]:
# Se crea objeto widgets selection range slider para tomar una ventana temporal, donde las opciones de este corresponden a la lista de fechas:
time_selector = widgets.SelectionRangeSlider(
                options=list_date,
                index=(0, len(list_date)-1),
                description='              Tiempo',
                disabled=False,
                layout=Layout(width='500px', height='30px',align = "rigth")
                )

## 2. Funcionalidad del aplicativo.

In [None]:
# Debido a que la función interactive (función que permite que el aplicativo se acualice costantemente según los widgets determinados)
# necesita como argumento una función donde se guarde las instrucciones que deben variar con los wigets se debe generar dicha subprograma:

def figs_interactive(a,b):
    
    # En este caso como lo que varía constantemente son las gráficas se genera dos figures, fig_up y fig down.
    
    # fig_up es un subplots el cual genera dos gráficas organizadas en una matriz 1x2 , donde cada una de ellas 
    # tiene dos ejes Y  con su respectiva función repecto al día (fecha) , la primera (gráfico up left) contiene casos y casos acumulados, 
    # y la segunda (gráfico up rigth) contiene muertes y muertes aculadas.
    
    
    # fig_down es un subplots el cual genera dos gráficas de determinado país organizadas en una matriz 1x2 , donde cada una de ella tiene 
    # una función respecto a las fechas seleccionadas, la primera (gráfico down left) tiene la derivada del numero de casos respecto
    # al tiempo y la segunda (gráfico down rigth) muestra la derivada de las muertes con respecto al tiempo
    
    date_1 =list_date.index(a[0]) # buscamos segun el parámetro a (que es una tupla donde guarda los valores del slider) 
    date_2 =list_date.index(a[1]) # el indice de la fecha en la lista de fechas.
    x1= list_date[date_1:date_2]

    fig_up = make_subplots(specs=[[{"secondary_y": True},{"secondary_y": True}]], rows=1, cols=2, subplot_titles=("Casos", "Muertes"), x_title=' ', y_title='  ', 
                    horizontal_spacing=0.16)
    
    fig_up.add_trace(go.Scatter( x=x1, y=dic_countries_df[df_summary_covid_ascendent.index[b]]['new_cases'][date_1:date_2],
                        mode='markers',
                        name='Casos',
                        marker=dict( color='#2D517D'),
                        legendgroup="grupo 1"),
                        secondary_y=False,  row=1, col=1)
    
    fig_up.add_trace(go.Scatter( x=x1, y=dic_countries_df[df_summary_covid_ascendent.index[b]]['suavizado_new_cases'][date_1:date_2],
                        mode='lines',
                        name='Casos(suavizado) ',
                        marker=dict( color='#2D517D'),
                        legendgroup="grupo 2"),   
                        secondary_y=False,  row=1, col=1)
    
    fig_up.add_trace(go.Scatter( x=x1, y=dic_countries_df[df_summary_covid_ascendent.index[b]]['total_cases'][date_1:date_2],
                        mode='lines',         
                        name='\tCasos totales'+' '*5,
                        marker=dict( color='#F6C03A'),
                        legendgroup="grupo 3"),
                        secondary_y=True,  row=1, col=1)
    
    fig_up.add_trace(go.Scatter( x=x1, y=dic_countries_df[df_summary_covid_ascendent.index[b]]['new_deaths'][date_1:date_2],
                        mode='markers',
                        name='\t\tMuertes',
                        marker=dict( color='#008080'),
                        legendgroup="grupo 4"),
                        secondary_y=False, row=1, col=2)
    
    fig_up.add_trace(go.Scatter( x=x1, y=dic_countries_df[df_summary_covid_ascendent.index[b]]['suavizado_new_deaths'][date_1:date_2],
                        mode='lines',
                        name='Muertes (Suavizado) ',
                        marker=dict( color='#008080'),
                        legendgroup="grupo 5"),
                        secondary_y=False, row=1, col=2)
    
    fig_up.add_trace(go.Scatter( x=x1, y=dic_countries_df[df_summary_covid_ascendent.index[b]]['total_deaths'][date_1:date_2],
                        mode='lines',         
                        name='\t\tMuertes totales',
                        marker=dict( color='#808080'), 
                        legendgroup="grupo 6"),
                        secondary_y=True,  row=1, col=2)
    

    fig_up.update_layout(legend_orientation = 'h',margin=dict(l=5,r=0,b=0,t=30),legend=dict(
             x=0,
             y=-0.3
             ),
         
         title={
            'text': ' ',
            #'y':0.035,
            #'x':0.5,
            #'xanchor': 'center',
            #'yanchor': 'top'
             },
             height = 400,             
             width = 900, 
             # plot_bgcolor = 'white',
             template = "simple_white"
        )

    fig_up.update_xaxes(title_text='Día(fecha)',ticks="outside", tickwidth=2, tickcolor='gray', ticklen=5)
    #fig.update_yaxes(title_text=y2_title, secondary_y=False,ticks="outside", tickwidth=2, tickcolor='gray', ticklen=10)
    fig_up.update_yaxes(title_text= 'Acumulados', secondary_y=True,ticks="outside", tickwidth=2, tickcolor='gray', ticklen=10)
    
    fig_down = make_subplots(specs=[[{"secondary_y": True},{"secondary_y": True}]], rows=1, cols=2, 
                             subplot_titles=("Derivada temporal nuevos casos", "Derivada temporal nuevas muertes"),x_title=' ',y_title='  ', 
                             horizontal_spacing=0.16)
    
    fig_down.add_trace(go.Scatter( x=x1, y=dic_countries_df[df_summary_covid_ascendent.index[b]]['diff_new_cases'][date_1:date_2],
                        mode='markers+lines',
                        name='\tTasa de crecimiento(casos)',
                        marker=dict( color='#800080'),
                        legendgroup="grupo 1"),
                        secondary_y=False,  row=1, col=1)
    
    fig_down.add_trace(go.Scatter( x=x1, y=dic_countries_df[df_summary_covid_ascendent.index[b]]['suavizado_diff_new_cases'][date_1:date_2],
                        mode='lines',
                        name='Suavizado',
                        marker=dict( color='#ECA4C4'),
                        legendgroup="grupo 2"),
                        secondary_y=False,  row=1, col=1)
    
    fig_down.add_trace(go.Scatter( x=x1, y=dic_countries_df[df_summary_covid_ascendent.index[b]]['diff_new_deaths'][date_1:date_2],
                        mode='markers+lines',         
                        name='\t\tTasa de crecimiento(Muertes)',
                        marker=dict( color='#3ECFDC'),
                        legendgroup="grupo 3"),
                        secondary_y=False,  row=1, col=2)
    
    fig_down.add_trace(go.Scatter( x=x1, y=dic_countries_df[df_summary_covid_ascendent.index[b]]['suavizado_diff_new_deaths'][date_1:date_2],
                        mode='lines',         
                        name='(Savizado)',
                        marker=dict( color='#000000'),
                        legendgroup="grupo 4"),
                        secondary_y=False,  row=1, col=2)
    
   

    fig_down.update_layout(legend_orientation = 'h',margin=dict(l=4,r=0,b=0,t=30),legend=dict(
             x=0,
             y=-0.3
             ),
         
            title={
            'text': ' ',
            #'y':0.035,
            #'x':0.5,
            #'xanchor': 'center',
            #'yanchor': 'top'
             },
             height = 400,             
             width = 900, 
             # plot_bgcolor = 'white',
             template = "simple_white"
        )

    fig_down.update_xaxes(title_text='Día(fecha)',ticks="outside", tickwidth=2, tickcolor='gray', ticklen=5)
    #fig.update_yaxes(title_text=y2_title, secondary_y=False,ticks="outside", tickwidth=2, tickcolor='gray', ticklen=10)
     
    fig_up.show()    # Comando para enseñar la figura, es necesario para que cada vez que se varien los widgets las gráficas canbueb
    fig_down.show()
    
figs_interac=widgets.interactive(figs_interactive, a=time_selector, b=country_selector) # Guarmos objeto interactivo.


## 3. Integración de interfaz gráfica.

In [None]:
# Usando organizadores widgets VBox y HBox se organiza una matriz tal que obtengamos la matriz deseada donde en cada celda de esta
# matriz se situe un objeto widget.
interfaz = widgets.VBox([widgets.HBox([img_encabezado]),widgets.HBox([fig_table,figs_interac])])
interfaz

In [17]:
dic_countries_df['COL']

Unnamed: 0,date,total_cases,new_cases,total_deaths,new_deaths,suavizado_new_cases,suavizado_new_deaths,diff_new_cases,diff_new_deaths,suavizado_diff_new_cases,suavizado_diff_new_deaths
0,2019-12-31,0.0,0.0,0.0,0.0,0.000000,0.000000,0.000000,0.0,0.000000,0.000000
1,2020-01-01,0.0,0.0,0.0,0.0,0.000000,0.000000,0.000000,0.0,0.000000,0.000000
2,2020-01-02,0.0,0.0,0.0,0.0,0.000000,0.000000,0.000000,0.0,0.000000,0.000000
3,2020-01-03,0.0,0.0,0.0,0.0,0.000000,0.000000,0.000000,0.0,0.000000,0.000000
4,2020-01-04,0.0,0.0,0.0,0.0,0.000000,0.000000,0.000000,0.0,0.000000,0.000000
...,...,...,...,...,...,...,...,...,...,...,...
179,2020-06-27,84442.0,3843.0,2811.0,157.0,3223.836082,120.813658,472.250000,-30.0,0.782493,-4.885277
180,2020-06-28,88591.0,4149.0,2939.0,128.0,3330.731583,126.249616,-425.666667,10.5,-25.078345,-6.805714
181,2020-06-29,91769.0,3178.0,3106.0,167.0,3439.686873,131.875843,-496.666667,-3.5,-53.824398,-8.917816
182,2020-06-30,95043.0,3274.0,3223.0,117.0,3550.696260,137.695932,629.500000,-94.5,-85.572217,-11.228944
