In [1]:
%matplotlib ipympl
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import ipywidgets as widgets


# Tarea 1: Explorando datos mundiales de COVID-19 

En esta actividad se pide que explore los datos del repositorio ["COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University"](https://github.com/CSSEGISandData/COVID-19)

Adjunto a este cuadernillo encontrará los datos al 26 de Abril de 2021 de dicho repositorio en el archivo `data.zip`. Luego de descomprimir debería observar cuatro archivos

- `covid19_confirmados.csv` : Número de casos diarios acumulado reportados como COVID-19 positivos (confirmados)
- `covid19_recuperados.csv` : Número de casos diarios acumulado reportados como recuperados 
- `covid19_decesos.csv` : Número de decesos diarios por COVID-19 acumulado 
- `population_by_country_2020.csv`:  Población por país más otros indicadores socioeconómicos al 2020 descargados desde: https://www.kaggle.com/tanuprabhu/population-by-country-2020

En los primeros tres archivos cada fila corresponde a un país o un estado/provincia de un país. Las columnas son las coordenadas geográficas (latitud y longitud) y el número de casos diarios para cada día desde Enero de 2020 a la fecha. Según quienes compilaron este repositorio, la información de casos recuperados debe analizarse con cautela pues podría estar considerablemente subestimada. 

A modo de ejemplo se muestra a continuación una gráfica de la series de tiempo del número de casos confirmados totales acumulados de Chile, Argentina y Bolivia 

<img src="ejemplo1.png">

A partir de esta información se puede calcular la serie de tiempo de los casos confirmados "nuevos" por día

<img src="ejemplo2.png">

En esta tarea se pide que procese, visualice, analice y discuta en base a estos datos. Escriba las rutinas de Python necesarias para resolver las actividades específicas que encontrará en este enunciado. **Use las librerías vistas en el curso**. Discuta con sus compañeros de grupo y complete con su análisis donde corresponda.

## Instrucciones generales 

1. Forme un grupo de **máximo tres estudiantes**
1. Versione su trabajo usando un **repositorio privado de github**. Agregue a sus compañeros y a su profesor (usuario github: phuijse) en la pestaña *Settings/Manage access*. No se aceptarán consultas de programación si no se cumple este requisito
1. Su tarea se evaluará en base al último commit antes de la fecha de entrega: **14:10 del Martes 11 de Mayo de 2021**. La nota se calcula como ("pt totales" + 1)
1. [Sean leales y honestos](https://www.acm.org/about-acm/code-of-ethics-in-spanish), no copie ni comparta resultados con otros grupos

## Enunciado

### Preparación de datos (1.5pt)

1. Explore el archivo `covid19_confirmados.csv` y configure la función `read_csv` de pandas para importarlo como un `DataFrame`. 
    1. Utilice el nombre de país como índice principal
    1. Elimine las columnas `Lat` y `Long`
    1. Use TimeStamps para los "nombres de columna" asociados a fechas
    1. Reduzca la columna `Province/State`, el DataFrame resultante debe tener los totales a nivel país
1. Explore el archivo `population_by_country_2020.csv` y configure la función `read_csv` de pandas para importarlo como un `DataFrame`. 
    1. Utilice el nombre de país como índice principal. Algunos siglas o nombres podrían no calzar con el `DataFrame` anterior, modifíquelos manualmente o usando pandas. 
1. Haga un `merge` de los `DataFrame` anteriores. El objetivo es asignar un valor de `Population` a cada elemento del primer `DataFrame`. Indique las filas donde no se puede realizar el `merge` y luego descártelas de su `DataFrame` final
1. Repita el procedimiento anterior para los archivos `covid19_recuperados.csv` y `covid19_muertes.csv` 

### Pregunta 1

### A.

In [78]:
df_confirmados = pd.read_csv('data/covid19_confirmados.csv', index_col='Country/Region', parse_dates=True)

### B

In [79]:
df_confirmados.drop(['Lat', 'Long'], axis=1, inplace=True)

### C y D

In [80]:
df_confirmados = df_confirmados.groupby('Country/Region').sum()
df_confirmados.columns = pd.to_datetime(df_confirmados.columns)
df_confirmados.columns = sorted(df_confirmados.columns)
df_confirmados

Unnamed: 0_level_0,2020-01-22,2020-01-23,2020-01-24,2020-01-25,2020-01-26,2020-01-27,2020-01-28,2020-01-29,2020-01-30,2020-01-31,...,2021-04-16,2021-04-17,2021-04-18,2021-04-19,2021-04-20,2021-04-21,2021-04-22,2021-04-23,2021-04-24,2021-04-25
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Afghanistan,0,0,0,0,0,0,0,0,0,0,...,57612,57721,57793,57898,58037,58214,58312,58542,58730,58843
Albania,0,0,0,0,0,0,0,0,0,0,...,129307,129456,129594,129694,129842,129980,130114,130270,130409,130537
Algeria,0,0,0,0,0,0,0,0,0,0,...,119323,119486,119642,119805,119992,120174,120363,120562,120736,120922
Andorra,0,0,0,0,0,0,0,0,0,0,...,12712,12771,12805,12805,12874,12917,12942,13007,13024,13060
Angola,0,0,0,0,0,0,0,0,0,0,...,24122,24300,24389,24518,24661,24883,25051,25279,25492,25609
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Vietnam,0,2,2,2,2,2,2,2,2,2,...,2772,2781,2785,2791,2800,2812,2824,2830,2833,2843
West Bank and Gaza,0,0,0,0,0,0,0,0,0,0,...,278135,279753,280741,282270,284280,286028,287680,289120,290259,290972
Yemen,0,0,0,0,0,0,0,0,0,0,...,5715,5770,5812,5858,5918,5960,6020,6056,6105,6137
Zambia,0,0,0,0,0,0,0,0,0,0,...,90750,90844,90918,90942,91042,91119,91189,91251,91317,91358


## Pregunta 2

### A

In [81]:
df_population = pd.read_csv('data/population_by_country_2020.csv',index_col = 'Country (or dependency)')

In [82]:
df_population.index.names=['Country/Region']
df_population

Unnamed: 0_level_0,Population (2020),Yearly Change,Net Change,Density (P/Km²),Land Area (Km²),Migrants (net),Fert. Rate,Med. Age,Urban Pop %,World Share
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
China,1440297825,0.39 %,5540090,153,9388211,-348399.0,1.7,38,61 %,18.47 %
India,1382345085,0.99 %,13586631,464,2973190,-532687.0,2.2,28,35 %,17.70 %
United States,331341050,0.59 %,1937734,36,9147420,954806.0,1.8,38,83 %,4.25 %
Indonesia,274021604,1.07 %,2898047,151,1811570,-98955.0,2.3,30,56 %,3.51 %
Pakistan,221612785,2.00 %,4327022,287,770880,-233379.0,3.6,23,35 %,2.83 %
...,...,...,...,...,...,...,...,...,...,...
Montserrat,4993,0.06 %,3,50,100,,N.A.,N.A.,10 %,0.00 %
Falkland Islands,3497,3.05 %,103,0,12170,,N.A.,N.A.,66 %,0.00 %
Niue,1628,0.68 %,11,6,260,,N.A.,N.A.,46 %,0.00 %
Tokelau,1360,1.27 %,17,136,10,,N.A.,N.A.,0 %,0.00 %


### Pregunta 3

In [85]:
df_population_merge = pd.merge(df_confirmados,df_population,on='Country/Region',how='left')
df_population_merge

Unnamed: 0_level_0,2020-01-22 00:00:00,2020-01-23 00:00:00,2020-01-24 00:00:00,2020-01-25 00:00:00,2020-01-26 00:00:00,2020-01-27 00:00:00,2020-01-28 00:00:00,2020-01-29 00:00:00,2020-01-30 00:00:00,2020-01-31 00:00:00,...,Population (2020),Yearly Change,Net Change,Density (P/Km²),Land Area (Km²),Migrants (net),Fert. Rate,Med. Age,Urban Pop %,World Share
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Afghanistan,0,0,0,0,0,0,0,0,0,0,...,39074280.0,2.33 %,886592.0,60.0,652860.0,-62920.0,4.6,18,25 %,0.50 %
Albania,0,0,0,0,0,0,0,0,0,0,...,2877239.0,-0.11 %,-3120.0,105.0,27400.0,-14000.0,1.6,36,63 %,0.04 %
Algeria,0,0,0,0,0,0,0,0,0,0,...,43984569.0,1.85 %,797990.0,18.0,2381740.0,-10000.0,3.1,29,73 %,0.56 %
Andorra,0,0,0,0,0,0,0,0,0,0,...,77287.0,0.16 %,123.0,164.0,470.0,,N.A.,N.A.,88 %,0.00 %
Angola,0,0,0,0,0,0,0,0,0,0,...,33032075.0,3.27 %,1040977.0,26.0,1246700.0,6413.0,5.6,17,67 %,0.42 %
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Vietnam,0,2,2,2,2,2,2,2,2,2,...,97490013.0,0.91 %,876473.0,314.0,310070.0,-80000.0,2.1,32,38 %,1.25 %
West Bank and Gaza,0,0,0,0,0,0,0,0,0,0,...,,,,,,,,,,
Yemen,0,0,0,0,0,0,0,0,0,0,...,29935468.0,2.28 %,664042.0,56.0,527970.0,-30000.0,3.8,20,38 %,0.38 %
Zambia,0,0,0,0,0,0,0,0,0,0,...,18468257.0,2.93 %,522925.0,25.0,743390.0,-8000.0,4.7,18,45 %,0.24 %


Descartamos las filas del segundo dataframe que no coincidian con el nombre del país en el primer dataframe.


## Pregunta 4

In [134]:
df_recuperados = pd.read_csv('data/covid19_recuperados.csv', index_col = 'Country/Region')
df_recuperados.drop(['Lat', 'Long'], axis=1, inplace=True)

df_recuperados = df_recuperados.groupby('Country/Region').sum()

df_recuperados.columns = pd.to_datetime(df_recuperados.columns)
df_recuperados.columns = sorted(df_recuperados.columns)



In [135]:
df_muertes = pd.read_csv('data/covid19_decesos.csv', index_col = 'Country/Region')
df_muertes.drop(['Lat', 'Long'], axis=1, inplace=True)
df_muertes = df_muertes.groupby('Country/Region').sum()

df_muertes.columns = pd.to_datetime(df_muertes.columns)
df_muertes.columns = sorted(df_muertes.columns)

df_muertes_merge = pd.merge(df_recuperados,df_muertes, on='Country/Region',how='left', suffixes=('_recuperados','_muertes'))
df_muertes_merge


Unnamed: 0_level_0,2020-01-22 00:00:00_recuperados,2020-01-23 00:00:00_recuperados,2020-01-24 00:00:00_recuperados,2020-01-25 00:00:00_recuperados,2020-01-26 00:00:00_recuperados,2020-01-27 00:00:00_recuperados,2020-01-28 00:00:00_recuperados,2020-01-29 00:00:00_recuperados,2020-01-30 00:00:00_recuperados,2020-01-31 00:00:00_recuperados,...,2021-04-16 00:00:00_muertes,2021-04-17 00:00:00_muertes,2021-04-18 00:00:00_muertes,2021-04-19 00:00:00_muertes,2021-04-20 00:00:00_muertes,2021-04-21 00:00:00_muertes,2021-04-22 00:00:00_muertes,2021-04-23 00:00:00_muertes,2021-04-24 00:00:00_muertes,2021-04-25 00:00:00_muertes
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Afghanistan,0,0,0,0,0,0,0,0,0,0,...,2535,2539,2539,2546,2549,2557,2561,2565,2572,2582
Albania,0,0,0,0,0,0,0,0,0,0,...,2337,2340,2342,2347,2353,2358,2364,2367,2372,2378
Algeria,0,0,0,0,0,0,0,0,0,0,...,3148,3152,3155,3160,3165,3172,3181,3190,3198,3207
Andorra,0,0,0,0,0,0,0,0,0,0,...,123,123,123,123,123,123,123,123,124,124
Angola,0,0,0,0,0,0,0,0,0,0,...,560,561,561,563,565,570,572,574,577,579
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Vietnam,0,0,0,0,0,0,0,0,0,0,...,35,35,35,35,35,35,35,35,35,35
West Bank and Gaza,0,0,0,0,0,0,0,0,0,0,...,2955,2983,3017,3047,3078,3096,3115,3138,3151,3167
Yemen,0,0,0,0,0,0,0,0,0,0,...,1108,1119,1126,1132,1138,1147,1157,1165,1175,1187
Zambia,0,0,0,0,0,0,0,0,0,0,...,1233,1234,1235,1236,1236,1238,1240,1245,1245,1246


### Análisis global (1.5pt)

1. Obtenga la cantidad total  a la fecha (26 de Abril) de los casos (a) confirmados, (b) cerrados (recuperados más decesos) y (c) activos (confirmados menos cerrados) por país. En base a estas cantidades calcule el porcentaje de 
    1. casos activos con respecto al total de confirmados
    1. decesos con respecto al total de casos cerrados
    1. recuperados con respecto al total de casos cerrados
1. Luego calcule las siguientes tasas en base a información a la fecha
    1. Tasa de incidencia: confirmados por 100.000 dividido población total
    1. Tasa de recuperación: recuperados por 100.000 dividido población total
    1. Tasa de mortalidad: decesos por 100.000 dividido población total
1. En base a lo anterior muestre los nombres y los valores de los 5 países con
    1. La mayor y menor tasa de incidencia, respectivamente
    1. La mayor y menor tasa de recuperación, respectivamente
    1. La mayor y menor tasa de mortalidad, respectivamente
1. Responda, analice y discuta: ¿En qué lugar/ranking se encuentra Chile con respecto a cada una de las métricas de los puntos anteriores? ¿A qué países de la [OCDE](https://es.wikipedia.org/wiki/Organizaci%C3%B3n_para_la_Cooperaci%C3%B3n_y_el_Desarrollo_Econ%C3%B3micos) se parece más? ¿A qué paises de latinoamérica se parece más? 

## 1 

In [115]:
total_confirmados = df_confirmados['2021-04-25 00:00:00']
total_recuperados = df_muertes_merge['2021-04-25 00:00:00_recuperados']
total_muertes = df_muertes_merge['2021-04-25 00:00:00_muertes']

total_cerrados =  (total_muertes+total_recuperados)
total_activos =  (total_confirmados-total_cerrados)


### A .casos activos con respecto al total de confirmados

In [116]:
porcentajes_activo_confirmado = (100*total_activos)/total_confirmados 

### B Decesos con respecto al total de casos cerrados

In [117]:
porcentajes_decesos_cerrados = (100*total_muertes)/total_cerrados 

### C Recuperados con respecto al total de casos cerrados

In [118]:
porcentajes_recuperados_cerrados = (100*total_recuperados)/total_cerrados 

In [119]:
data_df = pd.DataFrame(data={
    'Confirmados':total_confirmados, 
    'Cerrados':total_cerrados,
    'Activos':total_activos,
    'porcentaje Activos/Confirmado':porcentajes_activo_confirmado,
    'porcentaje Decesos/Cerrados':porcentajes_decesos_cerrados,
    'porcentaje Recuperados/Cerrados':porcentajes_recuperados_cerrados},
    index=df_confirmados.index)
data_df

Unnamed: 0_level_0,Confirmados,Cerrados,Activos,porcentaje Activos/Confirmado,porcentaje Decesos/Cerrados,porcentaje Recuperados/Cerrados
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
Afghanistan,58843,35913,22930,38.968102,4.318770,95.681230
Albania,130537,12114,118423,90.719873,4.424633,95.575367
Algeria,120922,43000,77922,64.439887,4.648837,95.351163
Andorra,13060,3809,9251,70.834609,1.969021,98.030979
Angola,25609,5562,20047,78.281073,5.321827,94.678173
...,...,...,...,...,...,...
Vietnam,2843,1104,1739,61.167781,3.170290,96.829710
West Bank and Gaza,290972,48728,242244,83.253371,1.034313,98.965687
Yemen,6137,1976,4161,67.801858,30.414980,69.585020
Zambia,91358,16168,75190,82.302590,2.158585,97.841415


## 2

#### A Tasa de incidencia: confirmados por 100.000 dividido población total

In [120]:
incidencia = (total_confirmados*100000)/df_population_merge['Population (2020)']

### B Tasa de recuperación: recuperados por 100.000 dividido población total

In [121]:
recuperacion = (total_recuperados*100000)/df_population_merge['Population (2020)']

### C Tasa de mortalidad: decesos por 100.000 dividido población total

In [122]:
mortalidad = (total_muertes*100000)/df_population_merge['Population (2020)']

In [123]:
data_2_df = pd.DataFrame(data={
    'Incidencia':incidencia, 
    'Recuperacion':recuperacion,
    'Mortalidad':mortalidad
    },index=df_confirmados.index)
data_2_df

Unnamed: 0_level_0,Incidencia,Recuperacion,Mortalidad
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Afghanistan,150.592666,87.940200,3.969363
Albania,4536.884145,402.399662,18.628970
Algeria,274.919143,93.216782,4.544776
Andorra,16898.055300,4831.342917,97.040900
Angola,77.527676,15.942081,0.896099
...,...,...,...
Vietnam,2.916196,1.096523,0.035901
West Bank and Gaza,,,
Yemen,20.500765,4.593214,2.007652
Zambia,494.675811,85.655078,1.889729


## 3

### A La mayor y menor tasa de incidencia, respectivamente


In [124]:
display(data_2_df.nlargest(5, 'Incidencia'), data_2_df.nsmallest(5, 'Incidencia'))

Unnamed: 0_level_0,Incidencia,Recuperacion,Mortalidad
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Andorra,16898.0553,4831.342917,97.0409
Montenegro,15389.759266,2370.23946,51.904216
San Marino,14868.607118,2150.60099,123.733208
Slovenia,11401.118524,747.959705,21.212233
Luxembourg,10515.625199,1762.454915,27.24214


Unnamed: 0_level_0,Incidencia,Recuperacion,Mortalidad
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Tanzania,0.848158,0.304937,0.034993
Micronesia,0.867822,0.0,0.0
Vanuatu,1.297282,0.0,0.0
Samoa,1.510247,0.0,0.0
Solomon Islands,2.899933,0.579987,0.0


### B La mayor y menor tasa de recuperación, respectivamente

In [125]:
display(data_2_df.nlargest(5, 'Recuperacion'), data_2_df.nsmallest(5, 'Recuperacion'))

Unnamed: 0_level_0,Incidencia,Recuperacion,Mortalidad
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Andorra,16898.0553,4831.342917,97.0409
Bahrain,10015.446592,4671.323048,19.110994
Qatar,6998.308231,4513.713432,8.029671
Israel,9656.304182,3499.72236,30.408421
Kuwait,6235.203162,2796.847701,18.545682


Unnamed: 0_level_0,Incidencia,Recuperacion,Mortalidad
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Marshall Islands,6.75003,0.0,0.0
Micronesia,0.867822,0.0,0.0
Samoa,1.510247,0.0,0.0
Serbia,7784.454182,0.0,9.735335
Sweden,9281.121414,0.0,59.31614


### C La mayor y menor tasa de mortalidad, respectivamente

In [126]:
display(data_2_df.nlargest(5, 'Mortalidad'), data_2_df.nsmallest(5, 'Mortalidad'))

Unnamed: 0_level_0,Incidencia,Recuperacion,Mortalidad
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
San Marino,14868.607118,2150.60099,123.733208
Belgium,8401.277033,235.669401,106.315921
Peru,5329.996229,2520.192685,104.90402
Andorra,16898.0553,4831.342917,97.0409
Spain,7418.235347,321.604997,81.521913


Unnamed: 0_level_0,Incidencia,Recuperacion,Mortalidad
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Bhutan,132.20036,42.55765,0.0
Cambodia,59.522218,1.688701,0.0
Dominica,240.221059,45.822514,0.0
Eritrea,101.412261,11.983807,0.0
Grenada,141.190261,23.975705,0.0


## 4 Responda, analice y discuta: ¿En qué lugar/ranking se encuentra Chile con respecto a cada una de las métricas de los puntos anteriores? ¿A qué países de la OCDE se parece más? ¿A qué paises de latinoamérica se parece más?

In [127]:
data_df

Unnamed: 0_level_0,Confirmados,Cerrados,Activos,porcentaje Activos/Confirmado,porcentaje Decesos/Cerrados,porcentaje Recuperados/Cerrados
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
Afghanistan,58843,35913,22930,38.968102,4.318770,95.681230
Albania,130537,12114,118423,90.719873,4.424633,95.575367
Algeria,120922,43000,77922,64.439887,4.648837,95.351163
Andorra,13060,3809,9251,70.834609,1.969021,98.030979
Angola,25609,5562,20047,78.281073,5.321827,94.678173
...,...,...,...,...,...,...
Vietnam,2843,1104,1739,61.167781,3.170290,96.829710
West Bank and Gaza,290972,48728,242244,83.253371,1.034313,98.965687
Yemen,6137,1976,4161,67.801858,30.414980,69.585020
Zambia,91358,16168,75190,82.302590,2.158585,97.841415


In [128]:
def chile_respecto_a(dataframe, dataframe2):
    ranking_confirmados = dataframe.sort_values(by='Confirmados', ascending = False)
    ranking_cerrados = dataframe.sort_values(by='Cerrados', ascending = False)
    ranking_activos = dataframe.sort_values(by='Activos', ascending = False)

    ranking_porcentaje_activos_confirmados = dataframe.sort_values(by='porcentaje Activos/Confirmado', ascending = False)
    ranking_porcentaje_decesos_cerrados = dataframe.sort_values(by='porcentaje Decesos/Cerrados', ascending = False)
    ranking_porcentaje_recuperados_cerrados = dataframe.sort_values(by='porcentaje Recuperados/Cerrados', ascending = False)

    ranking_incidencia = dataframe2.sort_values(by='Incidencia', ascending = False)
    ranking_recuperacion = dataframe2.sort_values(by='Recuperacion', ascending = False)
    ranking_mortalidad = dataframe2.sort_values(by='Mortalidad', ascending = False)
    print(
        'Confirmados: ' + str(ranking_confirmados.index.get_loc('Chile')) + "\n",
        'Cerrados: ' + str(ranking_cerrados.index.get_loc('Chile')) + "\n",
        'Activos: ' + str(ranking_activos.index.get_loc('Chile')) + "\n",
        '%Activos confirmados: ' + str(ranking_porcentaje_activos_confirmados.index.get_loc('Chile')) + "\n",
        '%Decesos cerrados: ' + str(ranking_porcentaje_decesos_cerrados.index.get_loc('Chile')) + "\n",
        '%Recuperados cerrados: ' + str(ranking_porcentaje_recuperados_cerrados.index.get_loc('Chile')) + "\n",
        'Incidencia: ' + str(ranking_incidencia.index.get_loc('Chile')) + "\n",
        'Recuperación: ' + str(ranking_recuperacion.index.get_loc('Chile')) + "\n",
        'Mortalidad: ' + str(ranking_mortalidad.index.get_loc('Chile')) + "\n"
    )

### Posición de Chile con respecto a todo el mundo

In [129]:
chile_respecto_a(data_df, data_2_df)


Confirmados: 22
 Cerrados: 10
 Activos: 29
 %Activos confirmados: 149
 %Decesos cerrados: 77
 %Recuperados cerrados: 110
 Incidencia: 39
 Recuperación: 6
 Mortalidad: 6



### Poisición de Chile con respecto a la OCDE

In [130]:
paises_ocde = ['Australia','Austria','Belgium','Canada','Chile','Colombia','Czechia','Denmark','Estonia','Finland','France','Germany','Greece','Hungary','Iceland','Ireland','Israel','Italy','Japan','Korea, South','Latvia','Lithuania','Luxembourg','Mexico','Netherlands','New Zealand','Norway','Poland','Portugal','Slovakia','Slovenia','Spain','Sweden','Switzerland','Turkey','United Kingdom','US']

chile_respecto_a(data_df.loc[paises_ocde], data_2_df.loc[paises_ocde])

Confirmados: 13
 Cerrados: 3
 Activos: 17
 %Activos confirmados: 33
 %Decesos cerrados: 20
 %Recuperados cerrados: 16
 Incidencia: 19
 Recuperación: 1
 Mortalidad: 2



### Posición de Chile con respecto a latinoamérica

In [131]:
paises_latinoamerica = ['Argentina', 'Bolivia', 'Brazil', 'Chile', 'Colombia', 'Costa Rica', 'Cuba', 'Ecuador', 'El Salvador', 'Grenada', 'Guatemala', 'Haiti', 'Honduras', 'Jamaica', 'Mexico', 'Nicaragua', 'Paraguay', 'Panama', 'Peru', 'Dominican Republic', 'Suriname', 'Uruguay', 'Venezuela']

chile_respecto_a(data_df.loc[paises_latinoamerica], data_2_df.loc[paises_latinoamerica])

Confirmados: 5
 Cerrados: 5
 Activos: 5
 %Activos confirmados: 14
 %Decesos cerrados: 14
 %Recuperados cerrados: 8
 Incidencia: 3
 Recuperación: 1
 Mortalidad: 2



Chile con respecto al resto del mundo, se muestra en los primeros lugares tanto en casos confirmados, como de cerrados, en cuanto a los análisis de recuperación y mortalidad también se muestra en los mayores índices de la tabla, esto es debido a que estos valores tienen una estrecha relación con los de confirmados y cerrados. Para realizar una comparacion con el resto de los países del mundo, resultan útiles los valores de Incidencia, recuperación y mortalidad ya que utilizan una proporción en la que no incide la cantidad de población del país.
En cuanto al análisis con respecto a los países de la OCDE, se logra apreciar una preocupante cercanía a los primeros lugares tanto en incidencia, recuperación y mortalidad, lo que también se acompaña por la cantidad de casos confirmados, es decir, dentro de los países de la OCDE tenemos relativamente uno de los mayores indices de contagios, y estos han desencadenado en una mayor mortalidad e incidencia, siendo uno de los países con menor PIB respecto al resto de los países miembros se puede deducir que existe una relación entre la riqueza de un país y el comportamiento en esta crisis.
Con respecto a los países de latinamérica, también Chile se muestra entre los países con mayor incidencia, recuperación y mortalidad, y aunque la cantidad de casos confirmados es menor en comparación al resto, esto se debe a que la cantidad de población también es menor.


### Análisis temporal y comparativo (2.0pt)

1. Construya una interfaz gráfica usando `ipywidgets` y `matplotlib` que permita realizar comparaciones entre las series de tiempo de COVID-19 de dos países seleccionados arbitrariamente. A modo de simplificación considere sólo los países de la [OCDE](https://es.wikipedia.org/wiki/Organizaci%C3%B3n_para_la_Cooperaci%C3%B3n_y_el_Desarrollo_Econ%C3%B3micos). Requerimientos:
    1. La interfaz debe incluir controles para escoger dos países a partir de una lista
    1. La interfaz debe incluir tres [tabs](https://ipywidgets.readthedocs.io/en/latest/examples/Widget%20List.html#Tabs), el primero debe mostrar las series de tiempo de ambos países de los casos confirmados, el segundo la de recuperados y el tercero la de los decesos, respectivamente. Use una leyenda para indicar el nombre de los países.
    1. La interfaz debe tener un control que permita escoger entre casos acumulados y casos nuevos  
    1. La interfaz debe tener un control que permita escoger entre valores absolutos y valores relativos (tasas por 100.000 habitantes)
    1. La interfaz debe tener un control que permita escoger entre valores diarios y valores semanales (acumulados). Para esto último se recomienda usar `groupby` con una [frecuencia lunes a lunes](https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#anchored-offsets)
    
En base a su interfaz:   

1. Describa en detalle la situación de Chile con respecto a la evolución temporal de las series de tiempo. En particular destaque patrones y comportamientos que considere relevantes y compare lo que observa en las distintas series de tiempo. Considerando la evolución a nivel de semana, conteste ¿En qué fechas ocurre un aumento o disminución notoria de los casos? ¿En qué fechas hay máximos y mínimos?
1. Considerando métricas que sean relativas compare el caso de Chile contra cinco países de la OCDE seleccionados por ustedes. Destaque semejanzas y diferencias considerando las cantidades y los posibles desfases temporales existentes.


## 1. Análisis temporal y comparativo

In [139]:

def data(country,df):
    return df.loc[country]

def update_plot_confirmados(country1,country2):
    fig, ax = plt.subplots(figsize=(9,4), tight_layout = True)
    slider_layout = widgets.Layout(width='600px', height='20px', margin='10px')
    ax.plot(data(country1,df_confirmados), label = country1)
    ax.plot(data(country2,df_confirmados), label = country2)
    ax.get_xaxis().set_visible(False)
    plt.legend()
    
def update_plot_recuperados(country1,country2):
    fig, ax = plt.subplots(figsize=(9,4), tight_layout = True)
    slider_layout = widgets.Layout(width='600px', height='20px', margin='10px')
    ax.plot(data(country1,df_recuperados),label = country1)
    ax.plot(data(country2,df_recuperados),label = country2)
    ax.get_xaxis().set_visible(False)
    plt.legend()
    
def update_plot_decesos(country1,country2):
    fig, ax = plt.subplots(figsize=(9,4), tight_layout = True)
    slider_layout = widgets.Layout(width='600px', height='20px', margin='10px')
    ax.plot(data(country1,df_muertes),label = country1)
    ax.plot(data(country2,df_muertes),label = country2)
    ax.get_xaxis().set_visible(False)
    plt.legend()
    

def df_confirmados_nuevos(df):
    print(df.iloc[1]-df.iloc[0])
    return df

confirmados_nuevos = df_confirmados_nuevos(df_confirmados)
display(df_confirmados)


2020-01-22        0
2020-01-23        0
2020-01-24        0
2020-01-25        0
2020-01-26        0
              ...  
2021-04-21    71766
2021-04-22    71802
2021-04-23    71728
2021-04-24    71679
2021-04-25    71694
Length: 460, dtype: int64


Unnamed: 0_level_0,2020-01-22,2020-01-23,2020-01-24,2020-01-25,2020-01-26,2020-01-27,2020-01-28,2020-01-29,2020-01-30,2020-01-31,...,2021-04-16,2021-04-17,2021-04-18,2021-04-19,2021-04-20,2021-04-21,2021-04-22,2021-04-23,2021-04-24,2021-04-25
Country/Region,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Afghanistan,0,0,0,0,0,0,0,0,0,0,...,57612,57721,57793,57898,58037,58214,58312,58542,58730,58843
Albania,0,0,0,0,0,0,0,0,0,0,...,129307,129456,129594,129694,129842,129980,130114,130270,130409,130537
Algeria,0,0,0,0,0,0,0,0,0,0,...,119323,119486,119642,119805,119992,120174,120363,120562,120736,120922
Andorra,0,0,0,0,0,0,0,0,0,0,...,12712,12771,12805,12805,12874,12917,12942,13007,13024,13060
Angola,0,0,0,0,0,0,0,0,0,0,...,24122,24300,24389,24518,24661,24883,25051,25279,25492,25609
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Vietnam,0,2,2,2,2,2,2,2,2,2,...,2772,2781,2785,2791,2800,2812,2824,2830,2833,2843
West Bank and Gaza,0,0,0,0,0,0,0,0,0,0,...,278135,279753,280741,282270,284280,286028,287680,289120,290259,290972
Yemen,0,0,0,0,0,0,0,0,0,0,...,5715,5770,5812,5858,5918,5960,6020,6056,6105,6137
Zambia,0,0,0,0,0,0,0,0,0,0,...,90750,90844,90918,90942,91042,91119,91189,91251,91317,91358


In [137]:

control1 = widgets.Dropdown(options=paises_ocde,value='US',description='Country1')
control2 = widgets.Dropdown(options=paises_ocde,value='Chile',description='Country2')

control3 = widgets.Dropdown(options=paises_ocde,value='US',description='Country1')
control4 = widgets.Dropdown(options=paises_ocde,value='Chile',description='Country2')

control5 = widgets.Dropdown(options=paises_ocde,value='US',description='Country1')
control6 = widgets.Dropdown(options=paises_ocde,value='Chile',description='Country2')

out1 = widgets.interactive_output(update_plot_confirmados,{'country1':control1,'country2':control2})
out2 =  widgets.interactive_output(update_plot_recuperados,{'country1':control3,'country2':control4})
out3 =  widgets.interactive_output(update_plot_decesos,{'country1':control5,'country2':control6})


array_de_array = widgets.VBox([control1,control2,out1])
array_de_array2 = widgets.VBox([control3,control4,out2])
array_de_array3 = widgets.VBox([control5,control6,out3])

ui = widgets.HBox([array_de_array])
ui2 = widgets.HBox([array_de_array2])
ui3 = widgets.HBox([array_de_array3])


tab = widgets.Tab(children = [ui,ui2,ui3])
tab.set_title(0, 'Confirmados')
tab.set_title(1, 'Recuperados')
tab.set_title(2, 'Decesos')
display(tab)





Tab(children=(HBox(children=(VBox(children=(Dropdown(description='Country1', index=36, options=('Australia', '…

### Dashboard interactivo (1.0pt)

Implemente un *dashboard web* interactivo a partir de la interfaz desarrollada en el punto anterior utilizando la librería [voila](https://github.com/voila-dashboards/voila). Sirva su interfaz en la nube, para esto puede considerar los servicios gratuitos [binder](https://mybinder.org/) o [heroku](https://www.heroku.com/free). Revise la documentación de voila [con respecto a *deployment* en la nube](https://voila.readthedocs.io/en/stable/deploy.html) y este repositorio con [un ejemplo en base a heroku](https://github.com/voila-dashboards/voila-heroku). Entregue el link de su dashboard web