### Instrucciones generales <a class="tocSkip"></a>
1. Forme un grupo de **máximo dos estudiantes**
1. Copie este notebook y **modifique el nombre de archivo** agregando los apellidos de ambos miembros. Por ejemplo si los miembros del grupo son Pablo Huijse y Ana Nuñez el nombre sería: `info147_tarea1_huijse_nuñez.ipynb`
1. Versione su trabajo usando un **repositorio privado de github**. Agregue a su compañero y a su profesor (usuario github: phuijse) en la pestaña Puede agregar a su compañero en la pestaña *Settings/Manage access*
1. Sean leales y honestos, no copie los resultados de otros grupos, el único afectado es usted
1. Entregue el notebook con sus respuestas antes del plazo final al correo: phuijse@inf.uach.cl

# Tarea 1: Explorando datos mundiales de COVID-19 <a class="tocSkip"></a>

![ejemplo.png](attachment:ejemplo.png)


En esta actividad exploraremos la [base de datos de COVID-19 mantenida por la universidad John Hopkins](https://github.com/CSSEGISandData/COVID-19)

Utilice la versión con datos al 16 de Junio que se encuentra adjunto a este notebook en el archivo `data.zip`

Luego de descomprimir deberían observar cuatro archivos

Cada fila de estos archivos corresponde a un país y una región en particular con su latitud, longitud y una serie de tiempo de:

- `covid19_confirmados.csv` : Número de casos totales reportados como COVID-19 positivos
- `covid19_recuperados.csv` : Número de casos totales reportados como recuperados (podría ser considerablemente al valor real)
- `covid19_muertes.csv` : Número de decesos totales por COVID-19

El cuarto archivo `población_mundial.csv` contiene la población por país al 2020 más otros indicadores



> En cada sección de este cuadernillo encontrará instrucciones y preguntas

> Lea cuidadosamente los enunciados y complete con sus respuestas y resultados

> Escriba las rutinas de Python necesarias para resolver los problemas de cada punto. Use las librerías vistas en el curso, se evaluará el resultado pero también la eficiencia de su solución

In [41]:
%matplotlib notebook
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd



## Preparación de datos (1.5pt)

### Análisis preliminar

Considere el archivo `covid19_confirmados.csv` y conteste

- Use `head` para mostrar las tres primeras filas
- Use `cat` y `wc` para contar el número de filas del archivo
- Responda ¿A que corresponden las filas y columnas?  
- Responda ¿Qué tipo es más adecuado para cada columna?

In [72]:
#Use head para mostrar las tres primeras filas
!head -3 covid19_confirmados.csv
#filas: cada fila contiene la latlong de un pais, y el numero de casos covid 
# acumulados en cada fecha



Province/State,Country/Region,Lat,Long,1/22/20,1/23/20,1/24/20,1/25/20,1/26/20,1/27/20,1/28/20,1/29/20,1/30/20,1/31/20,2/1/20,2/2/20,2/3/20,2/4/20,2/5/20,2/6/20,2/7/20,2/8/20,2/9/20,2/10/20,2/11/20,2/12/20,2/13/20,2/14/20,2/15/20,2/16/20,2/17/20,2/18/20,2/19/20,2/20/20,2/21/20,2/22/20,2/23/20,2/24/20,2/25/20,2/26/20,2/27/20,2/28/20,2/29/20,3/1/20,3/2/20,3/3/20,3/4/20,3/5/20,3/6/20,3/7/20,3/8/20,3/9/20,3/10/20,3/11/20,3/12/20,3/13/20,3/14/20,3/15/20,3/16/20,3/17/20,3/18/20,3/19/20,3/20/20,3/21/20,3/22/20,3/23/20,3/24/20,3/25/20,3/26/20,3/27/20,3/28/20,3/29/20,3/30/20,3/31/20,4/1/20,4/2/20,4/3/20,4/4/20,4/5/20,4/6/20,4/7/20,4/8/20,4/9/20,4/10/20,4/11/20,4/12/20,4/13/20,4/14/20,4/15/20,4/16/20,4/17/20,4/18/20,4/19/20,4/20/20,4/21/20,4/22/20,4/23/20,4/24/20,4/25/20,4/26/20,4/27/20,4/28/20,4/29/20,4/30/20,5/1/20,5/2/20,5/3/20,5/4/20,5/5/20,5/6/20,5/7/20,5/8/20,5/9/20,5/10/20,5/11/20,5/12/20,5/13/20,5/14/20,5/15/20,5/16/20,5/17/20,5/18/20,5/19/20,5/20/20,5/21/20,5/22/20,5/23/20,5/24/20,5/25/

In [74]:
#Use cat y wc para contar el número de filas del archivo
!cat covid19_confirmados.csv | wc -l

267


- Para la columna *Province/State* como para la columna *Country/Region* el tipo mas adecuado es un String ya que almacena un nombre.
- En las columna *lat* y *long* como se usan numeros reales se pueden expreser mediante el tipo float
- Para el resto de las columnas, si bien representan fechas, en estas se almacena la cantidad de personas de covid confirmadas lo que se puede representar mediante un tipo int.


### Cree un primer DataFrame a partir de `covid19_confirmados.csv` 

1. Utilize el nombre de pais como índice principal
1. Elimine las columnas `Lat` y `Long`
1. Use TimeStamps para los "nombres de columna" asociados a fechas
1. Reduzca la columna `Province/State`, el DataFrame resultante debe tener los totales a nivel país

### Cree un segundo DataFrame a partir `poblacion_mundial.csv`

1. Utilice el nombre de pais como índice principal
1. Elimina todas las columnas excepto `Population`

### Haga un `merge` de ambos DataFrames
1. Asigne un valor de `Population` a los elementos de primer DataFrame
1. Descarte las filas que no recibieron un valor de población

In [42]:
#Utilize el nombre de pais como índice principal
dfcc=pd.read_csv("covid19_confirmados.csv",index_col="Country/Region")
dfcc.rename_axis('Country',inplace=True)

In [43]:
#elimina comuna 'lat' y long
dfcc.drop(['Lat', 'Long'], axis=1,inplace=True)


In [44]:
#Use TimeStamps para los "nombres de columna" asociados a fechas
prov = dfcc['Province/State']
dfcc = dfcc.drop(['Province/State'], axis=1)
dfcc.columns = pd.to_datetime(dfcc.columns)
dfcc.insert(loc = 0, column = 'Province/State', value = prov)
display(dfcc)

Unnamed: 0_level_0,Province/State,2020-01-22 00:00:00,2020-01-23 00:00:00,2020-01-24 00:00:00,2020-01-25 00:00:00,2020-01-26 00:00:00,2020-01-27 00:00:00,2020-01-28 00:00:00,2020-01-29 00:00:00,2020-01-30 00:00:00,...,2020-06-07 00:00:00,2020-06-08 00:00:00,2020-06-09 00:00:00,2020-06-10 00:00:00,2020-06-11 00:00:00,2020-06-12 00:00:00,2020-06-13 00:00:00,2020-06-14 00:00:00,2020-06-15 00:00:00,2020-06-16 00:00:00
Country,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Afghanistan,,0,0,0,0,0,0,0,0,0,...,20342,20917,21459,22142,22890,23546,24102,24766,25527,26310
Albania,,0,0,0,0,0,0,0,0,0,...,1246,1263,1299,1341,1385,1416,1464,1521,1590,1672
Algeria,,0,0,0,0,0,0,0,0,0,...,10154,10265,10382,10484,10589,10698,10810,10919,11031,11147
Andorra,,0,0,0,0,0,0,0,0,0,...,852,852,852,852,852,853,853,853,853,854
Angola,,0,0,0,0,0,0,0,0,0,...,91,92,96,113,118,130,138,140,142,148
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Sao Tome and Principe,,0,0,0,0,0,0,0,0,0,...,513,513,514,611,632,639,659,661,662,671
Yemen,,0,0,0,0,0,0,0,0,0,...,484,496,524,560,591,632,705,728,844,885
Comoros,,0,0,0,0,0,0,0,0,0,...,141,141,141,162,162,163,176,176,176,197
Tajikistan,,0,0,0,0,0,0,0,0,0,...,4529,4609,4690,4763,4834,4902,4971,5035,5097,5160


In [45]:
#Reduzca la columna Province/State, el DataFrame resultante debe tener los totales a nivel país

dfcc=dfcc.groupby(["Country"]).sum()


### DataFrame a partir `poblacion_mundial.csv`



In [46]:
#1. nombre de pais como índice principal
#2. Elimina todas las columnas excepto `Population`
dfpm=pd.read_csv("población_mundial.csv",index_col="Country")
lista=(dfpm.columns)
dfpm.drop(lista[1:], axis=1,inplace=True)
dfpm

Unnamed: 0_level_0,Population
Country,Unnamed: 1_level_1
China,1438207241
India,1377233523
US,330610570
Indonesia,272931713
Pakistan,219992900
...,...
Montserrat,4991
Falkland Islands,3458
Niue,1624
Tokelau,1354


In [47]:
##Haga un merge de ambos DataFrames
dfcc.reset_index(inplace=True)
dfpm.reset_index(inplace=True)

#finalConfirmados= dataFrame covid confirmados con poblacion mundial
finalConfirmados=pd.merge(dfcc,dfpm)
finalConfirmados.set_index("Country",inplace=True)

In [48]:
finalConfirmados

Unnamed: 0_level_0,2020-01-22 00:00:00,2020-01-23 00:00:00,2020-01-24 00:00:00,2020-01-25 00:00:00,2020-01-26 00:00:00,2020-01-27 00:00:00,2020-01-28 00:00:00,2020-01-29 00:00:00,2020-01-30 00:00:00,2020-01-31 00:00:00,...,2020-06-08 00:00:00,2020-06-09 00:00:00,2020-06-10 00:00:00,2020-06-11 00:00:00,2020-06-12 00:00:00,2020-06-13 00:00:00,2020-06-14 00:00:00,2020-06-15 00:00:00,2020-06-16 00:00:00,Population
Country,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Afghanistan,0,0,0,0,0,0,0,0,0,0,...,20917,21459,22142,22890,23546,24102,24766,25527,26310,38742911
Albania,0,0,0,0,0,0,0,0,0,0,...,1263,1299,1341,1385,1416,1464,1521,1590,1672,2878420
Algeria,0,0,0,0,0,0,0,0,0,0,...,10265,10382,10484,10589,10698,10810,10919,11031,11147,43685618
Andorra,0,0,0,0,0,0,0,0,0,0,...,852,852,852,852,853,853,853,853,854,77240
Angola,0,0,0,0,0,0,0,0,0,0,...,92,96,113,118,130,138,140,142,148,32644783
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Vietnam,0,2,2,2,2,2,2,2,2,2,...,332,332,332,332,333,334,334,334,334,97160127
Western Sahara,0,0,0,0,0,0,0,0,0,0,...,9,9,9,9,9,9,9,9,9,594215
Yemen,0,0,0,0,0,0,0,0,0,0,...,496,524,560,591,632,705,728,844,885,29687214
Zambia,0,0,0,0,0,0,0,0,0,0,...,1200,1200,1200,1200,1321,1357,1358,1382,1405,18273379


Repita el procedimiento anterior para los archivos covid19_recuperados.csv y covid19_muertes.csv

In [50]:
#Utilize el nombre de pais como índice principal

dfcm=pd.read_csv("covid19_muertes.csv", index_col="Country/Region")
dfcm.rename_axis('Country',inplace=True)




In [51]:
#elimina comuna 'lat' y long
dfcm.drop(['Lat', 'Long'], axis=1,inplace=True)

In [52]:
#Use TimeStamps para los "nombres de columna" asociados a fechas
prov = dfcm['Province/State']
dfcm = dfcm.drop(['Province/State'], axis=1)
dfcm.columns = pd.to_datetime(dfcm.columns)
dfcm.insert(loc = 0, column = 'Province/State', value = prov)

In [53]:
#Reduzca la columna Province/State, el DataFrame resultante debe tener los totales a nivel país
dfcm=dfcm.groupby(["Country"]).sum()

In [54]:
##Haga un merge de ambos DataFrames
dfcm.reset_index(inplace=True)
finalMuertes=pd.merge(dfcm,dfpm)
finalMuertes.set_index("Country",inplace=True)

In [55]:
finalMuertes

Unnamed: 0_level_0,2020-01-22 00:00:00,2020-01-23 00:00:00,2020-01-24 00:00:00,2020-01-25 00:00:00,2020-01-26 00:00:00,2020-01-27 00:00:00,2020-01-28 00:00:00,2020-01-29 00:00:00,2020-01-30 00:00:00,2020-01-31 00:00:00,...,2020-06-08 00:00:00,2020-06-09 00:00:00,2020-06-10 00:00:00,2020-06-11 00:00:00,2020-06-12 00:00:00,2020-06-13 00:00:00,2020-06-14 00:00:00,2020-06-15 00:00:00,2020-06-16 00:00:00,Population
Country,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Afghanistan,0,0,0,0,0,0,0,0,0,0,...,369,384,405,426,446,451,471,478,491,38742911
Albania,0,0,0,0,0,0,0,0,0,0,...,34,34,34,35,36,36,36,36,37,2878420
Algeria,0,0,0,0,0,0,0,0,0,0,...,715,724,732,741,751,760,767,777,788,43685618
Andorra,0,0,0,0,0,0,0,0,0,0,...,51,51,51,51,51,51,51,51,52,77240
Angola,0,0,0,0,0,0,0,0,0,0,...,4,4,4,5,5,6,6,6,6,32644783
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Vietnam,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,97160127
Western Sahara,0,0,0,0,0,0,0,0,0,0,...,1,1,1,1,1,1,1,1,1,594215
Yemen,0,0,0,0,0,0,0,0,0,0,...,112,127,129,136,139,160,164,208,214,29687214
Zambia,0,0,0,0,0,0,0,0,0,0,...,10,10,10,10,10,10,11,11,11,18273379


In [56]:
#Utilize el nombre de pais como índice principal

dfcr=pd.read_csv("covid19_recuperados.csv",index_col="Country/Region")

dfcr.rename_axis('Country',inplace=True)



In [57]:
#elimina la columna lat y long
dfcr.drop(['Lat', 'Long'], axis=1,inplace=True)

In [58]:
#Use TimeStamps para los "nombres de columna" asociados a fechas
prov = dfcr['Province/State']
dfcr = dfcr.drop(['Province/State'], axis=1)
dfcr.columns = pd.to_datetime(dfcr.columns)
dfcr.insert(loc = 0, column = 'Province/State', value = prov)
#display(dfcr)

In [59]:
#Reduzca la columna Province/State, el DataFrame resultante debe tener los totales a nivel país
dfcr=dfcr.groupby(["Country"]).sum()

In [60]:
##Haga un merge de ambos DataFrames
dfcr.reset_index(inplace=True)
finalRecuperados=pd.merge(dfcr,dfpm)
finalRecuperados.set_index("Country",inplace=True)
#devuelve dfpm a su estado original
dfpm.set_index("Country",inplace=True)

In [34]:
finalRecuperados

Unnamed: 0_level_0,2020-01-22 00:00:00,2020-01-23 00:00:00,2020-01-24 00:00:00,2020-01-25 00:00:00,2020-01-26 00:00:00,2020-01-27 00:00:00,2020-01-28 00:00:00,2020-01-29 00:00:00,2020-01-30 00:00:00,2020-01-31 00:00:00,...,2020-06-08 00:00:00,2020-06-09 00:00:00,2020-06-10 00:00:00,2020-06-11 00:00:00,2020-06-12 00:00:00,2020-06-13 00:00:00,2020-06-14 00:00:00,2020-06-15 00:00:00,2020-06-16 00:00:00,Population
Country,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Afghanistan,0,0,0,0,0,0,0,0,0,0,...,2171,2651,3013,3326,3928,4201,4725,5164,5508,38742911
Albania,0,0,0,0,0,0,0,0,0,0,...,945,960,980,1001,1034,1039,1044,1055,1064,2878420
Algeria,0,0,0,0,0,0,0,0,0,0,...,6799,6951,7074,7255,7322,7420,7606,7735,7842,43685618
Andorra,0,0,0,0,0,0,0,0,0,0,...,751,757,759,780,781,781,781,789,789,77240
Angola,0,0,0,0,0,0,0,0,0,0,...,38,38,40,41,42,61,61,64,64,32644783
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Vietnam,0,0,0,0,0,0,0,0,0,0,...,316,316,320,321,323,323,323,323,325,97160127
Western Sahara,0,0,0,0,0,0,0,0,0,0,...,6,6,6,6,6,8,8,8,8,594215
Yemen,0,0,0,0,0,0,0,0,0,0,...,23,23,23,23,28,39,53,79,91,29687214
Zambia,0,0,0,0,0,0,0,0,0,0,...,912,912,912,912,1104,1104,1122,1142,1142,18273379


## Análisis global (2pt)

Calcule la cantidad total mundial a la fecha (16 de Junio) de los casos 
- confirmados
- cerrados: recuperados + decesos
- activos: confirmados - cerrados

In [144]:
confirmados=finalConfirmados.iloc[:,-2].sum()
decesos=finalMuertes.iloc[:,-2].sum()
recuperados=finalRecuperados.iloc[:,-2].sum()
cerrados=recuperados+decesos
activos=confirmados-cerrados

In [145]:
#no me acuerdo otra aparte del format :C 
display("casos confirmados hasta el 16 de junio: {0}".format(confirmados))
display("casos cerrados hasta el 16 de junio: {0}".format(cerrados))
display("casos activos hasta el 16 de junio: {0}".format(activos))

'casos confirmados hasta el 16 de junio: 8154452'

'casos cerrados hasta el 16 de junio: 4385993'

'casos activos hasta el 16 de junio: 3768459'

En base a estas cantidades calcule el porcentaje de 
- casos activos con respecto al total de confirmados
- decesos con respecto al total de casos cerrados
- recuperados con respecto al total de casos cerrados


In [163]:
porActivos=(activos/confirmados)*100
display("el porcentaje de activos con respecto al total de confirmados es: ")
print("{:.2f}%".format(porActivos))

'el porcentaje de activos con respecto al total de confirmados es: '

46.21%


In [166]:
porMuertes=(decesos/cerrados)*100
display("el porcentaje de decesos con respecto al total de casos cerrados es: ")
print("{:.2f}%".format(porMuertes))

'el porcentaje de decesos con respecto al total de casos cerrados es: '

10.11%


In [168]:
porRecuperados=(recuperados/cerrados)*100
display("el porcentaje de recuperados con respecto al total de casos cerrados es: ")
print("{:.2f}%".format(porRecuperados))

'el porcentaje de recuperados con respecto al total de casos cerrados es: '

89.89%


Muestre gráficas a nivel mundial de
- la cantidad de **casos confirmados nuevos** por día
- la cantidad de **recuperados nuevos** por día
- la cantidad de **decesos nuevos** por día

In [64]:
def casosPorDia(df):
    #2020-01-22 hubieron 0 casos(es la primera columna)
    casos=[0]
    for i in range (1,df.shape[1]-1):
        casos.append(df.iloc[:,i].sum()-df.iloc[:,i-1].sum())
    
    return np.array(casos)
    

In [65]:
casosDiarios=casosPorDia(finalConfirmados)
fig, ax =plt.subplots(figsize=(10,4), facecolor='w')
ax.set_xlabel('tiempo [dias]')
ax.set_ylabel('casos diarios confirmados')
ax.plot(casosDiarios);

<IPython.core.display.Javascript object>

In [25]:
recuperadosDiarios=casosPorDia(finalRecuperados)
fig2, ax2 =plt.subplots(figsize=(10,4), facecolor='w')
ax2.set_xlabel('tiempo [dias]')
ax2.set_ylabel('casos diarios recuperados')
ax2.plot(recuperadosDiarios, c='blue');

<IPython.core.display.Javascript object>

In [26]:
muertosDiarios=casosPorDia(finalMuertes)
fig3, ax3 =plt.subplots(figsize=(10,4), facecolor='w')
ax3.set_xlabel('tiempo [dias]')
ax3.set_ylabel('casos diarios muertos')
ax3.plot(muertosDiarios, c='blue');


<IPython.core.display.Javascript object>

Encuentre y muestre los nombres y los valores de los 5 paises que a la fecha tienen
- La mayor tasa de incidencia (confirmados por 100.000 dividido población)
- La menor tasa de incidencia 
- La mayor tasa de recuperación (recuperados por 100.000 dividido población)
- La menor tasa de recuperación 
- La mayor tasa de mortalidad (decesos por 100.000 divido población)
- La menor tasa de mortalidad 

¿En qué lugar se encuentra Chile con respecto a cada una de estas métricas? ¿A qué paises se parece más? Discuta y comente sobre sus hallazgos

In [141]:
def incidencia(df):
    return (df.iloc[:,-2]*100000/df.iloc[:,-1])
    
    
def mayoresMenores(df):
    #ascending=False          orden descendiente
    df=df.sort_values(axis=0, ascending=False)
    display("Los mayores paises son: ")
    display(df.head(5))
    display("Los menores paises son: ")
    display(df.tail(5))
    
    df=df.reset_index()
    df.rename(columns={0:'incidencia'},inplace=True)
    a=np.arange(1, df.shape[0]+1)
    df.set_index(a,inplace=True)
    
    display("posicion de Chile")
    display(df[(df['Country'] == "Chile")])

In [142]:
display("*****incidencia confirmados*****")
mayoresMenores(incidencia(finalConfirmados))

display("******incidencia muertes*****")
mayoresMenores(incidencia(finalMuertes))

display("*****incidencia recuperados*****")
mayoresMenores(incidencia(finalRecuperados))

'*****incidencia confirmados*****'

'Los mayores paises son: '

Country
Qatar         2858.907348
San Marino    2046.171536
Holy See      1498.127341
Bahrain       1157.921604
Andorra       1105.644744
dtype: float64

'Los menores paises son: '

Country
Angola              0.453365
Vietnam             0.343762
Laos                0.261935
Lesotho             0.187021
Papua New Guinea    0.089771
dtype: float64

'posicion de Chile'

Unnamed: 0,Country,incidencia
6,Chile,966.571789


'******incidencia muertes*****'

'Los mayores paises son: '

Country
San Marino        123.831707
Belgium            83.449365
Andorra            67.322631
United Kingdom     62.013654
Spain              58.043461
dtype: float64

'Los menores paises son: '

Country
Timor-Leste    0.0
Saint Lucia    0.0
Dominica       0.0
Cambodia       0.0
Seychelles     0.0
dtype: float64

'posicion de Chile'

Unnamed: 0,Country,incidencia
17,Chile,17.728003


'*****incidencia recuperados*****'

'Los mayores paises son: '

Country
Qatar         2105.978498
San Marino    1739.540643
Holy See      1498.127341
Andorra       1021.491455
Bahrain        821.139516
dtype: float64

'Los menores paises son: '

Country
Haiti               0.211008
Angola              0.196050
Lesotho             0.093510
Papua New Guinea    0.089771
Sweden              0.000000
dtype: float64

'posicion de Chile'

Unnamed: 0,Country,incidencia
6,Chile,818.705679


Si bien *Chile* se encuentra 6° con mayor tasa de incidencia en los casos confirmados de covid, daria a suponer que que en la incidencia de muertes ocuparia un lugar similiar, sin embargo la incidencia de chile con respecto a las muertes se posiciona en el lugar 17. 

## Análisis comparativo (2.5pt)

Construya una interfaz gráfica usando `ipywidgets` y `matplotlib`

- La interfaz debe incluir dos controles para escoger dos paises entre los paises pertenecientes a la [OCDE](https://es.wikipedia.org/wiki/Organizaci%C3%B3n_para_la_Cooperaci%C3%B3n_y_el_Desarrollo_Econ%C3%B3micos)
- La interfaz debe mostrar tres gráficos con la evolución temporal de casos confirmados, recuperados y decesos en ambos paises 
- La interfaz debe tener un control que permita escoger entre valores totales acumulados, valores totales diarios y tasas por 100.000 habitantes


En base a su interfaz estudie el caso de Chile contra dos paises de la OCDE seleccionados por usted y comente sobre lo que observa

## BONUS (Opcional)

Implemente una app web a partir de su interfaz desarrollada en el punto anterior en base a jupyter widgets usando [viola](https://github.com/voila-dashboards/voila) y [heroku](https://github.com/voila-dashboards/voila-heroku)

Escriba acá el link a su app web