**Importamos las librerías necesarias**

In [1]:
import pandas as pd
import numpy as np
import seaborn as sns

**Cargamos nuestras bases de datos**

In [2]:
cg = pd.read_csv("https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv")
dg = pd.read_csv("https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv")
rg = pd.read_csv("https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv")

**Recordemos que:**
- cg: Tabla de casos confirmados a nivel global.
- dg: Tabla de muertes a nivel global.
- rg: Tabla de recuperados a nivel global.

**Tal y como comentamos en la sección anterior, lo primero que haremos será eliminar las variables de 'Province/State', 'Lat' y 'Long':**

In [3]:
cg = cg.drop('Province/State', axis=1)
dg = dg.drop('Province/State', axis=1)
rg = rg.drop('Province/State', axis=1)

cg = cg.drop(['Lat','Long'], axis=1)
dg = dg.drop(['Lat','Long'], axis=1)
rg = rg.drop(['Lat','Long'], axis=1)

**¿Cuántos duplicados tenemos?:**

In [4]:
cg['Country/Region'].duplicated().sum()

88

In [5]:
dg['Country/Region'].duplicated().sum()

88

In [6]:
rg['Country/Region'].duplicated().sum()

73

**Nuestras bases quedaron con datos duplicados debido a que habían países que se encontraban subdivididos a nivel de Provincia o Estado. Primero, solucionaremos esta problemática agrupando la información a nivel de país.** 

**Posteriormente, procederemos a despivotar nuestras tablas, de modo tal que las columnas de fechas pasarán a ser filas. Esto nos facilitará las tareas de revisión y análisis:**

In [10]:
cg = cg.groupby('Country/Region').sum().reset_index()
dg = dg.groupby('Country/Region').sum().reset_index()
rg = rg.groupby('Country/Region').sum().reset_index()

In [9]:
cg_despivotada = pd.melt(cg, id_vars='Country/Region', var_name='Fecha', value_name='Confirmados acumulados')
cg_despivotada['Fecha'] = pd.to_datetime(cg_despivotada['Fecha'])

dg_despivotada = pd.melt(dg, id_vars='Country/Region', var_name='Fecha', value_name='Muertes acumuladas')
dg_despivotada['Fecha'] = pd.to_datetime(dg_despivotada['Fecha'])

rg_despivotada = pd.melt(rg, id_vars='Country/Region', var_name='Fecha', value_name='Recuperados acumulados')
rg_despivotada['Fecha'] = pd.to_datetime(rg_despivotada['Fecha'])