# 03 Datos abiertos sobre COVID-19

Estudiaremos los datos abiertos sobre la [vacunación COVID-19 en México](https://datos.gob.mx/busca/dataset/informacion-referente-a-casos-covid-19-en-mexico). Para saber las columnas baje el [Diccionario de Datos](https://www.gob.mx/salud/documentos/datos-abiertos-152127).

1. Descargue **datos_abiertos_covid19.zip** en el vínculo anterior.
2. Descomprima el archivo y póngalo en el mismo directorio donde está este _notebook_.
3. Cambie el nombre del archivo en `archivo_csv = Path("211007COVID19MEXICO.csv")`
4. En la siguiente celda debe decir "Ya veo el archivo".

In [None]:
# Pathlib es para usar archivos de nuestro sistema operativo
from pathlib import Path

archivo_csv = Path("211007COVID19MEXICO.csv")
if archivo_csv.exists():
    print("Ya veo el archivo", archivo_csv.name)
else:
    raise Exception("No lo encuentro")

In [None]:
# Pandas es excelente para analizar datos
import pandas as pd

In [None]:
# Cargar el archivo. NOTA: Se tarda un buen tiempo por su tamaño
covid19 = pd.read_csv(archivo_csv, low_memory=False)

In [None]:
# Dar un viztazo a sus primeros renglones
covid19.head()

In [None]:
# Mostrar las columnas
covid19.columns

In [None]:
# Coahuila de Zaragoza es la entidad 5
entidad = covid19[covid19.ENTIDAD_RES == 5]
len(entidad)

In [None]:
# Elegimos unas columnas y las redefinimos como categorias para se cuantifiquen
entidad = entidad[["SEXO", "ENTIDAD_RES", "MUNICIPIO_RES", "FECHA_DEF", "INTUBADO", "EDAD"]]
entidad.SEXO = entidad.SEXO.astype('category')
entidad.ENTIDAD_RES = entidad.ENTIDAD_RES.astype('category')
entidad.MUNICIPIO_RES = entidad.MUNICIPIO_RES.astype('category')
entidad.INTUBADO = entidad.INTUBADO.astype('category')
entidad.info()

In [None]:
# Los sexos
entidad.SEXO.cat.categories

In [None]:
# Los municipios
entidad.MUNICIPIO_RES.cat.categories

In [None]:
# Las fechas de defuncion
entidad.FECHA_DEF.unique()

In [None]:
# Pivot table
entidad.pivot_table(
    index=["MUNICIPIO_RES"], 
    columns=pd.Grouper(key="SEXO"), 
    values="ENTIDAD_RES", 
    aggfunc='count',
)