# INFOVIS 2021 - Vacunaciones Argentina 2021
## 1) Obtención de Datos

Fuente: Ministerio de Salud de la Nación, Dirección de Control de Enfermedades Inmunoprevenibles (DiCEI)

Dosis Aplicadas en la República Argentina - [Dataset](http://datos.salud.gob.ar/dataset/vacunas-contra-covid19-dosis-aplicadas-en-la-republica-argentina)

In [1]:
import pandas as pd
import os

In [None]:
!wget -c https://sisa.msal.gov.ar/datos/descargas/covid-19/files/datos_nomivac_covid19.zip

In [None]:
!unzip datos_nomivac_covid19.zip

In [4]:
df = pd.read_csv("datos_nomivac_covid19.csv", dtype= {'jurisdiccion_residencia_id' : object, 
                                                      'depto_residencia_id'        : object, 
                                                      'jurisdiccion_aplicacion_id' : object, 
                                                      'depto_aplicacion_id'        : object})

In [5]:
print('{:,}'.format(df.shape[0]))

51,222,138


In [6]:
df.head()

Unnamed: 0,sexo,grupo_etario,jurisdiccion_residencia,jurisdiccion_residencia_id,depto_residencia,depto_residencia_id,jurisdiccion_aplicacion,jurisdiccion_aplicacion_id,depto_aplicacion,depto_aplicacion_id,fecha_aplicacion,vacuna,condicion_aplicacion,orden_dosis,lote_vacuna
0,M,30-39,Buenos Aires,6,La Plata,441,Buenos Aires,6,Quilmes,658,2021-07-25,Sinopharm,18 a 39 años SIN Factores de Riesgo,1,202106B1335
1,F,18-29,Corrientes,18,Capital,21,Corrientes,18,Capital,21,2021-07-23,Sinopharm,18 a 39 años SIN Factores de Riesgo,1,202106B1345
2,M,60-69,Misiones,54,Eldorado,42,Misiones,54,Eldorado,42,2021-06-23,Sputnik,18 a 59 años CON Factores de Riesgo,1,I-810421
3,F,70-79,Buenos Aires,6,General Pueyrredón,357,Buenos Aires,6,General Pueyrredón,357,2021-08-12,Moderna,60 o más años,2,078C21A
4,F,30-39,San Juan,70,Santa Lucía,98,San Juan,70,Capital,28,2021-08-19,Moderna,18 a 59 años CON Factores de Riesgo,2,022D21A


Datos con fechas desde y hasta

In [7]:
[df.fecha_aplicacion.min(), df.fecha_aplicacion.max()]

['2020-12-29', '2021-09-28']

## Porcentaje de Vacunados por Jurisdicción.

In [40]:
df_jurisdiccion_aplicacion = df[df["orden_dosis"] == 2].groupby(by="jurisdiccion_aplicacion").size().to_frame(name="cantidad").reset_index()

In [41]:
df_jurisdiccion_aplicacion

Unnamed: 0,jurisdiccion_aplicacion,cantidad
0,Buenos Aires,8348062
1,CABA,1894382
2,Catamarca,181819
3,Chaco,445867
4,Chubut,257264
5,Corrientes,428683
6,Córdoba,1924210
7,Entre Ríos,604613
8,Formosa,275738
9,Jujuy,313896


In [42]:
df_jurisdiccion_aplicacion.rename(columns = {'jurisdiccion_aplicacion' : 'jurisdiccion'}, inplace = True)

In [43]:
df_pob_2021 = pd.read_csv("https://federodani.github.io/infovis2021/datasets/poblacion2021.tsv", sep="\t", dtype= {'id' : object})
df_pob_2021

Unnamed: 0,id,jurisdiccion,poblacion
0,6,Buenos Aires,17709598
1,14,Córdoba,3798261
2,2,CABA,3078836
3,82,Santa Fe,3563390
4,50,Mendoza,2010363
5,90,Tucumán,1714487
6,30,Entre Ríos,1398510
7,66,Salta,1441988
8,22,Chaco,1216247
9,18,Corrientes,1130320


In [44]:
df_merge = pd.merge(df_jurisdiccion_aplicacion, df_pob_2021, how='inner', on='jurisdiccion').drop(columns= ['id'])
df_merge

Unnamed: 0,jurisdiccion,cantidad,poblacion
0,Buenos Aires,8348062,17709598
1,CABA,1894382,3078836
2,Catamarca,181819,418991
3,Chaco,445867,1216247
4,Chubut,257264,629181
5,Corrientes,428683,1130320
6,Córdoba,1924210,3798261
7,Entre Ríos,604613,1398510
8,Formosa,275738,610019
9,Jujuy,313896,779212


## Jurisdicciones con vacunaciones foraneas y no foraneas 

Vacunaciones no foráneas (no fueron vacunados en su jurisdicción de residencia)

In [45]:
df_vacunaciones_no_foraneas = df[df["jurisdiccion_residencia_id"] == df["jurisdiccion_aplicacion_id"]].groupby(by="jurisdiccion_aplicacion").size().to_frame(name="cantidad").reset_index()

In [46]:
df_vacunaciones_no_foraneas

Unnamed: 0,jurisdiccion_aplicacion,cantidad
0,Buenos Aires,18923952
1,CABA,3684814
2,Catamarca,468198
3,Chaco,1111476
4,Chubut,604820
5,Corrientes,1103448
6,Córdoba,4328855
7,Entre Ríos,1446575
8,Formosa,679754
9,Jujuy,790802


Vacunaciones foráneas (fueron vacunados en su jurisdicción de residencia)

In [47]:
df_vacunaciones_foraneas = df[df["jurisdiccion_residencia_id"] == df["jurisdiccion_aplicacion_id"]].groupby(by="jurisdiccion_aplicacion").size().to_frame(name="cantidad").reset_index()

In [48]:
df_vacunaciones_foraneas

Unnamed: 0,jurisdiccion_aplicacion,cantidad
0,Buenos Aires,18923952
1,CABA,3684814
2,Catamarca,468198
3,Chaco,1111476
4,Chubut,604820
5,Corrientes,1103448
6,Córdoba,4328855
7,Entre Ríos,1446575
8,Formosa,679754
9,Jujuy,790802


Juntando datos de Totales vacunados Foráneamente y No Foraneamente

In [50]:
df_merge_vacunaciones_foraneas = pd.merge(df_vacunaciones_foraneas, df_vacunaciones_no_foraneas, how='inner', on='jurisdiccion_aplicacion')
df_merge_vacunaciones_foraneas.rename(columns = {'cantidad_x' : 'cantidad_foraneas', 'cantidad_y' : 'cantidad_no_foraneas'}, inplace = True)

In [51]:
df_merge_vacunaciones_foraneas

Unnamed: 0,jurisdiccion_aplicacion,cantidad_foraneas,cantidad_no_foraneas
0,Buenos Aires,18923952,18923952
1,CABA,3684814,3684814
2,Catamarca,468198,468198
3,Chaco,1111476,1111476
4,Chubut,604820,604820
5,Corrientes,1103448,1103448
6,Córdoba,4328855,4328855
7,Entre Ríos,1446575,1446575
8,Formosa,679754,679754
9,Jujuy,790802,790802


Exportamos en csv para poder trabajar con los datos

In [66]:
df_merge_vacunaciones_foraneas.to_csv(r'vacunaciones_foraneas.csv', index = False)

Vacunaciones no foráneas por dosis (fueron vacunados en su jurisdicción de residencia)

In [52]:
df_vacunaciones_no_foraneas_dosis = df[df["jurisdiccion_residencia_id"] != df["jurisdiccion_aplicacion_id"]].groupby(["jurisdiccion_aplicacion", "orden_dosis"]).size().to_frame(name="cantidad").reset_index()

In [53]:
df_vacunaciones_no_foraneas_dosis

Unnamed: 0,jurisdiccion_aplicacion,orden_dosis,cantidad
0,Buenos Aires,1,485784
1,Buenos Aires,2,348570
2,CABA,1,284478
3,CABA,2,235993
4,Catamarca,1,7247
5,Catamarca,2,3976
6,Chaco,1,27252
7,Chaco,2,17328
8,Chubut,1,16435
9,Chubut,2,9948


Vacunaciones foráneas por dosis (fueron vacunados en su jurisdicción de residencia)

In [54]:
df_vacunaciones_foraneas_dosis = df[df["jurisdiccion_residencia_id"] == df["jurisdiccion_aplicacion_id"]].groupby(["jurisdiccion_aplicacion", "orden_dosis"]).size().to_frame(name="cantidad").reset_index()

In [55]:
df_vacunaciones_foraneas_dosis

Unnamed: 0,jurisdiccion_aplicacion,orden_dosis,cantidad
0,Buenos Aires,1,10924460
1,Buenos Aires,2,7999492
2,CABA,1,2026425
3,CABA,2,1658389
4,Catamarca,1,290355
5,Catamarca,2,177843
6,Chaco,1,682937
7,Chaco,2,428539
8,Chubut,1,357504
9,Chubut,2,247316


In [62]:
df_merge_vacunaciones_foraneas_dosis = pd.merge(df_vacunaciones_foraneas_dosis, df_vacunaciones_no_foraneas_dosis,how='left', left_on=['jurisdiccion_aplicacion','orden_dosis'], right_on = ['jurisdiccion_aplicacion','orden_dosis'])
df_merge_vacunaciones_foraneas_dosis.rename(columns = {'cantidad_x' : 'cantidad_foraneas', 'cantidad_y' : 'cantidad_no_foraneas', 'orden_dosis_x' : 'orden_dosis'}, inplace = True)

In [63]:
df_merge_vacunaciones_foraneas_dosis

Unnamed: 0,jurisdiccion_aplicacion,orden_dosis,cantidad_foraneas,cantidad_no_foraneas
0,Buenos Aires,1,10924460,485784
1,Buenos Aires,2,7999492,348570
2,CABA,1,2026425,284478
3,CABA,2,1658389,235993
4,Catamarca,1,290355,7247
5,Catamarca,2,177843,3976
6,Chaco,1,682937,27252
7,Chaco,2,428539,17328
8,Chubut,1,357504,16435
9,Chubut,2,247316,9948


Exportamos en csv para poder trabajar con los datos

In [64]:
df_merge_vacunaciones_foraneas_dosis.to_csv(r'vacunaciones_foraneas_dosis.csv', index = False)