# "COVID-19 por comuna"
> Nuevos casos confirmados por comuna.

- toc: true 
- badges: true
- comments: true
- author: Alonso Silva Allende
- categories: [jupyter]
- image: images/diagram.png

In [1]:
#hide
import numpy as np
import pandas as pd
import altair as alt

# Nuevos casos confirmados por comuna de la R.M

In [2]:
#hide
county_cumulative_cases = pd.read_csv(
    "https://raw.githubusercontent.com/MinCiencia/Datos-COVID19/master/output/producto1/Covid-19.csv")

In [3]:
#hide
county_cumulative_cases_RM = county_cumulative_cases.query("Region=='Metropolitana'").drop(
    columns=["Region", "Codigo region", "Poblacion", "Tasa", "Codigo comuna"])

In [4]:
#hide
county_cases_RM = county_cumulative_cases_RM.set_index("Comuna").T.diff().dropna()

In [5]:
#hide
county_cases_RM["Total"] = county_cases_RM.sum(axis=1)
county_cases_RM = county_cases_RM.T.apply(lambda x: x/x[-1]).T

In [6]:
#hide
start_date = county_cases_RM.reset_index()["index"].iloc[0]
end_date = county_cases_RM.reset_index()["index"].iloc[-1]

data = pd.DataFrame()
data['Fecha'] = pd.date_range(start=start_date, end=end_date).strftime('%Y-%m-%d')
data = data.set_index("Fecha")

In [7]:
#hide
data[list(county_cases_RM.columns)] = county_cases_RM[list(county_cases_RM.columns)]

In [8]:
#hide
data = data.interpolate(method="linear")

In [9]:
#hide
last_known_proportion = data.iloc[-1]

In [10]:
#hide
last_known_date = county_cases_RM.index[-1]
last_known_date

'2020-06-12'

In [11]:
#hide
regional_cumulative_cases = pd.read_csv(
    'https://raw.githubusercontent.com/MinCiencia/Datos-COVID19/master/output/producto3/CasosTotalesCumulativo.csv')

In [12]:
#hide
regional_cumulative_cases_RM = regional_cumulative_cases.query("Region=='Metropolitana'").iloc[-1].drop("Region")
regional_cases_RM = regional_cumulative_cases_RM.diff().dropna()

In [13]:
#hide
n_missing_days = (pd.to_datetime(regional_cases_RM.index[-1])-pd.to_datetime(data.index[-1])).days

In [14]:
#hide
data = data.T

In [15]:
#hide
for i in np.arange(n_missing_days):
    idx = (pd.to_datetime(last_known_date)+pd.DateOffset(1+i)).strftime("%Y-%m-%d")
    print(idx)
    data[idx] = last_known_proportion

2020-06-13
2020-06-14
2020-06-15


In [16]:
#hide
data = data.T

In [17]:
#hide
data["Regional"] = regional_cases_RM

In [18]:
#hide
data = data.T.apply(lambda x: x[:-1]*x[-1]).T.astype(int)

In [19]:
#hide
data_long_form = data.drop(columns="Total").reset_index().melt("Fecha", var_name="Comuna", value_name="Casos confirmados")

In [20]:
#hide_input
input_dropdown = alt.binding_select(options=data_long_form['Comuna'].unique())
selection1 = alt.selection_single(fields=['Comuna'], bind=input_dropdown, name=' ')
selection2 = alt.selection_multi(fields=['Comuna'], on='mouseover')

color = alt.condition(selection1 | selection2,
                    alt.Color('Comuna:N', scale=alt.Scale(scheme='category20'), legend=None),
                    alt.value('lightgray'))

bars1 = alt.Chart(data_long_form).mark_bar().encode(
    x=alt.X("Fecha", axis=alt.Axis(title="", domain=False, tickSize=0)),
    y=alt.Y("Casos confirmados", axis=alt.Axis(title="nuevos casos confirmados")),
    tooltip = ["Fecha", "Comuna", "Casos confirmados"],
    color = color
).properties(
    title="Nuevos casos confirmados por comuna de la R.M.",
    width=700).add_selection(
    selection1, selection2
).transform_filter(
    selection1
)

bars1

Fuente: [Ministerio de Ciencia](https://github.com/MinCiencia/Datos-COVID19), [Ministerio de Salud](https://www.minsal.cl/)

* No hay datos diarios de casos confirmados por comuna. Estos son estimados a través de una interpolación lineal entre las proporciones observadas entre los dos informes más cercanos en el tiempo y aplicados a casos confirmados regionales.

# Total casos confirmados por comuna de la R.M.

In [21]:
#hide
county_total_cases_RM = county_cumulative_cases_RM.set_index("Comuna").T

In [22]:
#hide
county_total_cases_RM["Total"] = county_total_cases_RM.sum(axis=1)
county_total_cases_RM = county_total_cases_RM.T.apply(lambda x: x/x[-1]).T

In [23]:
#hide
start_date = county_total_cases_RM.reset_index()["index"].iloc[0]
end_date = county_total_cases_RM.reset_index()["index"].iloc[-1]

In [24]:
#hide
data = pd.DataFrame()
data['Fecha'] = pd.date_range(start=start_date, end=end_date).strftime('%Y-%m-%d')
data = data.set_index("Fecha")

In [25]:
#hide
data[list(county_total_cases_RM.columns)] = county_total_cases_RM[list(county_total_cases_RM.columns)]

In [26]:
#hide
data = data.interpolate(method="linear")

In [27]:
#hide
last_known_proportion = data.iloc[-1]

In [28]:
#hide
last_known_date = county_total_cases_RM.index[-1]
last_known_date

'2020-06-12'

In [29]:
#hide
regional_cumulative_cases = pd.read_csv(
    'https://raw.githubusercontent.com/MinCiencia/Datos-COVID19/master/output/producto3/CasosTotalesCumulativo.csv')

In [30]:
#hide
regional_cumulative_cases_RM = regional_cumulative_cases.query("Region=='Metropolitana'").iloc[-1].drop("Region")

In [31]:
#hide
n_missing_days = (pd.to_datetime(regional_cumulative_cases_RM.index[-1])-pd.to_datetime(data.index[-1])).days

In [32]:
#hide
data = data.T

In [33]:
#hide
for i in np.arange(n_missing_days):
    idx = (pd.to_datetime(last_known_date)+pd.DateOffset(1+i)).strftime("%Y-%m-%d")
    print(idx)
    data[idx] = last_known_proportion

2020-06-13
2020-06-14
2020-06-15


In [34]:
#hide
data = data.T

In [35]:
#hide
data["Regional"] = regional_cumulative_cases_RM

In [36]:
#hide
data = data.T.apply(lambda x: x[:-1]*x[-1]).T.astype(int)

In [37]:
#hide
data_long_form = data.drop(columns="Total").reset_index().melt("Fecha", var_name="Comuna", value_name="Casos confirmados")

In [38]:
#hide_input
input_dropdown = alt.binding_select(options=data_long_form['Comuna'].unique())
selection1 = alt.selection_single(fields=['Comuna'], bind=input_dropdown, name=' ')
selection2 = alt.selection_multi(fields=['Comuna'], on='mouseover')

color = alt.condition(selection1 | selection2,
                    alt.Color('Comuna:N', scale=alt.Scale(scheme='category20'), legend=None),
                    alt.value('lightgray'))

bars1 = alt.Chart(data_long_form).mark_bar().encode(
    x=alt.X("Fecha", axis=alt.Axis(title="", domain=False, tickSize=0)),
    y=alt.Y("Casos confirmados", axis=alt.Axis(title="total casos confirmados")),
    tooltip = ["Fecha", "Comuna", "Casos confirmados"],
    color = color
).properties(
    title="Total casos confirmados por comuna de la R.M.",
    width=700).add_selection(
    selection1, selection2
).transform_filter(
    selection1
)

bars1

Fuente: [Ministerio de Ciencia](https://github.com/MinCiencia/Datos-COVID19), [Ministerio de Salud](https://www.minsal.cl/)

* No hay datos diarios de casos confirmados por comuna. Estos son estimados a través de una interpolación lineal entre las proporciones observadas entre los dos informes más cercanos en el tiempo y aplicados a casos confirmados regionales.

# Total fallecidos confirmados por comuna de la R.M.

In [39]:
#hide
county_deaths = pd.read_csv("https://raw.githubusercontent.com/MinCiencia/Datos-COVID19/master/output/producto38/CasosFallecidosPorComuna.csv")

In [40]:
#hide
county_deaths.T.tail(3)

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,352,353,354,355,356,357,358,359,360,361
Codigo comuna,15101,15102,15202,15201,,1107,1402,1403,1404,1101,...,12102,12401,12301,12302,12101,12103,12104,12303,12402,
Poblacion,247552,1233,810,2515,252110.0,129999,1375,1583,3000,223463,...,264,23782,7323,694,141984,211,681,282,1021,178362.0
2020-06-12,10,0,0,0,10.0,11,1,1,2,32,...,0,0,0,0,16,0,0,0,0,16.0


In [41]:
#hide
last_date = county_deaths.T.iloc[-1].name
last_date

'2020-06-12'

In [42]:
#hide
county_deaths_RM = county_deaths.query(
    "Region=='Metropolitana'").drop(
    columns=["Region", "Codigo region", "Codigo comuna"]).set_index("Comuna")

In [43]:
#hide
county_deaths_RM = county_deaths_RM.rename(columns={"2020-06-12": "Fallecidos confirmados"})

In [44]:
#hide_input
bars = alt.Chart(county_deaths_RM.drop("Total").reset_index()).mark_bar(opacity=0.8, size=25).encode(
    x = alt.X('Fallecidos confirmados'),
    y = alt.Y('Comuna', sort='-x'),
    tooltip = ['Comuna', 'Poblacion', 'Fallecidos confirmados'],
    color = alt.Color('Comuna', scale=alt.Scale(scheme='tableau20'), legend=None),
)

text = bars.mark_text(
    align='left',
    baseline='middle',
    dx=3  # Nudges text to the right so it doesn't appear on top of the bar
).encode(
    text=alt.Text('Fallecidos confirmados')
)

bars.properties(
    title = f"Total fallecidos confirmados por comuna de la R.M. al {pd.to_datetime(last_date).strftime('%d/%m')}",
    width = 600,
    height = alt.Step(30)
) + text

Fuente: [Ministerio de Ciencia](https://github.com/MinCiencia/Datos-COVID19), [Ministerio de Salud](https://www.minsal.cl/)

# Total fallecidos confirmados por 100.000 habitantes por comuna de la R.M.

In [45]:
#hide
county_deaths_RM["Tasa de mortalidad"] = \
np.round(100000*county_deaths_RM["Fallecidos confirmados"]/county_deaths_RM["Poblacion"], decimals=1)

In [46]:
#hide_input
bars = alt.Chart(county_deaths_RM.drop("Total").reset_index()).mark_bar(opacity=0.8, size=25).encode(
    x = alt.X('Tasa de mortalidad'),
    y = alt.Y('Comuna', sort='-x'),
    tooltip = ['Comuna', 'Poblacion', 'Fallecidos confirmados', 'Tasa de mortalidad'],
    color = alt.Color('Comuna', scale=alt.Scale(scheme='tableau20'), legend=None),
)

text = bars.mark_text(
    align='left',
    baseline='middle',
    dx=3  # Nudges text to the right so it doesn't appear on top of the bar
).encode(
    text=alt.Text('Tasa de mortalidad')
)

bars.properties(
    title = f"Total fallecidos confirmados por 100.000 habitantes por comuna de la R.M. al {pd.to_datetime(last_date).strftime('%d/%m')}",
    width = 600,
    height = alt.Step(30)
) + text

Fuente: [Ministerio de Ciencia](https://github.com/MinCiencia/Datos-COVID19), [Ministerio de Salud](https://www.minsal.cl/)

# Letalidad por comuna de la Region Metropolitana

In [57]:
#hide
county_RM = county_cumulative_cases_RM[["Comuna", "2020-06-12"]]
county_RM = county_RM.rename(columns={"2020-06-12": "Casos confirmados"}).set_index("Comuna")

In [58]:
#hide
county_RM["Fallecidos confirmados"] = county_deaths_RM["Fallecidos confirmados"]
county_RM["Letalidad"] = np.round(county_RM["Fallecidos confirmados"]/county_RM["Casos confirmados"], decimals=3)
county_RM["Texto"] = [f"{np.round(100*county_RM['Letalidad'].iloc[i], decimals=1)}%" for i in np.arange(len(county_RM))]

In [59]:
#hide_input
bars = alt.Chart(county_RM.reset_index()).mark_bar(opacity=0.8, size=25).encode(
    #x = alt.X('Letalidad'),
    x = alt.X('Letalidad', axis=alt.Axis(format='%', title='Letalidad (%)')),
    y = alt.Y('Comuna', sort='-x'),
    tooltip = ['Comuna', 'Casos confirmados', 'Fallecidos confirmados', 'Letalidad'],
    color = alt.Color('Comuna', scale=alt.Scale(scheme='tableau20'), legend=None),
)

text = bars.mark_text(
    align='left',
    baseline='middle',
    dx=3  # Nudges text to the right so it doesn't appear on top of the bar
).encode(
    text=alt.Text('Texto'),
)

bars.properties(
    title = f"Letalidad por comuna de la R.M. al {pd.to_datetime(last_date).strftime('%d/%m')}",
    width = 600,
    height = alt.Step(30)
) + text

Fuente: [Ministerio de Ciencia](https://github.com/MinCiencia/Datos-COVID19), [Ministerio de Salud](https://www.minsal.cl/)

# Advertencia

El número de casos confirmados/informados o fallecimientos confirmados/por o con Covid-19 no representa exactamente el número de casos/contagios o fallecimientos con Covid-19 reales. Estos últimos valores no son conocidos por límites de testeo y por dificultades en la atribución de causas de fallecimiento. Además, los casos/fallecimientos confirmados per capita/por X habitantes, dan mayores valores a comunas con pocos habitantes, por lo que introducen sesgos en los datos.