In [None]:
%load_ext autoreload
%autoreload 2

In [None]:
from covid19_vulnerabilidad_mex.datos import *
from covid19_vulnerabilidad_mex.vulnerabilidad import *

from IPython.display import Image
import seaborn as sns
import matplotlib.pyplot as plt
import datetime

import pandas as pd

In [None]:
plss, serie_vulnerabilidad = calcular_periodo_vulnerabilidad('20-04-24', '20-06-12')

In [None]:
serie_vulnerabilidad.head()

In [None]:
mapas_serie_letalidad(serie_vulnerabilidad)
mapas_serie_vulnerabilidad(serie_vulnerabilidad)

# Introducción

La pandemia del SARS-Cov-2 que provoca la COVID-19, es un fenómeno complejo que requiere una respuesta de política pública considerando multiples factores de salubridad, economía y sociedad. Con la finalidad de apoyar con información en este proyecto construimos un índice que ayude a identificar poblaciones que están en mayor riesgo en caso de contraer la enfermedad. Este índice cunatifica para este fin la vulnerabilidad de una población como consecuencia de sus características de desarrollo social, economía, y salubridad. 

El objetivo de este trabajo es construir una herramienta para identificar poblaciones cuyas características sociales, económicas y de salubridad las hacen vulnerables ante COVID-19. Nuestra finalidad con este análisis es complementar la información que proveen los modelos epidemiológicos con dos elementos nuevos: un ordenamiento de los municipios de México de acuerdo con el riesgo que representa para sus habitantes contraer Sars-Cov-2, y también una lista con los indicadores que se observan más correlacionados con este riesgo. 

Los modelos epidemiológicos no muestran la evolución y el pronóstico de epidemias en áreas donde lleva poco tiempo la epidemia, con pocos contagios o incluso donde no hay registros de casos, los modelos que vemos son sobre regiones donde existe presencia bien establecida de la epidemia. En áreas donde ya hay presencia de la epidemia se puede además de hacer un diagnostico sobre el comportamiento de la dispersión de contagios. Es necesario un diagnóstico sobre la resilencia de la población a la enfermedad, e identificar factores que se correlacionen con tasa altas de comlicaciones, y ultimadamente de defunciones. 

En este sentido, nos preguntamos en qué zonas, haya o no contagios, los habitantes que se infecten corren mayor riesgo. Para responder esta pregunta utilizamos dos aproximaciones. 

1. La primera está determinada por una selección manual de variables, donde escogimos indicadores económicos, sociales y de salubridad relacionadas con lo que consideramos indican o mayor riesgo por comorbilidades o mayor riesgo por falta de capacidad de respuesta para la atención de una persona enferma, este índice sirve como una referencia base que resume deficiencias estructurales en los municipios que los harían más vulnerables a la enfermedad. 
2. En la segunda forma tomamos como variable de respuesta la letalidad reportada en cada muncipio con al menos diez casos confirmados de SARS-COV-2. Para estudiar el fenómeno de letalidad integramos un conjunto de indicadores sociales, económicos y de salubridad y encontramos la combinación de estos que más se relaciona con el nivel de letalidad de COVID-19. Con esta combinación generamos un índice que nos da un ordenamiento de municipios de acuerdo al riesgo al que estarían expuestos sus habitantes si se infectan de Sars-COV-2. 

El conjunto de indicadores que utilizamos para este análisis provienen de CONEVAL, INEGI y CLUES. 

# Métodos

# Índice por acumulación de carencias - Vía PCA

#  Índice dirigido por letalidad de COVID-19 - Vía PLS.

# Resultados y análisis

Nuestro análisis busca identificar el comportamiento del índice a lo largo de los días, por un lado esperamos que sea relativamente estable, aunque esperamos que vaya cambiando según llega nueva información, por otro lado esperamos que tenga una alta correlación con la tasa de letalidad de los municipios. El otro componente de análisis es ver qué variables son informativas y también qué tan estable es ese ranking de importancia. 

El método de ajuste es estándar, no es lo último en modelos de predicción, y esto tiene que ver con dos cosas, por un lado siempre es buena idea probar con el modelo más simple para evaluar qué tanto ganamos utilizado modelos más complejos, pero hay una razón también humana, si estamos diseñando una herramienta cuya intención es que sea utilizado en un escenario determinado, hay que evaluar cuáles son las características de dicho escenarios, quiénes son los usuarios y en qué condiciones van a usar la herramienta. Un método basado en técnicas de punta suele tener también mayor resistencia porque es desconocido por el público en general, y si es más complejo será más difícl que se internalice por un usuario, y, aunque tengamos estadísticas de mejor desempeño, termine siendo descartado como opción en favor de una metodología más sencilla. Esto en particular hay que considerarlo en momentos de emergencia donde hay poco tiempo para evaluar un nuevo método y a la vez necesitamos un alto grado de confianza en su desempeño. Si a esto le sumamos que en la emergencia hay multiples actores con distintas perspectivas, distintas responsabilidades y distinta formación, y esos actores requieren llegar a acuerdos sobre como operar ante dicha emergencia, el escenario se complejiza mucho. 

Esta metodología la estamos trabajando en ese marco, la idea es que sea útil como herramienta para la toma de decisiones, y para que cumpla su cometido, tienen que estar involucrados los tomadores de decisiones. 


In [None]:
sns.set(style="whitegrid")
# Plot the orbital period with horizontal boxes
f, ax = plt.subplots(figsize=(10, 15))
sns.boxplot(y="caracteristica", x="coef", data=pls.sort_values(by='coef', ascending=False), palette='RdYlBu')
sns.despine(trim=True, left=True)

In [None]:
df_0 = serie_vulnerabilidad[(serie_vulnerabilidad.conteo > 10) &
                          (serie_vulnerabilidad.dia_ajuste == datetime.datetime(2020, 6, 1))]

In [None]:
df_0.boxplot(column='valor', by='ENTIDAD_RES', figsize=(30, 10), rot=45)
sns.despine(trim=True, left=True)

In [None]:
f, ax = plt.subplots(figsize=(25, 10))
df_1 = serie_vulnerabilidad[(serie_vulnerabilidad.conteo > 0) &
                          (serie_vulnerabilidad.dia_ajuste == datetime.datetime(2020, 6, 12))]
sns.boxplot(data=df_1, y='tasa_covid_letal', x='ENTIDAD_RES', saturation=0.3)
sns.swarmplot(data=df_1, y='tasa_covid_letal', x='ENTIDAD_RES', edgecolor='gray')
plt.xticks(rotation=80)
sns.despine(trim=True, left=True)

In [None]:
f, ax = plt.subplots(figsize=(25, 10))
df_0 = serie_vulnerabilidad[(serie_vulnerabilidad.dia_ajuste == datetime.datetime(2020, 6, 1))]
sns.boxplot(data=df_1, y='valor', x='ENTIDAD_RES', saturation=0.3)
sns.swarmplot(data=df_1, y='valor', x='ENTIDAD_RES', edgecolor='gray')
plt.xticks(rotation=80)
sns.despine(trim=True, left=True)

In [None]:
f, ax = plt.subplots(figsize=(20, 10))
sns.regplot(data=df_0[(df_0.conteo > 0)], x='tasa_covid_letal', y='valor', x_bins=20, robust=True)

In [None]:
diccionario_indicadores = pd.read_csv('datos/variablesf.csv', encoding='latin-1', index_col=False)

In [None]:
caracteristicas_indice = caracteristicas_modelos_municipios(df_0, poblaciones=False, i_vuln=False)
diccionario_indicadores.loc[diccionario_indicadores.Variable.isin(caracteristicas_indice),:].sort_values(by='Variable')

In [None]:
Image('letalidad_covid_0424_0611.gif', format='png')

In [None]:
Image('vulnerabilidad_covid_0424_0611.gif', format='png')

Lo primero es ver qué tan bien se correlaciona el índice con la letalidad reportada. 

In [None]:
sns.scatterplot(data=serie_vulnerabilidad[(serie_vulnerabilidad.conteo > 200) & 
                                          (serie_vulnerabilidad.dia_ajuste == datetime.date(2020, 6, 11).strftime('%y-%m-%d'))],
                x='tasa_covid_letal', y='valor', legend=False)

# Notas

fuente: http://www.ciifen.org/index.php?option=com_content&view=category&layout=blog&id=84&Itemid=336&lang=es

El riesgo se define como la combinación de la probabilidad de que se produzca un evento y sus consecuencias negativas. [1] Los factores que lo componen son la amenaza y la vulnerabilidad.

Amenaza es un fenómeno, sustancia, actividad humana o condición peligrosa que puede ocasionar la muerte, lesiones u otros impactos a la salud, al igual que daños a la propiedad, la pérdida de medios de sustento y de servicios, trastornos sociales y económicos, o daños ambientales. [1] La amenaza se determina en función de la intensidad y la frecuencia.

Vulnerabilidad son las características y las circunstancias de una comunidad, sistema o bien que los hacen susceptibles a los efectos dañinos de una amenaza. (1) Con los factores mencionados se compone la siguiente fórmula de riesgo.

RIESGO = AMENAZA x VULNERABILIDAD (1)

Los factores que componen la vulnerabilidad son la exposición, susceptibilidad y resiliencia, expresando su relación en la siguiente fórmula.

 

VULNERABILIDAD = EXPOSICIÓN x SUSCEPTIBILIDAD / RESILIENCIA (1)

Exposición es la condición de desventaja debido a la ubicación, posición o localización de un sujeto, objeto o sistema expuesto al riesgo.

Susceptibilidad es el grado de fragilidad interna de un sujeto, objeto o sistema para enfrentar una amenaza y recibir un posible impacto debido a la ocurrencia de un evento adverso.

Resiliencia es la capacidad de un sistema, comunidad o sociedad expuestos a una amenaza para resistir, absorber, adaptarse y recuperarse de sus efectos de manera oportuna y eficaz, lo que incluye la preservación y la restauración de sus estructuras y funciones básicas.



In [None]:
# hide

from nbdev.export import notebook2script
notebook2script()