# Contexto y motivación

Santiago de Chile enfrenta desde hace décadas un problema persistente de contaminación atmosférica, agravado por su ubicación geográfica en una cuenca rodeada por cordilleras, la alta densidad vehicular y el uso de calefacción residencial durante el invierno. Estas condiciones generan una ventilación deficiente y favorecen la acumulación de contaminantes como el material particulado fino (PM₂₅), reconocido por la Organización Mundial de la Salud (OMS) como uno de los principales factores de riesgo ambiental para la salud humana. 

De acuerdo con el Sistema de Información Nacional de Calidad del Aire (SINCA, Ministerio del Medio Ambiente), la concentración promedio anual de PM₂₅ en Santiago alcanzó cerca de 29 µg/m³ en 2024, casi seis veces el límite recomendado por la OMS (5 µg/m³). Durante los meses invernales, los episodios críticos pueden superar los 100 µg/m³, afectando principalmente a comunas del sector poniente, como Pudahuel, Cerro Navia y Quilicura, donde la ventilación atmosférica es más baja y la densidad poblacional mayor (Barraza et al., 2017). 

Esa situación crítica aparece reflejada en los medios: 

En junio de 2025, BioBioChile informó que durante una preemergencia ambiental Santiago se ubicó “entre las ciudades más contaminadas del mundo”. (BioBioChile, 2025) 

La Nación señaló que Santiago figura dentro de las 10 ciudades con peor calidad de aire global. (La Nación, 2025) 

Infobae informó que Santiago se encontraba en alerta por mala calidad del aire, posicionándose como la tercera ciudad más contaminada del mundo en ese momento. (Infobae, 2025) 

El artículo de La Tercera “Deuda silenciosa: el alto costo de la contaminación en Chile” (Dardati, 2025) cita un estudio desarrollado entre 2008 y 2019 que demuestra que por cada aumento de 1 µg/m³ de PM₂.₅, las atenciones de urgencia por enfermedades respiratorias aumentan un 0,38 %, y que en días de alta contaminación ese incremento puede alcanzar hasta un 8 %. El estudio también estima que, si Chile cumpliera con los estándares de la OMS (5 µg/m³), se podrían evitar 363.000 visitas a urgencias anuales. (Dardati, 2025). 

El presente proyecto busca analizar la los indices de contaminación del aire con el objetivo de comprender cómo estos pueden llegar a influir en la variación del índice de enfermedades respiratorias en Santiago de Chile. Este análisis pretende aportar evidencia cuantitativa que tal vez en el futuro pueda contribuir al desarrollo de políticas públicas medioambientales más efectivas orientadas a la prevención de riesgos respiratorios de los chilenos.

# Preguntas

Originalmente planeábamos responder 6 preguntas:

1. ¿Cómo se relacionan las condiciones climáticas y la polución del aire en Santiago, y cómo estas inciden en la formación de enfermedades respiratorias en distintos niveles socioeconómicos?
2. ¿Qué variables climáticas están más correlacionadas con episodios de alta contaminación atmosférica?
3. ¿Cómo cambia la frecuencia de registros de consultas médicas por enfermedades respiratorias durante los períodos de alta concentración de material particulado?
4. ¿Qué índices de polución presentan las comunas de Santiago de Chile con mayor registro de vulnerabilidad socioeconómica?, ¿y las comunas con menor registro de vulnerabilidad socioeconómica?
5. ¿Se puede predecir el riesgo de aumento de enfermedades respiratorias a partir de datos meteorológicos y calidad del aire?
6. ¿Existen diferencias estacionales (invierno vs verano) en la relación clima–polución–salud?

Sin embargo, a medida que fuimos avanzado nos encontramos con percances que nos permitieron lucidar y focalizar nuestros objetivos.

#### Preguntas eliminadas

Preguntas eliminidas del proyecto, sea por falta de datos o cambio de enfoque en el proyecto.

1. ¿Cómo se relacionan las condiciones climáticas y la polución del aire en Santiago, y cómo éstas inciden en la formación de enfermedades respiratorias en distintos niveles socioeconómicos? 

Decidimos eliminar el factor socieconomica porque, si bien la situación económica de las personas influye en su capacidad para acceder a tratamientos médicos y mejores condiciones de vida, este factor mide diversas aristas que se escapan de nuestra capacidad de manejo de datos y entendimiento para analizar este número de variables para este proyecto.

2. ¿Qué variables climáticas están más correlacionadas con episodios de alta contaminación atmosférica?

Debido a que consideramos pertinente descartar el uso de la API de la NASA debido a su complejidad contra los pocos datos que necesitábamos para nuestras necesidades, no es posible contestar esta pregunta con los datos finalmente recolectados, pues en ningún dataset aparece información sobre variables climáticas suficientes.

4. ¿Qué índices de polución presentan las comunas de Santiago de Chile con mayor registro de vulnerabilidad socioeconómica?, ¿y las comunas con menor registro de vulnerabilidad socioeconómica?

Como mencionamos anteriormente, se tomó la decisión de no considerar para este análisis la variable de socieconomica.

5. ¿Se puede predecir el riesgo de aumento de enfermedades respiratorias a partir de datos meteorológicos y calidad del aire? 

Ya mencionado en la pregunta 2, debido al descarte de uso de la API de la NASA, no es posible contestar esta pregunta con los datos finalmente recolectados, pues en ningún dataset aparece información sobre variables climáticas suficientes.

#### Preguntas (originales) respondidas

1. ¿Cómo cambia la frecuencia de registros de consultas médicas por enfermedades respiratorias durante los períodos de alta concentración de material particulado? 

Se observa en la seción de gráficos que existe una correlación con los meses más frios (aproximadamente desde Mayo a Agosto) con el aumento de casos de pacientes con enfermedades respiratorias:

2017:
![Indice promedio de pacientes por comuna de Santiago en 2017](attachment:image-2.png)

2018:
![Indice promedio de pacientes por comuna de Santiago en 2018](attachment:image-3.png)

2019:
![Indice promedio de pacientes por comuna de Santiago en 2019](attachment:image-4.png)


Y los mismo sucede con un aumento promedio de los índices de polución en ese mismo periodo de meses ya mencionado:

![Niveles promedio de Polución en Santiago entre 2017 y 2019](attachment:image.png)

3. ¿Existen diferencias estacionales (invierno vs verano) en la relación clima–polución salud?

Si, y se puede ver más claramente con los graficos subidos previamente. En los mismos periodos que suben los indices de polución suben los nuveles de pacientes con enfermedades respiratorias.


#### Preguntas (nuevas) respondidas

- ¿En qué meses los aumentos de polución fueron seguidos por aumento de pacientes con enfermedades respiratorias?

Entre los meses de Mayo y Agosto.

# Datos

Bases de Datos utilizadas:  

Para realizar el proyecto, tuvimos que hacer una modificación en las bases. En un principio, pensamos en utilizar:  

1. NASA POWER API 

2. CASEN / INE – Encuesta de Caracterización Socioeconómica Nacional & Instituto Nacional de Estadísticas de Chile 

Cuando se hizo la extracción e inspección de datos, nos dimos cuenta de que la primera base mencionada, tenía mucha información y, lo que nos servía de ella era mínimo. Mientras que la encuesta CASEN/INE, en su mayoría tenían datos, relacionados con los índices de pobreza del país. Si bien los ingresos económicos de las personas influyen en su capacidad para acceder a tratamientos médicos, esta se mide diversas aristas que se escapan de nuestro enfoque del proyecto. Por lo anterior, decidimos utilizar las siguientes fuentes de datos. 
  

1. DEIS – Departamento de Estadísticas e Información de Salud (Ministerio de Salud, Chile) - Sistema de Reportes REM 

- Variables: contiene el motivo de consulta, número de pacientes y comuna. 
- Características: datos numéricos y en strings.  
- Origen y recolección: En la pagina del gobierno, se extrajo los datos de todos los meses por tres años consecutivos (2017,2018 y 2019). La pagina proporciona la opción de filtrar los datos por serie, rem, sección, degregación, regiones, periodo, mes inicio y mes final. El archivo entregado tiene extensión xls pero posee un formato html.

Con relación a las otras bases de datos, las mantuvimos.  

1. SINCA – Sistema de Información Nacional de Calidad del Aire (Ministerio del Medio Ambiente, Chile) 
- Variables: fecha, hora, registros validos, registros preliminares, registros no validos.
- Caracteristicas: datos números y strings
- Origen y recolección: en la pagina del SINCA se descarga un archivo csv con las fechas deseadas (de 2017 hasta 2019)

Desarrollo de los anterior se encuentra en el siguiente jupyter: relacion_PM_con_mapa_comunas_y_pacientes (unificación).ipynb

# Analisis Exploratorio de Datos

El análisis exploratorio de datos se realizó en el jupyter "relacion_PM_con_mapa_comunas_y_pacientes (unificación).ipynb".

A partir del análisis de los datos se deben hacer bastantes observaciones.

Los gráficos de calor y los graficos de líneas nos permiten observar que las temporadas de frío aumentan los casos de pacientes con enfermedades respiratorias de manera proporcional que aumentan los niveles de polución. Sin embargo se puede observar a partir del gráfico geográfico final:

![Comparación y relacion entre idices de pacientes respiratorios y niveles de polución](attachment:image.png)

Que no existe relación entre los casos de pacientes respiratorios y los niveles de polución en la Región Metropolitana. Por lo que se puede concluir, a partir de los datos considerados para este análisis, que no existe relacion directa entre los enfermos por problemas respiratorios y los niveles de contaminación por PM25. Se puede suponer que tal vez existieron variables implícitas que no consideramos para este análisis, como por ejemplo que las enfermedades respiratorias no son todas por causas ambientales sino también genéticas y de tipo viral/infecciosos, tal vez el dataset de niveles de polución por material particulado no era el adecuado, pues consideraba un espacio muestral más pequeño que el usado con los datos de enfermedades respiratorias, o tal vez existen variables climáticas que no hemos considerado que pueden influir a los resultados.

Inicialmente consideramos un espacio muestral de enfermedades respiratorias más grande que el de sensores de polución ambiental, y como estos se comparan con un análisis usando la media de ambos grupos, existe una sobre información de casos en el conjunto más grande de datos, que es el de casos de enfermedades respiratorias; si se hubiera reducido el espacio de muestra del conjunto más grande para igualarlo al espacio más limitante, que es el de la muestra de contaminación de material particulado, tal vez si hubiéramos podido llegar a un resultado diferente. También podríamos haber hecho un cálculo percápita de los pacientes por comuna y ese valor relacionarlo con los niveles de polución; o en lugar de reducir el espacio muestral de la cantidad de pacientes con enefermedades respiratorias, podríamos haber elegido un dataset con medidores de polución en más comunas de la RM.

# Bibliografias

##### Referencias: 

Barraza, F. et al. (2017). Temporal evolution of main ambient PM₂.₅ sources in Santiago, Chile (1998–2012). Atmospheric Chemistry and Physics, 17, 10093–10107. 

BioBioChile. (2025, 9 de junio). Preemergencia ambiental: Santiago se ubica entre las ciudades más contaminadas del mundo.

https://www.biobiochile.cl 

Dardati, E. (2025, 5 de octubre). Deuda silenciosa: el alto costo de la contaminación en Chile. La Tercera. 

https://www.latercera.com/opinion/noticia/deuda-silenciosa-el-alto-costo-de-la-contaminacion-en-chile/ 


Infobae. (2025, 15 de julio). Santiago de Chile en alerta por la mala calidad del aire: es la tercera ciudad más contaminada del mundo. 

https://www.infobae.com/america/america-latina/2025/07/15/santiago-de-chile-en-alerta-por-la-mala-calidad-del-aire-es-la-tercera-ciudad-mas-contaminada-del-mundo/ 

La Nación. (2025, 8 de julio). Santiago figura dentro de las 10 ciudades más contaminadas del mundo.  

https://www.lanacion.cl/santiago-figura-dentro-de-las-10-ciudades-mas-contaminadas-del-mundo/ 

##### Datos:

Ministerio de Salud de Chile. Departamento de Estadística y e información de Salud (s.f.). Sistema de Reportes REM: datos preliminares. Recuperado el 17 de octubre de 2025 de 

https://reportesrem.minsal.cl/?_token=nX5fBIgU8dmMl6dFEWTsLjJiBmrDgMM03fTevL63&serie=1&rem=86&seccion_id=1046&tipo=4&regiones=13&servicios=0&periodo=2020&mes_inicio=1&mes_final=12 

##### Mapa de las comunas: 

https://www.bcn.cl/siit/mapas_vectoriales 

Ministerio del medio ambiente. Sistema de Información Nacional de Calidad del Aire (SINCA). Estaciones de monitoreo de la calidad de aire.

https://sinca.mma.gob.cl/index.php/region/index/id/M