Este script tiene como objetivo generar heatmaps de correlación entre diversas variables climáticas y de mortalidad para cada provincia en el conjunto de datos. La herramienta se centra en analizar la relación entre las temperaturas máximas y mínimas, la humedad y el número de días consecutivos con ciertas condiciones extremas, así como su posible influencia en la mortalidad.

El código sigue un proceso automatizado que filtra los datos de cada provincia, calcula la matriz de correlación entre las variables seleccionadas y genera un heatmap que visualiza la fuerza y la dirección de estas correlaciones. Estos gráficos se exportan como imágenes (.png) en una carpeta específica para facilitar su revisión y análisis.

Este tipo de análisis es útil en estudios climáticos y epidemiológicos, ya que permite identificar patrones regionales y comportamientos extremos que podrían estar vinculados con el aumento de la mortalidad, especialmente en relación con eventos de calor extremo.

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import os

# Cargar los datos ajustados desde el archivo CSV (ruta relativa)
ruta_csv = os.path.join('data', 'resultados_ajustados.csv')
df_ajustados = pd.read_csv(ruta_csv)

# Seleccionar las variables que se van a analizar
variables = ['temp_min_max', 'temp_max_max', 'humedad_max',
  'dias_consecutivos_tmax_35', 'dias_consecutivos_tmax_38',
  'dias_consecutivos_tmax_41', 'dias_consecutivos_humedad_70',
  'dias_consecutivos_humedad_80', 'dias_consecutivos_humedad_90',
  'dias', 'mortalidad']

# Crear un directorio para guardar los heatmaps por provincia si no existe
output_dir = os.path.join('data', 'heatmaps_provincias')
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

# Loop sobre cada provincia para crear un heatmap de correlación
for provincia in df_ajustados['provincia'].unique():
    # Filtrar los datos de la provincia específica
    df_provincia = df_ajustados[df_ajustados['provincia'] == provincia][variables]
    
    # Calcular la matriz de correlación
    corr = df_provincia.corr()
    
    # Crear el heatmap usando Seaborn
    plt.figure(figsize=(16, 10))
    sns.heatmap(corr, annot=True, cmap='coolwarm', linewidths=0.5)
    plt.title(f'Heatmap de Correlación para {provincia}')
    plt.tight_layout()
    
    # Guardar el heatmap en un archivo de imagen (.png)
    ruta_guardado = os.path.join(output_dir, f'heatmap_correlacion_{provincia}.png')
    plt.savefig(ruta_guardado)
    
    # Mostrar el gráfico (opcional, se puede comentar si no se desea mostrar)
    plt.show()

    print(f"Heatmap de correlación para {provincia} guardado en: {ruta_guardado}")

