## 02 - INITIAL DATA ANALYSIS

###### Lecture explaining xarray functionalities geospatial processing : datacubes_data_handling.ipynb

#### 01.1 - Libraries import

In [6]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import xarray as xr

In [7]:
# Open the file NetCDF

dataset2 = xr.open_dataset(r"C:\Users\andre\OneDrive\Desktop\Datasets_Geoinfprj\era5-downscaled-over-italy_hourly_22209.nc")
dataset3 = xr.open_dataset(r"C:\Users\andre\OneDrive\Desktop\Datasets_Geoinfprj\era5-downscaled-over-italy_hourly_22223.nc")

In [19]:
###### PROVA CODICE NUOVO CHE CALCOLA FUNZIONI IN CELSIUS

def calculate_humidex(Ta_k, Td_k):
    """
    Calcola l'Humidex in °C usando la formula di Masterson/Chin.
    Parametri:
      - Ta_k: temperatura dell'aria in Kelvin
      - Td_k: temperatura di rugiada in Kelvin
    Ritorna:
      - Humidex in °C
    """
    # Conversione in °C
    Ta_c = Ta_k - 273.15
    Td_c = Td_k - 273.15

    # Evita valori troppo bassi per Td
    Td_c = np.maximum(Td_c, -73.15)  # ~200 K

    # Calcolo della pressione di vapore (e) in hPa
    exponent = 5417.7530 * ((1.0 / 273.16) - (1.0 / (Td_c + 273.16)))
    e = 6.11 * np.exp(exponent)

    # Formula Humidex
    humidex_c = Ta_c + 0.5555 * (e - 10.0)
    return humidex_c


def calculate_relative_humidity(Ta_c, Td_c):
    """
    Calcola l'umidità relativa in %,
    assumendo Ta_c e Td_c in °C.
    """
    RH = 100.0 * np.exp((17.625 * Td_c) / (243.04 + Td_c)
                        - (17.625 * Ta_c) / (243.04 + Ta_c))
    return RH


def calculate_heat_index(Ta_c, RH):
    """
    Calcola il Heat Index in °C, partendo da:
      - Ta_c: temperatura dell'aria in °C
      - RH: umidità relativa in %
    La formula originale è in °F, quindi:
      1) Converte Ta_c -> °F
      2) Calcola HI in °F
      3) Riconverte in °C
    """
    # °C -> °F
    Ta_f = Ta_c * 9.0 / 5.0 + 32.0

    HI_f = (-42.379
            + 2.04901523 * Ta_f
            + 10.14333127 * RH
            - 0.22475541 * Ta_f * RH
            - 6.8378e-3 * Ta_f**2
            - 5.48172e-2 * RH**2
            + 1.229e-3 * Ta_f**2 * RH
            + 8.528e-4 * Ta_f * RH**2
            - 1.99e-6 * Ta_f**2 * RH**2)

    # °F -> °C
    HI_c = (HI_f - 32.0) * 5.0 / 9.0
    return HI_c


def calculate_wbt(Ta_c, RH):
    """
    Calcola la Wet-Bulb Temperature (WBT) in °C (formula semplificata di Stull).
    Parametri:
      - Ta_c: temperatura in °C
      - RH: umidità relativa in %
    """
    WBT_c = (Ta_c * np.arctan(0.151977 * np.sqrt(RH + 8.313659))
             + np.arctan(Ta_c + RH)
             - np.arctan(RH - 1.676331)
             + 0.00391838 * RH**1.5 * np.arctan(0.023101 * RH)
             - 4.686035)
    return WBT_c


def calculate_wbgt(Ta_c, WBT_c):
    """
    Calcola WBGT in °C con la formula semplificata:
      WBGT = 0.7 * WBT + 0.3 * Ta
    Parametri:
      - Ta_c: temperatura in °C
      - WBT_c: Wet-Bulb Temperature in °C
    """
    WBGT_c = 0.7 * WBT_c + 0.3 * Ta_c
    return WBGT_c


def calculate_lethal_heat_stress_index(WBT_c, RH):
    """
    Calcola Lethal Heat Stress Index (Ls) in °C con la formula:
      Ls = WBT + 4.5 * (1 - (RH/100)^2)
    Parametri:
      - WBT_c: Wet-Bulb Temperature in °C
      - RH: umidità relativa in %
    """
    Ls_c = WBT_c + 4.5 * (1.0 - (RH / 100.0)**2)
    return Ls_c


def calculate_utci(Ta_c, RH):
    """
    Calcola una versione semplificata di UTCI in °C,
    Parametri:
      - Ta_c: temperatura in °C
      - RH: umidità relativa in %
    """
    # Pressione di vapore approssimata
    pa = RH / 100.0 * 6.105 * np.exp(17.27 * Ta_c / (237.7 + Ta_c))

    # Formula semplificata
    UTCI_c = (Ta_c
              + 0.607562
              + 0.022771 * Ta_c
              - 0.003578 * RH
              - 0.000119 * Ta_c * RH)
    return UTCI_c

#### Verifica sul singolo timestamp del superamento o meno di tutte le soglie di pericolosità

In [24]:
###### PROVA CODICE NUOVO CHE PRENDE FUNZIONI IN CELSIUS

# Seleziona un timestamp specifico
time_selected = dataset3['T_2M'].time[2000]

# Estrai temperatura e dew point temperature per il timestamp selezionato
temperature_snapshot = dataset3['T_2M'].sel(time=time_selected)  # in Kelvin
dew_point_snapshot = dataset2['TD_2M'].sel(time=time_selected)   # in Kelvin

# Filtra valori anomali e interpoliamo dew point temperature
dew_point_filtered = dew_point_snapshot.where(dew_point_snapshot > 243.15)
dew_point_interpolated = dew_point_filtered.interpolate_na(dim='rlat', method='linear') \
                                             .interpolate_na(dim='rlon', method='linear')


## CALCOLO DEGLI INDICI
# Calcolo Humidex (richiede Ta e Td in Kelvin)
humidex_snapshot = calculate_humidex(temperature_snapshot, dew_point_interpolated)

# Calcolo dell'Umidità Relativa in %
# Convertiamo T e Td in °C
relative_humidity_snapshot = calculate_relative_humidity(temperature_snapshot - 273.15, dew_point_interpolated - 273.15)

# Heat Index in °C (input: Ta in °C, RH in %)
heat_index_snapshot = calculate_heat_index(temperature_snapshot - 273.15, relative_humidity_snapshot)

# Wet-Bulb Temperature in °C (input: Ta in °C, RH in %)
wbt_snapshot = calculate_wbt(temperature_snapshot - 273.15, relative_humidity_snapshot)

# WBGT in °C (input: Ta in °C, WBT in °C)
wbgt_snapshot = calculate_wbgt(temperature_snapshot - 273.15, wbt_snapshot)

# Lethal Heat Stress Index in °C (input: WBT in °C, RH in %)
lhs_snapshot = calculate_lethal_heat_stress_index(wbt_snapshot, relative_humidity_snapshot)

# UTCI in °C (input: Ta in °C, RH in %)
utci_snapshot = calculate_utci(temperature_snapshot - 273.15, relative_humidity_snapshot)



# Calcola statistiche per ciascun indice
def calculate_stats(data_array):
    return {
        "mean": data_array.mean().item(),
        "median": data_array.median().item(),
        "p95": np.percentile(data_array, 95),
        "p99": np.percentile(data_array, 99),
        "max": data_array.max().item()
    }

# Dizionario degli indici calcolati
indices = {
    "Heat Index": heat_index_snapshot,
    "Humidex": humidex_snapshot,
    "Lethal Heat Stress Index": lhs_snapshot,
    "UTCI": utci_snapshot,
    "WBGT": wbgt_snapshot
}

# Statistiche
stats_results = {key: calculate_stats(value) for key, value in indices.items()}

# Definizione delle soglie per ciascun indice (in °C)
soglie = {
    "Heat Index": 40.6,
    "Humidex": 45,
    "Lethal Heat Stress Index": 27,
    "UTCI": 44,      # By literature is 46
    "WBGT": 28       # By literature is 30
}

# Creazione del DataFrame con i risultati
df_results = pd.DataFrame([
    {
        "Indice": key,
        "Media (°C)": value["mean"],
        "Mediana (°C)": value["median"],
        "95° Perc. (°C)": value["p95"],
        "99° Perc. (°C)": value["p99"],
        "Massimo (°C)": value["max"],
        "Soglia (°C)": soglie[key],
        "Media > Soglia": "si" if value["mean"] > soglie[key] else "no",
        "Mediana > Soglia": "si" if value["median"] > soglie[key] else "no",
        "95° Perc. > Soglia": "si" if value["p95"] > soglie[key] else "no",
        "99° Perc. > Soglia": "si" if value["p99"] > soglie[key] else "no",
        "Massimo > Soglia": "si" if value["max"] > soglie[key] else "no"
    }
    for key, value in stats_results.items()
])

# Ordina il DataFrame
df_results.sort_values(by="Indice", inplace=True)

# Funzione per colorare i "si" di rosso e i "no" di verde
def color_superamento(val):
    color = "red" if val == "si" else "green"
    return f"color: {color}"

# Applica la formattazione condizionale
df_styled = df_results.style.applymap(
    color_superamento,
    subset=["Media > Soglia", "Mediana > Soglia", "95° Perc. > Soglia", "99° Perc. > Soglia", "Massimo > Soglia"]
)

# Visualizza il DataFrame formattato con il timestamp in analisi
print(f"\n=== Confronto Indici vs Soglie per il timestamp selezionato ({str(time_selected.values)}) ===")
df_styled


=== Confronto Indici vs Soglie per il timestamp selezionato (1984-07-28T13:00:00.000000000) ===


Unnamed: 0,Indice,Media (°C),Mediana (°C),95° Perc. (°C),99° Perc. (°C),Massimo (°C),Soglia (°C),Media > Soglia,Mediana > Soglia,95° Perc. > Soglia,99° Perc. > Soglia,Massimo > Soglia
0,Heat Index,30.375048,29.397522,45.305499,54.21323,76.163765,40.6,no,no,si,si,si
1,Humidex,23.080156,27.175186,31.935791,32.790609,33.905579,45.0,no,no,no,no,no
2,Lethal Heat Stress Index,16.753191,19.335899,21.383872,21.971336,22.613863,27.0,no,no,no,no,no
3,UTCI,25.10988,28.967758,34.063566,34.685134,35.511993,44.0,no,no,no,no,no
4,WBGT,16.330872,19.038174,21.675042,22.227066,22.892605,28.0,no,no,no,no,no


#### Criterias to identify heat waves

| Index | Threshold value by literature | Threshold value used |
|:--|:--|:--|
| Heat Index (HI) | > 105°F (~40.6°C) |
| Humidex (Hu) | > 45°C |
| WBGT | > 30°C | > 28°C |
| Lethal Heat Stress Index (Ls) | > 27°C |
| UTCI | > 46°C | > 44°C |


#### Verifica su tutti i timestamp di un anno del superamento o meno di tutte le soglie di pericolosità & selezione dei giorni consecutivi (almeno 3) in cui ciò accade -> heat wave vs casi isolati

In [27]:
import numpy as np
import pandas as pd
import xarray as xr

# Seleziona un anno specifico per l'analisi
year = 2023
timestamps = dataset3['T_2M'].time.sel(time=dataset3['T_2M'].time.dt.year == year)

# Definizione delle soglie per ciascun indice (in °C)
soglie = {
    "Heat Index": 40.6,
    "Humidex": 45,
    "Lethal Heat Stress Index": 27,
    "UTCI": 46,
    "WBGT": 30
}

# Lista per salvare i risultati finali
heatwave_records = []

# Itera su tutti i timestamp dell'anno selezionato
for i, time_selected in enumerate(timestamps):
    
    # Estrai temperatura e dew point per il timestamp attuale (Kelvin)
    temperature_snapshot = dataset3['T_2M'].sel(time=time_selected)
    dew_point_snapshot = dataset2['TD_2M'].sel(time=time_selected)
    
    # Filtra valori anomali e interpoliamo dew point temperature
    dew_point_filtered = dew_point_snapshot.where(dew_point_snapshot > 243.15)
    dew_point_interpolated = dew_point_filtered.interpolate_na(dim='rlat', method='linear') \
                                                 .interpolate_na(dim='rlon', method='linear')

    # Calcola gli indici per ciascun pixel
    # (Assumendo che le funzioni calcolino e restituiscano valori in °C ove necessario)
    humidex_snapshot = calculate_humidex(temperature_snapshot, dew_point_interpolated)
    relative_humidity_snapshot = calculate_relative_humidity(
        temperature_snapshot - 273.15,
        dew_point_interpolated - 273.15
    )
    heat_index_snapshot = calculate_heat_index(
        temperature_snapshot - 273.15,
        relative_humidity_snapshot
    )
    wbt_snapshot = calculate_wbt(
        temperature_snapshot - 273.15,
        relative_humidity_snapshot
    )
    wbgt_snapshot = calculate_wbgt(
        temperature_snapshot - 273.15,
        wbt_snapshot
    )
    lhs_snapshot = calculate_lethal_heat_stress_index(
        wbt_snapshot,
        relative_humidity_snapshot
    )
    utci_snapshot = calculate_utci(
        temperature_snapshot - 273.15,
        relative_humidity_snapshot
    )

    # Calcola statistiche per ciascun indice
    def calculate_stats(data_array):
        return {
            "mean": data_array.mean().item(),
            "median": data_array.median().item(),
            "p95": np.percentile(data_array, 95),
            "p99": np.percentile(data_array, 99),
            "max": data_array.max().item()
        }

    indices = {
        "Heat Index": heat_index_snapshot,
        "Humidex": humidex_snapshot,
        "Lethal Heat Stress Index": lhs_snapshot,
        "UTCI": utci_snapshot,
        "WBGT": wbgt_snapshot
    }

    stats_results = {key: calculate_stats(value) for key, value in indices.items()}

    # Verifica se TUTTI gli indici superano la soglia in almeno una delle statistiche
    all_exceed = all(
        any([
            stats_results[key]["mean"] > soglie[key],
            stats_results[key]["median"] > soglie[key],
            stats_results[key]["p95"] > soglie[key],
            stats_results[key]["p99"] > soglie[key],
            stats_results[key]["max"] > soglie[key]
        ])
        for key in indices.keys()
    )

    # Se la condizione è soddisfatta, salva il risultato
    if all_exceed:
        df_results = pd.DataFrame([
            {
                "Indice": key,
                "Media (°C)": value["mean"],
                "Mediana (°C)": value["median"],
                "95° Perc. (°C)": value["p95"],
                "99° Perc. (°C)": value["p99"],
                "Massimo (°C)": value["max"],
                "Soglia (°C)": soglie[key],
                "Media > Soglia": "si" if value["mean"] > soglie[key] else "no",
                "Mediana > Soglia": "si" if value["median"] > soglie[key] else "no",
                "95° Perc. > Soglia": "si" if value["p95"] > soglie[key] else "no",
                "99° Perc. > Soglia": "si" if value["p99"] > soglie[key] else "no",
                "Massimo > Soglia": "si" if value["max"] > soglie[key] else "no"
            }
            for key, value in stats_results.items()
        ])
        
        # Aggiunta di timestamp nel dataframe per chiarezza
        df_results.insert(0, "Timestamp", str(time_selected.values))
        df_results.insert(1, "Numero Timestamp", i)

        # Aggiungi i risultati alla lista per il salvataggio
        heatwave_records.extend(df_results.to_dict(orient="records"))

# Creazione del DataFrame finale
df_heatwave = pd.DataFrame(heatwave_records)

# Identificazione di heat wave: almeno 3 giorni consecutivi
df_heatwave["Data"] = pd.to_datetime(df_heatwave["Timestamp"]).dt.date
df_heatwave["Heat Wave"] = "caso isolato"

for i, row in df_heatwave.iterrows():
    current_date = row["Data"]

    # Giorni adiacenti
    next_day1 = current_date + pd.Timedelta(days=1)
    next_day2 = current_date + pd.Timedelta(days=2)
    prev_day1 = current_date - pd.Timedelta(days=1)
    prev_day2 = current_date - pd.Timedelta(days=2)

    # Se esiste un blocco di almeno 3 giorni consecutivi che include current_date
    # (D, D+1, D+2) oppure (D-1, D, D+1) oppure (D-2, D-1, D)
    if (
        (next_day1 in df_heatwave["Data"].values and next_day2 in df_heatwave["Data"].values)
        or (prev_day1 in df_heatwave["Data"].values and next_day1 in df_heatwave["Data"].values)
        or (prev_day1 in df_heatwave["Data"].values and prev_day2 in df_heatwave["Data"].values)
    ):
        df_heatwave.at[i, "Heat Wave"] = "heat wave"

# Salvataggio su file CSV con nome contenente l'anno
df_heatwave.to_csv(f"heatwave_timestamps_{year}.csv", index=False)

# Controllo per stampare il messaggio appropriato
print(f"\n=== Giorni con Ondate di Calore Estreme (≥3 giorni consecutivi) nel {year} ===")
if df_heatwave.empty:
    print("Nessun giorno dell'anno selezionato ha superato tutte le soglie di pericolosità per il caldo estremo.")
else:
    print("Stampa nella cella successiva df_heatwave per vederlo in formato DataFrame.")


=== Giorni con Ondate di Calore Estreme (≥3 giorni consecutivi) nel 2023 ===
Stampa nella cella successiva df_heatwave per vederlo in formato DataFrame.


In [30]:
df_heatwave

Unnamed: 0,Timestamp,Numero Timestamp,Indice,Media (°C),Mediana (°C),95° Perc. (°C),99° Perc. (°C),Massimo (°C),Soglia (°C),Media > Soglia,Mediana > Soglia,95° Perc. > Soglia,99° Perc. > Soglia,Massimo > Soglia,Data,Heat Wave
0,2023-07-17T15:00:00.000000000,280,Heat Index,33.828320,34.416645,41.746232,42.626288,44.100754,40.6,no,no,si,si,si,2023-07-17,heat wave
1,2023-07-17T15:00:00.000000000,280,Humidex,35.140137,38.019917,44.736756,45.632275,47.165943,45.0,no,no,no,si,si,2023-07-17,heat wave
2,2023-07-17T15:00:00.000000000,280,Lethal Heat Stress Index,23.345772,24.783621,27.674836,28.116030,29.107450,27.0,no,no,si,si,si,2023-07-17,heat wave
3,2023-07-17T15:00:00.000000000,280,UTCI,34.943035,36.611519,44.443080,45.058379,46.140484,46.0,no,no,no,no,si,2023-07-17,heat wave
4,2023-07-17T15:00:00.000000000,280,WBGT,23.572853,25.402393,28.850945,29.354012,30.173292,30.0,no,no,no,no,si,2023-07-17,heat wave
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
75,2023-08-24T15:00:00.000000000,508,Heat Index,35.114590,36.715103,43.191731,43.899732,45.419678,40.6,no,no,si,si,si,2023-08-24,heat wave
76,2023-08-24T15:00:00.000000000,508,Humidex,36.770340,40.270149,46.308254,47.057038,48.507965,45.0,no,no,si,si,si,2023-08-24,heat wave
77,2023-08-24T15:00:00.000000000,508,Lethal Heat Stress Index,24.336843,25.970181,28.477583,29.151492,30.274513,27.0,no,no,si,si,si,2023-08-24,heat wave
78,2023-08-24T15:00:00.000000000,508,UTCI,35.746422,38.889511,44.772475,45.336684,46.007748,46.0,no,no,no,no,si,2023-08-24,heat wave


#### GIF rappresentante il periodo prima durante e dopo la heat wave

In [31]:
import numpy as np
import pandas as pd
import xarray as xr
import matplotlib.pyplot as plt
import imageio.v2 as imageio  # Evita il warning di ImageIO
import os

# **Parametri personalizzabili**
year = 2023  # Anno di analisi
target_timestamp_index = 286  # Numero del timestamp di riferimento (cambiabile dall'utente)
days_before = 10  # Giorni precedenti da mostrare
days_after = 12  # Giorni successivi da mostrare
indice_selezionato = "Heat Index"  # Indice da visualizzare nella mappa

# **Caricamento dei dati**
timestamps = dataset3['T_2M'].time.sel(time=dataset3['T_2M'].time.dt.year == year)
df_heatwave["Data"] = pd.to_datetime(df_heatwave["Timestamp"]).dt.date
heatwave_days = df_heatwave[df_heatwave['Heat Wave'] == 'heat wave']['Data'].unique()
heatwave_dates = set(str(date) for date in heatwave_days)  # Set di date formattate

# **Seleziona il timestamp di riferimento**
target_time = timestamps[target_timestamp_index]

# **Definiamo l'intervallo temporale per la GIF**
start_time = target_time - np.timedelta64(days_before, 'D')
end_time = target_time + np.timedelta64(days_after, 'D')
time_range = timestamps.sel(time=(timestamps >= start_time) & (timestamps <= end_time))

# **Calcola il range fisso per la legenda solo sui timestamp selezionati**
heat_index_values = []
for time_selected in time_range:
    temperature_snapshot = dataset3['T_2M'].sel(time=time_selected)
    dew_point_snapshot = dataset2['TD_2M'].sel(time=time_selected)
    dew_point_filtered = dew_point_snapshot.where(dew_point_snapshot > 243.15)
    dew_point_interpolated = dew_point_filtered.interpolate_na(dim='rlat', method='linear').interpolate_na(dim='rlon', method='linear')
    heat_index_snapshot = calculate_heat_index(temperature_snapshot - 273.15, calculate_relative_humidity(temperature_snapshot - 273.15, dew_point_interpolated - 273.15))
    heat_index_values.append(heat_index_snapshot.values)

heat_index_values = np.concatenate([hi.flatten() for hi in heat_index_values])
heat_index_min = heat_index_values.min()
heat_index_max = heat_index_values.max()

# **Creazione di una cartella temporanea per le immagini**
output_folder = "temp_frames"
os.makedirs(output_folder, exist_ok=True)

# **Genera i frame per la GIF**
frames = []
for time_selected in time_range:
    
    # **Estrai i dati di temperatura e dew point**
    temperature_snapshot = dataset3['T_2M'].sel(time=time_selected)
    dew_point_snapshot = dataset2['TD_2M'].sel(time=time_selected)
    
    # **Filtra valori anomali e interpoliamo dew point temperature**
    dew_point_filtered = dew_point_snapshot.where(dew_point_snapshot > 243.15)
    dew_point_interpolated = dew_point_filtered.interpolate_na(dim='rlat', method='linear').interpolate_na(dim='rlon', method='linear')
    
    # **Calcola gli indici**
    heat_index_snapshot = calculate_heat_index(temperature_snapshot - 273.15, calculate_relative_humidity(temperature_snapshot - 273.15, dew_point_interpolated - 273.15))
    
    # **Plotta la distribuzione dell'Heat Index per il timestamp corrente**
    fig, ax = plt.subplots(figsize=(8, 6))
    im = ax.imshow(heat_index_snapshot, cmap="inferno", origin="lower", vmin=heat_index_min, vmax=heat_index_max)
    
    # **Legenda fissa**
    cbar = plt.colorbar(im, label="Heat Index (°C)")
    cbar.ax.tick_params(labelsize=10)
    
    # **Aggiungi il titolo con il timestamp e indicazione della heatwave**
    timestamp_str = str(time_selected.values)[:16]
    ax.set_title(timestamp_str, fontsize=14, fontweight="bold", ha='left', x=0)
    
    # **Se il giorno è una heatwave, evidenzia il riquadro e mostra la scritta**
    date_str = timestamp_str[:10]  # Estrai solo la parte di data
    if date_str in heatwave_dates:
        for spine in ax.spines.values():
            spine.set_edgecolor('red')
            spine.set_linewidth(3)
        ax.text(0.5, -0.1, "HEAT WAVE HIT", fontsize=18, color='red', ha='center', transform=ax.transAxes, fontweight='bold')
    
    # **Sostituisci i caratteri speciali per evitare errori nei nomi dei file**
    safe_timestamp = timestamp_str.replace(":", "-").replace("T", "_").split(".")[0]
    frame_filename = os.path.join(output_folder, f"frame_{safe_timestamp}.png")

    # **Salva il frame temporaneo**
    plt.savefig(frame_filename, dpi=100)
    plt.close()
    
    frames.append(frame_filename)

# **Creazione della GIF**
gif_filename = f"heatwave_evolution_{year}.gif"
with imageio.get_writer(gif_filename, mode='I', duration=5) as writer:
    for frame in frames:
        image = imageio.imread(frame)
        writer.append_data(image)

# **Pulizia della cartella temporanea**
for frame in frames:
    try:
        os.remove(frame)
    except PermissionError:
        pass  # Ignora errori se il file è ancora in uso
try:
    os.rmdir(output_folder)
except PermissionError:
    pass  # Ignora errori se la cartella è ancora in uso

print(f"\n GIF creata con successo: {gif_filename}")


 GIF creata con successo: heatwave_evolution_2023.gif


#### Iterazione dall'inizio del dataset del superamento o meno di tutte le soglie di pericolosità per tutti gli anni, che si arresta quando trovato un anno con almeno un timestamp che supera tutte le soglie di pericolosità

In [19]:
# **Definizione delle soglie per ciascun indice**
soglie = {
    "Heat Index": 40.6,
    "Humidex": 45,
    "Lethal Heat Stress Index": 27,
    "UTCI": 46,
    "WBGT": 30
}

# **Ottieni tutti gli anni disponibili nel dataset**
anni_disponibili = np.unique(dataset3['T_2M'].time.dt.year.values)

# **Variabile per verificare se abbiamo trovato un anno con heatwave**
anno_trovato = False

# **Iteriamo su tutti gli anni disponibili**
for year in anni_disponibili:
    if anno_trovato:
        break  # Se abbiamo già trovato un anno valido, interrompiamo il loop

    print(f"\n🔍 Analizzando l'anno {year}...")

    # **Seleziona i timestamp per l'anno corrente**
    timestamps = dataset3['T_2M'].time.sel(time=dataset3['T_2M'].time.dt.year == year)

    # **Lista per salvare i giorni in cui tutte le soglie vengono superate**
    heatwave_days = []

    # **Itera su tutti i timestamp dell'anno selezionato**
    for time_selected in timestamps:
        
        # **Estrai temperatura e dew point per il timestamp attuale**
        temperature_snapshot = dataset3['T_2M'].sel(time=time_selected)
        dew_point_snapshot = dataset2['TD_2M'].sel(time=time_selected)
        
        # **Filtra valori anomali e interpoliamo dew point temperature**
        dew_point_filtered = dew_point_snapshot.where(dew_point_snapshot > 243.15)
        dew_point_interpolated = dew_point_filtered.interpolate_na(dim='rlat', method='linear').interpolate_na(dim='rlon', method='linear')

        # **Calcola gli indici per ciascun pixel**
        humidex_snapshot = calculate_humidex(temperature_snapshot, dew_point_interpolated)
        relative_humidity_snapshot = calculate_relative_humidity(temperature_snapshot - 273.15, dew_point_interpolated - 273.15)
        heat_index_snapshot = calculate_heat_index(temperature_snapshot - 273.15, relative_humidity_snapshot)
        wbt_snapshot = calculate_wbt(temperature_snapshot - 273.15, relative_humidity_snapshot)
        wbgt_snapshot = calculate_wbgt(temperature_snapshot - 273.15, wbt_snapshot)
        lhs_snapshot = calculate_lethal_heat_stress_index(wbt_snapshot, relative_humidity_snapshot)
        utci_snapshot = calculate_utci(temperature_snapshot - 273.15, relative_humidity_snapshot)

        # **Calcola media e mediana per ciascun indice**
        humidex_mean, humidex_median = humidex_snapshot.mean().item(), humidex_snapshot.median().item()
        heat_index_mean, heat_index_median = heat_index_snapshot.mean().item(), heat_index_snapshot.median().item()
        wbgt_mean, wbgt_median = wbgt_snapshot.mean().item(), wbgt_snapshot.median().item()
        lhs_mean, lhs_median = lhs_snapshot.mean().item(), lhs_snapshot.median().item()
        utci_mean, utci_median = utci_snapshot.mean().item(), utci_snapshot.median().item()

        # **Verifica se tutti gli indici superano le soglie contemporaneamente**
        all_indices_above_threshold = (
            (heat_index_mean > soglie["Heat Index"]) and (heat_index_median > soglie["Heat Index"]) and
            (humidex_mean > soglie["Humidex"]) and (humidex_median > soglie["Humidex"]) and
            (lhs_mean > soglie["Lethal Heat Stress Index"]) and (lhs_median > soglie["Lethal Heat Stress Index"]) and
            (utci_mean > soglie["UTCI"]) and (utci_median > soglie["UTCI"]) and
            (wbgt_mean > soglie["WBGT"]) and (wbgt_median > soglie["WBGT"])
        )

        # **Se la condizione è soddisfatta, aggiungiamo il giorno alla lista**
        if all_indices_above_threshold:
            heatwave_days.append(str(time_selected.values))
            anno_trovato = True  # Imposta il flag per fermare la ricerca dopo questo anno

    # **Se abbiamo trovato almeno un giorno, interrompiamo il loop**
    if anno_trovato:
        break

# **Se abbiamo trovato un anno valido, creiamo il DataFrame**
if anno_trovato and heatwave_days:
    df_heatwave_days = pd.DataFrame({"Heatwave Days": heatwave_days})

    # **Ordina i risultati in base alla data**
    df_heatwave_days.sort_values(by="Heatwave Days", inplace=True)

    # **Esporta il DataFrame in un file CSV per visualizzazione**
    df_heatwave_days.to_csv(f"heatwave_days_{year}.csv", index=False)

    # **Stampa i risultati**
    print(f"\n=== Giorni con Ondate di Calore Estreme nell'anno {year} ===")
    print(df_heatwave_days.to_string(index=False))

else:
    print("\n Nessun anno nel dataset ha superato tutte le soglie di pericolosità per il caldo estremo")



🔍 Analizzando l'anno 1981...

🔍 Analizzando l'anno 1982...

🔍 Analizzando l'anno 1983...

🔍 Analizzando l'anno 1984...

🔍 Analizzando l'anno 1985...

🔍 Analizzando l'anno 1986...

🔍 Analizzando l'anno 1987...

🔍 Analizzando l'anno 1988...

🔍 Analizzando l'anno 1989...

🔍 Analizzando l'anno 1990...

🔍 Analizzando l'anno 1991...

🔍 Analizzando l'anno 1992...

🔍 Analizzando l'anno 1993...

🔍 Analizzando l'anno 1994...

🔍 Analizzando l'anno 1995...

🔍 Analizzando l'anno 1996...

🔍 Analizzando l'anno 1997...

🔍 Analizzando l'anno 1998...

🔍 Analizzando l'anno 1999...

🔍 Analizzando l'anno 2000...

🔍 Analizzando l'anno 2001...

🔍 Analizzando l'anno 2002...

🔍 Analizzando l'anno 2003...

🔍 Analizzando l'anno 2004...

🔍 Analizzando l'anno 2005...

🔍 Analizzando l'anno 2006...

🔍 Analizzando l'anno 2007...

🔍 Analizzando l'anno 2008...

🔍 Analizzando l'anno 2009...

🔍 Analizzando l'anno 2010...

🔍 Analizzando l'anno 2011...

🔍 Analizzando l'anno 2012...

🔍 Analizzando l'anno 2013...

🔍 Analizz

KeyboardInterrupt: 