In [1]:
import pandas as pd
import os
import glob
from deltalake.writer import write_deltalake
from deltalake import DeltaTable

DATA_SOURCE_PATH : str = '../data/'
DATA_PARZIALI_2025_DIR_PATH : str = os.path.join(DATA_SOURCE_PATH, 'Stazione_Parametro_AnnoMese')
DATA_STORICI_DIR_PATH : str = os.path.join(DATA_SOURCE_PATH, 'storico_Anno_Stazione_Parametro')

DATA_ANAGRAFICA_PARAMETRI_PATH : str = os.path.join(DATA_SOURCE_PATH,"AnagrafeParametri.csv")
DATA_ANAGRAFICA_STAZIONI_PATH : str = os.path.join(DATA_SOURCE_PATH,"AnagrafeStazioni.csv")

DELTA_LAKE_BASE_PATH : str = '../delta_tables/'
DELTA_ANAGRAFICA_STAZIONI_PATH : str = os.path.join(DELTA_LAKE_BASE_PATH, 'anagrafica_stazioni_bronze')
DELTA_ANAGRAFICA_PARAMETRI_PATH : str = os.path.join(DELTA_LAKE_BASE_PATH, 'anagrafica_parametri_bronze')
DELTA_QUALITA_ARIA_PATH : str = os.path.join(DELTA_LAKE_BASE_PATH, 'qualita_aria_bronze')


print("Setup completato. I percorsi delle tabelle Delta sono pronti.")


Setup completato. I percorsi delle tabelle Delta sono pronti.


In [2]:
print("--- Inizio processamento Anagrafe Stazioni ---")
try:
    stazioni_dataframe = pd.read_csv(DATA_ANAGRAFICA_STAZIONI_PATH)
    print(f"Letto il file dell'anagrafica stazioni. Trovate {len(stazioni_dataframe)} righe.")
    print("\nInformazioni sul DataFrame originale:")
    stazioni_dataframe.info()
    display(stazioni_dataframe.head())



    print("\nPulizia della colonna 'Cod_staz'...")
    
    #Rimuoviamo i punti '.' dalla stringa
    stazioni_dataframe['Cod_staz'] = stazioni_dataframe['Cod_staz'].astype(str).str.replace('.', '', regex=False)
    
    #Convertiamo la colonna pulita in un tipo numerico (intero)
    stazioni_dataframe['Cod_staz'] = pd.to_numeric(stazioni_dataframe['Cod_staz'], errors='coerce')
    
    #Rimuoviamo eventuali righe dove la conversione è fallita
    stazioni_dataframe.dropna(subset=['Cod_staz'], inplace=True)
    
    #Convertiamo in un intero non-nullo per pulizia finale
    stazioni_dataframe['Cod_staz'] = stazioni_dataframe['Cod_staz'].astype(int)
    
    print("Pulizia completata con successo!")

    print("Riempimento altezze vuote")
    stazioni_dataframe["Altezza"] = stazioni_dataframe["Altezza"].fillna(0)

    
    # Visualizziamo i tipi di dato DOPO la pulizia per verificare
    print("\nInformazioni sul DataFrame pulito (dopo la pulizia):")
    stazioni_dataframe.info()
    display(stazioni_dataframe.head())

    print(f"\nScrittura nella tabella Delta: {DELTA_ANAGRAFICA_STAZIONI_PATH}")
    write_deltalake(DELTA_ANAGRAFICA_STAZIONI_PATH, stazioni_dataframe, mode="overwrite")
    print("Tabella Anagrafe Stazioni scritta con successo in formato Delta Lake.")

except FileNotFoundError:
    print(f"ERRORE: File non trovato in '{DATA_ANAGRAFICA_STAZIONI_PATH}'. Assicurati che il file esista e il percorso sia corretto.")
except Exception as e:
    print(f"Si è verificato un errore: {e}")

--- Inizio processamento Anagrafe Stazioni ---
Letto il file dell'anagrafica stazioni. Trovate 273 righe.

Informazioni sul DataFrame originale:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 273 entries, 0 to 272
Data columns (total 15 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   Stazione   273 non-null    object 
 1   Cod_staz   273 non-null    object 
 2   COMUNE     273 non-null    object 
 3   INDIRIZZO  273 non-null    object 
 4   PROVINCIA  273 non-null    object 
 5   Altezza    250 non-null    float64
 6   Id_Param   273 non-null    int64  
 7   PARAMETRO  273 non-null    object 
 8   UM         273 non-null    object 
 9   Coord_X    273 non-null    float64
 10  Coord_Y    273 non-null    float64
 11  SR         273 non-null    int64  
 12  LON_GEO    273 non-null    float64
 13  LAT_GEO    273 non-null    float64
 14  SR_GEO     273 non-null    int64  
dtypes: float64(5), int64(3), object(7)
memory usage: 32.1+ KB


Unnamed: 0,Stazione,Cod_staz,COMUNE,INDIRIZZO,PROVINCIA,Altezza,Id_Param,PARAMETRO,UM,Coord_X,Coord_Y,SR,LON_GEO,LAT_GEO,SR_GEO
0,GIARDINI MARGHERITA,7.000.014,BOLOGNA,VIALE BOTTONELLI,BO,43.0,5,PM10,ug/m3,687199.0608,4928180.0,25832,11.354062,44.482671,4326
1,GIARDINI MARGHERITA,7.000.014,BOLOGNA,VIALE BOTTONELLI,BO,43.0,7,O3 (Ozono),ug/m3,687199.0608,4928180.0,25832,11.354062,44.482671,4326
2,GIARDINI MARGHERITA,7.000.014,BOLOGNA,VIALE BOTTONELLI,BO,43.0,8,NO2 (Biossido di azoto),ug/m3,687199.0608,4928180.0,25832,11.354062,44.482671,4326
3,GIARDINI MARGHERITA,7.000.014,BOLOGNA,VIALE BOTTONELLI,BO,43.0,111,PM2.5,ug/m3,687199.0608,4928180.0,25832,11.354062,44.482671,4326
4,PORTA SAN FELICE,7.000.015,BOLOGNA,PIAZZA DI PORTA SAN FELICE,BO,54.0,5,PM10,ug/m3,685037.0762,4929940.0,25832,11.327527,44.49906,4326



Pulizia della colonna 'Cod_staz'...
Pulizia completata con successo!
Riempimento altezze vuote

Informazioni sul DataFrame pulito (dopo la pulizia):
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 273 entries, 0 to 272
Data columns (total 15 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   Stazione   273 non-null    object 
 1   Cod_staz   273 non-null    int64  
 2   COMUNE     273 non-null    object 
 3   INDIRIZZO  273 non-null    object 
 4   PROVINCIA  273 non-null    object 
 5   Altezza    273 non-null    float64
 6   Id_Param   273 non-null    int64  
 7   PARAMETRO  273 non-null    object 
 8   UM         273 non-null    object 
 9   Coord_X    273 non-null    float64
 10  Coord_Y    273 non-null    float64
 11  SR         273 non-null    int64  
 12  LON_GEO    273 non-null    float64
 13  LAT_GEO    273 non-null    float64
 14  SR_GEO     273 non-null    int64  
dtypes: float64(5), int64(4), object(6)
memory usage: 32.1+ KB


Unnamed: 0,Stazione,Cod_staz,COMUNE,INDIRIZZO,PROVINCIA,Altezza,Id_Param,PARAMETRO,UM,Coord_X,Coord_Y,SR,LON_GEO,LAT_GEO,SR_GEO
0,GIARDINI MARGHERITA,7000014,BOLOGNA,VIALE BOTTONELLI,BO,43.0,5,PM10,ug/m3,687199.0608,4928180.0,25832,11.354062,44.482671,4326
1,GIARDINI MARGHERITA,7000014,BOLOGNA,VIALE BOTTONELLI,BO,43.0,7,O3 (Ozono),ug/m3,687199.0608,4928180.0,25832,11.354062,44.482671,4326
2,GIARDINI MARGHERITA,7000014,BOLOGNA,VIALE BOTTONELLI,BO,43.0,8,NO2 (Biossido di azoto),ug/m3,687199.0608,4928180.0,25832,11.354062,44.482671,4326
3,GIARDINI MARGHERITA,7000014,BOLOGNA,VIALE BOTTONELLI,BO,43.0,111,PM2.5,ug/m3,687199.0608,4928180.0,25832,11.354062,44.482671,4326
4,PORTA SAN FELICE,7000015,BOLOGNA,PIAZZA DI PORTA SAN FELICE,BO,54.0,5,PM10,ug/m3,685037.0762,4929940.0,25832,11.327527,44.49906,4326



Scrittura nella tabella Delta: ../delta_tables/anagrafica_stazioni_bronze
Tabella Anagrafe Stazioni scritta con successo in formato Delta Lake.


In [3]:
print("--- Inizio processamento Anagrafe Parametri ---")
try:
    parametri_dataframe = pd.read_csv(DATA_ANAGRAFICA_PARAMETRI_PATH)
    print(f"Letto il file dell'anagrafica parametri. Trovate {len(parametri_dataframe)} righe.")
    print("\nInformazioni sul DataFrame originale:")
    parametri_dataframe.info()
    display(parametri_dataframe.head())

    print(f"\nScrittura nella tabella Delta: {DELTA_ANAGRAFICA_PARAMETRI_PATH}")
    write_deltalake(DELTA_ANAGRAFICA_PARAMETRI_PATH, parametri_dataframe, mode="overwrite")
    print("Tabella Anagrafe Parametri scritta con successo in formato Delta Lake.")

except FileNotFoundError:
    print(f"ERRORE: File non trovato in '{DELTA_ANAGRAFICA_PARAMETRI_PATH}'. Assicurati che il file esista e il percorso sia corretto.")
except Exception as e:
    print(f"Si è verificato un errore: {e}")

--- Inizio processamento Anagrafe Parametri ---
Letto il file dell'anagrafica parametri. Trovate 21 righe.

Informazioni sul DataFrame originale:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 21 entries, 0 to 20
Data columns (total 5 columns):
 #   Column       Non-Null Count  Dtype 
---  ------       --------------  ----- 
 0   IdParametro  21 non-null     int64 
 1   PARAMETRO    21 non-null     object
 2   UM           21 non-null     object
 3   Tmed (min)   21 non-null     int64 
 4   NOTE         21 non-null     object
dtypes: int64(2), object(3)
memory usage: 972.0+ bytes


Unnamed: 0,IdParametro,PARAMETRO,UM,Tmed (min),NOTE
0,1,SO2 (Biossido di zolfo),ug/m3,60,"Valori medi orari, l'ora riportata e' quella d..."
1,5,PM10,ug/m3,1440,"Valori medi giornalieri, il giorno riportato e..."
2,7,O3 (Ozono),ug/m3,60,"Valori medi orari, l'ora riportata e' quella d..."
3,8,NO2 (Biossido di azoto),ug/m3,60,"Valori medi orari, l'ora riportata e' quella d..."
4,9,NOX (Ossidi di azoto),ug/m3,60,"Valori medi orari, l'ora riportata e' quella d..."



Scrittura nella tabella Delta: ../delta_tables/anagrafica_parametri_bronze
Tabella Anagrafe Parametri scritta con successo in formato Delta Lake.


# PROCESSAMENTO PARZIALI 2025
## 1) Unione dei vari csv in un unico dataframe

In [4]:
print("--- Inizio processamento Parziali 2025 ---")

parziali_df_list : list = []
formato_data : str = '%d/%m/%Y %H:%M'

try:
    print("Caricamento di tutti i csv in un unico df...")
    pattern = os.path.join(DATA_PARZIALI_2025_DIR_PATH, '*.csv')
    lista_file_csv = glob.glob(pattern)
    print(f"Trovati {len(lista_file_csv)} file CSV:")
    for file_csv in lista_file_csv:
        #print(f"proceso il file {os.path.basename(file_csv)}")
        df_temp = pd.read_csv(file_csv)
        parziali_df_list.append(df_temp)
    
    print("Caricamento completato con successo! ")


except FileNotFoundError:
    print(f"ERRORE: File non trovato in '{DELTA_ANAGRAFICA_PARAMETRI_PATH}'. Assicurati che il file esista e il percorso sia corretto.")
except Exception as e:
    print(f"Si è verificato un errore: {e}")

if parziali_df_list: 
    print("Unione DataFrame in corso...")
    corrente_df = pd.concat(parziali_df_list, ignore_index=True)
    print("DataFrame unificato creato con successo.")
    print("Dimensioni totali:", corrente_df.shape)
else:
    print("Nessun DataFrame da unire.")
    corrente_df = pd.DataFrame()

print(corrente_df)


--- Inizio processamento Parziali 2025 ---
Caricamento di tutti i csv in un unico df...
Trovati 226 file CSV:
Caricamento completato con successo! 
Unione DataFrame in corso...
DataFrame unificato creato con successo.
Dimensioni totali: (685177, 5)
        COD_STAZ  ID_PARAM         DATA_FINE  VALORE VALIDAZIONE
0       10000002         7  01/01/2025 01:00     2.0           S
1       10000002         7  01/01/2025 02:00     2.0           S
2       10000002         7  01/01/2025 03:00     2.0           S
3       10000002         7  01/01/2025 04:00     2.0           S
4       10000002         7  01/01/2025 05:00     1.0           S
...          ...       ...               ...     ...         ...
685172   7000015        38  30/06/2025 20:00     3.0           S
685173   7000015        38  30/06/2025 21:00     1.0           S
685174   7000015        38  30/06/2025 22:00     1.0           S
685175   7000015        38  30/06/2025 23:00     3.0           S
685176   7000015        38  01/07/20

## 2) Pulizia dei dati e riordinamento della colonna
Dato che i parametri 5 e 111 sono con misurazione giornaliera mentre gli altri con misurazione oraria creo una maschera per inserire la data inizio ogni giorno per 5, 111 e 

In [5]:
daily_check : list = [5, 111]
mask_giorni = corrente_df['ID_PARAM'].isin([5, 111])
mask_ore = ~mask_giorni


if not corrente_df.empty:
    print("Pulizia dei dati nel dataframe")
    print("Inserimento colonna DATA_INIZIO...")

    corrente_df['DATA_FINE'] = pd.to_datetime(corrente_df['DATA_FINE'], format=formato_data)
    corrente_df['DATA_INIZIO'] = pd.NaT
    corrente_df.loc[mask_giorni, 'DATA_INIZIO'] = corrente_df['DATA_FINE'] - pd.DateOffset(days=1)
    corrente_df.loc[mask_ore, 'DATA_INIZIO'] = corrente_df['DATA_FINE'] - pd.DateOffset(hours=1)
    
    
    print("Inserita colonna DATA_INIZIO")

    corrente_df['VALORE'] = corrente_df['VALORE'].astype(str).str.replace(',', '.', regex=False)
    corrente_df['VALORE'] = pd.to_numeric(corrente_df['VALORE'], errors='coerce')
    
    rows_before = len(corrente_df)
    corrente_df.dropna(subset=['DATA_FINE', 'VALORE'], inplace=True)
    rows_after = len(corrente_df)
    print(f"Rimossi {rows_before - rows_after} record con date o valori non validi.")
    
    colonne_esistenti = list(corrente_df.columns)
    colonne_esistenti.remove('DATA_INIZIO') 
    
    colonne_esistenti.insert(2, 'DATA_INIZIO')
    corrente_df = corrente_df[colonne_esistenti]
    print("Colonne riordinate.")
    print(corrente_df)


Pulizia dei dati nel dataframe
Inserimento colonna DATA_INIZIO...
Inserita colonna DATA_INIZIO
Rimossi 0 record con date o valori non validi.
Colonne riordinate.
        COD_STAZ  ID_PARAM         DATA_INIZIO           DATA_FINE  VALORE  \
0       10000002         7 2025-01-01 00:00:00 2025-01-01 01:00:00     2.0   
1       10000002         7 2025-01-01 01:00:00 2025-01-01 02:00:00     2.0   
2       10000002         7 2025-01-01 02:00:00 2025-01-01 03:00:00     2.0   
3       10000002         7 2025-01-01 03:00:00 2025-01-01 04:00:00     2.0   
4       10000002         7 2025-01-01 04:00:00 2025-01-01 05:00:00     1.0   
...          ...       ...                 ...                 ...     ...   
685172   7000015        38 2025-06-30 19:00:00 2025-06-30 20:00:00     3.0   
685173   7000015        38 2025-06-30 20:00:00 2025-06-30 21:00:00     1.0   
685174   7000015        38 2025-06-30 21:00:00 2025-06-30 22:00:00     1.0   
685175   7000015        38 2025-06-30 22:00:00 2025-06-30 

# PROCESSAMENTO DATI STORICI
## 3) Unione dei vari file CSV storici in un unico DataFrame


In [6]:
print("--- Inizio processamento Dati Storici ---")

# Lista per accumulare i DataFrame storici
storico_df_list = []

# Definiamo il formato data atteso per i file storici, come per quelli correnti
formato_data_storico = '%d/%m/%Y %H'

# Trova tutti i file CSV nella directory dei dati storici
pattern_storici = os.path.join(DATA_STORICI_DIR_PATH, '*.csv')
lista_file_storici = glob.glob(pattern_storici)
print(f"Trovati {len(lista_file_storici)} file CSV storici da processare.")

perc_notifica = 5
counter = 0 
percentage_base = int(perc_notifica * len(lista_file_storici) / 100)

# Itera su ogni file storico per caricarlo e armonizzarlo
print("Inizio a unire i dataframe e processare i dati")
for index, file_csv in enumerate(lista_file_storici):
    try:
        # Leggiamo il CSV usando i parametri corretti per dati ben formattati.
        # Rimuoviamo sep e encoding, mantenendo low_memory=False per sicurezza sui tipi.
        df_temp_storico = pd.read_csv(file_csv, low_memory=False)
        
        # --- LOGICA DI PULIZIA E ARMONIZZAZIONE ---
        if (index % percentage_base == 0 and index != 0):
            print(f"{perc_notifica*(counter+1)}% completato")
            counter += 1
            
        # 1. GESTIONE DATE: Convertiamo subito le colonne data usando il formato corretto.
        df_temp_storico['DATA_INIZIO'] = pd.to_datetime(df_temp_storico['DATA_INIZIO'], format=formato_data_storico, errors='coerce')
        df_temp_storico['DATA_FINE'] = pd.to_datetime(df_temp_storico['DATA_FINE'], format=formato_data_storico, errors='coerce')

        # 2. GESTIONE VALORE NUMERICO: La logica rimane la stessa per sicurezza
        df_temp_storico['VALORE'] = pd.to_numeric(df_temp_storico['VALORE'], errors='coerce')
        
        # 3. GESTIONE COLONNE EXTRA/MANCANTI
        df_temp_storico.drop(columns=['UM'], inplace=True)
        df_temp_storico['VALIDAZIONE'] = 'S'
        
        # Aggiungiamo il DataFrame pulito e armonizzato alla lista
        storico_df_list.append(df_temp_storico)
        
        
    except Exception as e:
        print(f"Attenzione: Errore durante l'elaborazione del file {os.path.basename(file_csv)}: {e}")

print("Terminato processamento dei dati")
# Uniamo tutti i DataFrame storici in uno solo
if storico_df_list:
    print("\nUnione dei DataFrame storici in corso...")
    storico_df = pd.concat(storico_df_list, ignore_index=True)
    print("DataFrame storico unificato creato con successo.")
    print("Dimensioni totali dati storici:", storico_df.shape)
else:
    print("Nessun DataFrame storico da unire.")
    storico_df = pd.DataFrame()

# Mostriamo un'anteprima del DataFrame storico armonizzato per verifica
if not storico_df.empty:
    print("\nAnteprima del DataFrame storico pulito e armonizzato:")
    print(storico_df)
    print("\nVerifica tipi di dato (dtypes):")
    print(storico_df.info())


--- Inizio processamento Dati Storici ---
Trovati 3386 file CSV storici da processare.
Inizio a unire i dataframe e processare i dati
5% completato
10% completato
15% completato
20% completato
25% completato
30% completato
35% completato
40% completato
45% completato
50% completato
55% completato
60% completato
65% completato
70% completato
75% completato
80% completato
85% completato
90% completato
95% completato
100% completato
Terminato processamento dei dati

Unione dei DataFrame storici in corso...
DataFrame storico unificato creato con successo.
Dimensioni totali dati storici: (20010821, 6)

Anteprima del DataFrame storico pulito e armonizzato:
          COD_STAZ  ID_PARAM         DATA_INIZIO           DATA_FINE  VALORE  \
0          7000002         5 2020-01-01 00:00:00 2020-01-02 00:00:00    39.0   
1          7000002         5 2020-01-02 00:00:00 2020-01-03 00:00:00    49.0   
2          7000002         5 2020-01-03 00:00:00 2020-01-04 00:00:00    44.0   
3          7000002   

# UNIONE FINALE E SCRITTURA SU DELTA LAKE
## 4) Unione dei dati correnti e storici, pulizia finale e scrittura

In [None]:
# Cella 11 (Codice) - Unione Finale e Scrittura (con fix per l'indice extra)

print("--- Inizio Unione Finale e Scrittura ---")

# ... (la parte iniziale di unione dei DataFrame rimane identica) ...
dataframes_to_concat = []
if 'corrente_df' in locals() and not corrente_df.empty:
    dataframes_to_concat.append(corrente_df)
    print(f"Aggiunto DataFrame 'corrente_df' con {len(corrente_df)} righe.")
if 'storico_df' in locals() and not storico_df.empty:
    dataframes_to_concat.append(storico_df)
    print(f"Aggiunto DataFrame 'storico_df' con {len(storico_df)} righe.")

if dataframes_to_concat:
    print(f"\nUnione di {len(dataframes_to_concat)} DataFrame(s) principali...")
    final_df = pd.concat(dataframes_to_concat, ignore_index=True)
    print(f"DataFrame finale creato con {len(final_df)} righe.")

    # --- PULIZIA FINALE SUL DATAFRAME UNIFICATO ---
    print("Esecuzione pulizia finale su tutto il dataset...")
    rows_before = len(final_df)
    final_df.dropna(subset=['DATA_FINE', 'VALORE', 'COD_STAZ'], inplace=True)
    rows_after = len(final_df)
    print(f"Rimossi {rows_before - rows_after} record con valori nulli in colonne critiche.")
    
    # --- MODIFICA CHIAVE: RESETTIAMO L'INDICE PRIMA DI SALVARE ---
    # Il parametro drop=True è FONDAMENTALE: butta via il vecchio indice invece di
    # trasformarlo in una nuova colonna. Questo risolve il problema di '__index_level_0__'.
    final_df.reset_index(drop=True, inplace=True)
    print("Indice del DataFrame finale resettato per evitare colonne extra.")
    
    # --- Assicuriamoci che l'ordine delle colonne sia esattamente quello target.
    colonne_finali = ['COD_STAZ', 'ID_PARAM', 'DATA_INIZIO', 'DATA_FINE', 'VALORE', 'VALIDAZIONE']
    final_df = final_df[colonne_finali]
    print("Colonne riordinate secondo lo schema target.")
    
    # --- SCRITTURA NELLA TABELLA DELTA LAKE (con la chiamata corretta) ---
    print(f"\nScrittura di {len(final_df)} righe nella tabella Delta: {DELTA_QUALITA_ARIA_PATH}")
    write_deltalake(
        DELTA_QUALITA_ARIA_PATH,
        final_df,
        mode='overwrite' 
    )
    
    print("SCRITTURA COMPLETATA. La tabella 'qualita_aria_bronze' è stata creata/aggiornata.")
else:
    print("Nessun dato da scrivere nella tabella Delta.")

--- Inizio Unione Finale e Scrittura ---
Aggiunto DataFrame 'corrente_df' con 685177 righe.
Aggiunto DataFrame 'storico_df' con 20010821 righe.

Unione di 2 DataFrame(s) principali...
DataFrame finale creato con 20695998 righe.
Esecuzione pulizia finale su tutto il dataset...


# Verifica finale  

In [None]:
print("\n--- Verifica Finale della Tabella 'qualita_aria_bronze' ---")

try:
    # Carichiamo la tabella Delta appena scritta per ispezionarla
    bronze_table_df = DeltaTable(DELTA_QUALITA_ARIA_PATH).to_pandas()

    print(f"\nLa tabella contiene {len(bronze_table_df)} righe.")
    print("\n> Prime 5 righe della tabella:")
    display(bronze_table_df.head())

    print("\n> Schema (.info()) della tabella:")
    bronze_table_df.info()

    # Controllo di coerenza finale per la massima sicurezza
    colonne_attese = ['COD_STAZ', 'ID_PARAM', 'DATA_INIZIO', 'DATA_FINE', 'VALORE', 'VALIDAZIONE']
    if bronze_table_df.columns.tolist() == colonne_attese:
        print("\n[SUCCESS] Verifica superata: Lo schema della tabella Delta corrisponde perfettamente al target.")
    else:
        print("\n[FAIL] ATTENZIONE: Lo schema della tabella Delta NON corrisponde allo schema target!")

except FileNotFoundError:
    print(f"ERRORE: La tabella Delta non è stata trovata in '{DELTA_QUALITA_ARIA_PATH}'.")
except Exception as e:
    print(f"Si è verificato un errore durante la verifica della tabella Delta: {e}")