In [None]:
# Librairies
import xarray as xr
import pandas as pd
import numpy as np
import glob
import os

# CONFIGURATION
path_data = "C:/Users/margo/OneDrive/Documents/M1 SSD/Projet_Tutore/Analyse_Meteo/data/raw-yearly-combined/era5_fr_t2m/*.nc"
path_mask = "C:/Users/margo/OneDrive/Documents/M1 SSD/Projet_Tutore/Analyse_Meteo/src/mask_france_boolean.nc"

print("üöÄ D√©marrage du script de r√©cup√©ration...")

# TRAITEMENT GLOBAL
try:
    # 0. S√âLECTION DES 25 PREMI√àRES ANN√âES
    print("üîç S√©lection des fichiers...")
    fichiers = sorted(glob.glob(path_data))
    print(f"   ‚Üí {len(fichiers)} fichiers trouv√©s au total")

    # Prendre les 300 premiers fichiers (25 ans √ó 12 mois)
    fichiers_25ans = fichiers[:300]
    print(f"   ‚Üí S√©lection de {len(fichiers_25ans)} fichiers (25 premi√®res ann√©es)")

    premier_fichier = os.path.basename(fichiers_25ans[0])
    dernier_fichier = os.path.basename(fichiers_25ans[-1])
    print(f"   ‚Üí Premier : {premier_fichier}")
    print(f"   ‚Üí Dernier : {dernier_fichier}")

    # Chargement du masque
    print("‚è≥ Chargement du masque...")
    mask = xr.open_dataset(path_mask)

    # TRAITEMENT PAR ANN√âES (12 fichiers √† la fois)
    print("\nüìä Traitement ann√©e par ann√©e pour √©viter la saturation m√©moire...")

    moyennes_annuelles = []

    for annee in range(25):
        debut = annee * 12
        fin = debut + 12
        fichiers_annee = fichiers_25ans[debut:fin]

        annee_num = 1950 + annee
        print(f"   ‚Üí Ann√©e {annee_num} ({annee+1}/25)...", end=" ")

        try:
            # Charger une ann√©e
            ds_annee = xr.open_mfdataset(
                fichiers_annee,
                engine='netcdf4',
                combine='by_coords'
            )

            # Appliquer le masque
            ds_masked = ds_annee.where(mask['mask'] == 1)

            # Calculer la moyenne spatiale
            ds_mean = ds_masked.mean(dim=['latitude', 'longitude'], skipna=True)

            # Convertir en DataFrame
            df_annee = ds_mean.to_dataframe().reset_index()

            if 'valid_time' in df_annee.columns:
                df_annee = df_annee.rename(columns={'valid_time': 'time'})

            moyennes_annuelles.append(df_annee)

            # Lib√©rer la m√©moire
            ds_annee.close()
            del ds_annee, ds_masked, ds_mean

            print("‚úì")

        except Exception as e_annee:
            print(f"‚úó Erreur : {e_annee}")

    # Combiner toutes les ann√©es
    print("\nüîó Fusion des donn√©es...")
    df_complet = pd.concat(moyennes_annuelles, ignore_index=True)

    # --- SAUVEGARDE CSV ---
    print("üíæ Sauvegarde du CSV...")
    if 't2m' in df_complet.columns:
        df_complet['Temperature_C'] = df_complet['t2m'] - 273.15

        # S'assurer que 'time' existe
        if 'time' not in df_complet.columns:
            df_complet['time'] = df_complet.iloc[:, 0]

        final_df = df_complet[['time', 'Temperature_C']].sort_values('time')
        final_df.to_csv("donnees_meteo_france_25ans.csv", index=False)

        print(f"‚úÖ Fichier CSV cr√©√© : 'donnees_meteo_france_25ans.csv'")
        print(f"   ‚Üí {len(final_df)} mesures sauvegard√©es")
        print(f"   ‚Üí P√©riode : {final_df['time'].min()} √† {final_df['time'].max()}")
    else:
        print("‚ùå Erreur : Colonne 't2m' introuvable")
        print(f"   Colonnes disponibles : {df_complet.columns.tolist()}")

    # --- FICHIER 2 : LA CARTE (NetCDF) ---
    print("\nüó∫Ô∏è Cr√©ation de la carte exemple...")
    try:
        # Charger juste le fichier du milieu (mois 150 ‚âà ann√©e 12)
        fichier_milieu = fichiers_25ans[150]
        ds_carte = xr.open_dataset(fichier_milieu)
        ds_carte_masked = ds_carte.where(mask['mask'] == 1)

        # Prendre le premier timestep
        ds_carte_final = ds_carte_masked.isel(valid_time=0)
        ds_carte_final.to_netcdf("carte_exemple_25ans.nc")

        print(f"‚úÖ Fichier NetCDF cr√©√© : 'carte_exemple_25ans.nc'")
        print(f"   ‚Üí Fichier source : {os.path.basename(fichier_milieu)}")

        ds_carte.close()

    except Exception as e_map:
        print(f"‚ö†Ô∏è Erreur lors de la cr√©ation de la carte : {e_map}")

    # Fermeture du masque
    mask.close()

    print("\nüéâ Traitement termin√© avec succ√®s !")
    print(f"üìÅ Fichiers cr√©√©s dans : {os.getcwd()}")

except Exception as e:
    print(f"\n‚ùå ERREUR BLOQUANTE : {e}")
    import traceback
    print(traceback.format_exc())