In [None]:
import pandas as pd
import json

def normalise_lambert(name:str="SIM2_1980_1989"):
    path = f"./data/geo_data/lambert/{name}.csv"
    df = pd.read_csv(path, sep=";")
    # Delete all columns except LAMBX, LAMBY, DATE, T_Q, TINF_H_Q, TSUP_H_Q, PRENEI_Q, PRELIQ_Q, DLI_Q, SSI_Q, FF_Q
    display(df.head())
    print(df.columns)
    df = df[['LAMBX', 'LAMBY', 'DATE', 'T_Q', 'TINF_H_Q', 'TSUP_H_Q', 'PRENEI_Q', 'PRELIQ_Q', 'DLI_Q', 'SSI_Q', 'FF_Q']]
    # Séparer le mois et l'année
    df['DATE'] = pd.to_datetime(df['DATE'], format='%Y%m%d')
    df['YEAR'] = df['DATE'].dt.year
    df['MONTH'] = df['DATE'].dt.month
    
    # Supprimer la colonne DATE
    df = df.drop(columns=['DATE'])
    display(df.head())
    
    # Charger le fichier test.csv
    print(df.columns)

    # Charger le fichier de conversion ../conversion.csv
    df_conversion = pd.read_csv('./data/geo_data/conversion.csv', sep=";", decimal=',')
    print(df_conversion.columns)

    # Fusionner les dataframes sur les colonnes LAMBX et LAMBY
    df_merged = pd.merge(df, df_conversion, how='left', left_on=['LAMBX', 'LAMBY'], right_on=['LAMBX (hm)', 'LAMBY (hm)'])
    print(df_merged.columns)
    print(df_merged.dtypes)

    # Supprimer les colonnes LAMBX, LAMBY et les colonnes de conversion inutiles
    df = df_merged.drop(['LAMBX (hm)', 'LAMBY (hm)'], axis=1)
    display(df.head())

    # Charger les données du JSON dans une structure Python
    with open('./data/geo_data/stations_data.json', 'r') as json_file:
        data = json.load(json_file)

    # Définir une fonction pour trouver le département à partir des coordonnées
    def find_department(lat, lon):
        for feature in data['features'].values():
            if feature['properties']['LAT_DG'] == lat and feature['properties']['LON_DG'] == lon:
                return feature['properties']['NUM_DEP']
        return None

    # Appliquer la fonction find_department pour mapper les départements
    df['DEPARTEMENT'] = df.apply(lambda row: find_department(row['LAT_DG'], row['LON_DG']), axis=1)

    # Enregistrer le dataframe modifié avec les départements attribués
    df.to_csv(f'./data/geo_data/lambert/{name}_norm.csv', index=False)
    
for name in ["SIM2_1980_1989", "SIM2_1990_1999", "SIM2_2000_2009", "SIM2_2010_2019"]:
    normalise_lambert(name)
    