In [None]:
import os
import pandas as pd
import re

def read_feather_recursif(dossiers):
    """
    Parcourt les dossiers et leurs sous-dossiers récursivement et supprime
    tous les fichiers 'data.feather' s'ils existent.
    
    :param dossiers: Liste de chemins de dossiers à parcourir.
    """
    # Définir l'expression régulière pour correspondre à 'data.feather' ou 'data_<word>.feather'
    pattern = re.compile(r'^data(?:_[a-zA-ZçÇéÉèÈêÊëËàÀâÂîÎïÏôÔûÛùÙüÜœŒ\s\W]+)*\.feather$', re.UNICODE)
    for dossier in dossiers:
        # Parcours récursivement le dossier et ses sous-dossiers
        for chemin_racine, sous_dossiers, fichiers in os.walk(dossier):
            # Filtre les fichiers correspondant à l'expression régulière
            for fichier in fichiers:
                # print(fichier)
                if pattern.match(fichier):
                    chemin_fichier = os.path.join(chemin_racine, fichier)
                    df = pd.read_feather(chemin_fichier)
                    print(df)

In [13]:
import os
import pandas as pd
def remove_columns(df:pd.DataFrame):
    df.set_index('date', inplace=True)
    # columns_to_drop = [col for col in df.columns if col.startswith('date')]
    columns_to_drop = ['hospital_nb_emergencies', 'hospital_nb_hospit_np_from_ED_children', 'hospital_nb_hospit_np_from_ED_adults']
    print(columns_to_drop)
    df.drop(columns=columns_to_drop, inplace=True)
    return df

In [14]:
import os
import pandas as pd

def modify_csv_files(folder_path, modify_function):
    """
    Ouvre, modifie et sauvegarde tous les fichiers CSV qui commencent par 'target_history_dataset_' 
    dans un dossier donné.

    Args:
        folder_path (str): Chemin du dossier contenant les fichiers CSV.
        modify_function (function): Fonction prenant un DataFrame en entrée et renvoyant un DataFrame modifié.
    """
    # Vérifier si le dossier existe
    if not os.path.exists(folder_path):
        raise FileNotFoundError(f"Le dossier {folder_path} n'existe pas.")

    # Parcourir tous les fichiers dans le dossier
    for filename in os.listdir(folder_path):
        if filename.startswith("target_history_dataset_") and filename.endswith(".csv"):
            file_path = os.path.join(folder_path, filename)
            print(f"Traitement du fichier: {file_path}")

            # Lire le fichier CSV dans un DataFrame
            try:
                df = pd.read_csv(file_path)
            except Exception as e:
                print(f"Erreur lors de la lecture du fichier {file_path}: {e}")
                continue

            # Appliquer les modifications au DataFrame
            # try:
            modified_df:pd.DataFrame = modify_function(df)
            # except Exception as e:
            #     print(f"Erreur lors de la modification du fichier {file_path}: {e}")
            #     continue

            # Sauvegarder le fichier modifié
            try:
                modified_df.to_csv(file_path)
                print(f"Fichier modifié et sauvegardé: {file_path}")
            except Exception as e:
                print(f"Erreur lors de la sauvegarde du fichier {file_path}: {e}")

In [3]:
# dossiers_a_parcourir = [
#     "../../data/features/hospitalfeatures"
# ]

# read_feather_recursif(dossiers_a_parcourir)

In [15]:
dossier = '../../data/datasets'
modify_csv_files(dossier, remove_columns)

Traitement du fichier: ../../data/datasets/target_history_dataset_CH J. COEUR BOURGES_target_hospital_nb_hospit_np_from_ED_adults%J+7%mean_7J.csv
['hospital_nb_emergencies', 'hospital_nb_hospit_np_from_ED_children', 'hospital_nb_hospit_np_from_ED_adults']
Fichier modifié et sauvegardé: ../../data/datasets/target_history_dataset_CH J. COEUR BOURGES_target_hospital_nb_hospit_np_from_ED_adults%J+7%mean_7J.csv
Traitement du fichier: ../../data/datasets/target_history_dataset_CH DE L'AGGLOMÉRATION DE NEVERS_target_hospital_nb_hospit_np_from_ED_children%J+7%mean_7J.csv
['hospital_nb_emergencies', 'hospital_nb_hospit_np_from_ED_children', 'hospital_nb_hospit_np_from_ED_adults']
Fichier modifié et sauvegardé: ../../data/datasets/target_history_dataset_CH DE L'AGGLOMÉRATION DE NEVERS_target_hospital_nb_hospit_np_from_ED_children%J+7%mean_7J.csv
Traitement du fichier: ../../data/datasets/target_history_dataset_CH DE NOGENT LE ROTROU_target_hospital_nb_hospit_np_from_ED_adults%J+7%mean_7J.csv
['h