In [2]:
import os
import pandas as pd

def merge_csv_files(folder_path, output_file_path):
    """
    Parcourt tous les fichiers CSV dans le dossier spécifié, ajoute une colonne 'site' basée sur le nom du fichier,
    et fusionne tous les fichiers dans un seul fichier CSV.

    Args:
    folder_path (str): Le chemin du dossier contenant les fichiers CSV.
    output_file_path (str): Le chemin du fichier de sortie pour le fichier fusionné.
    """
    # Créer une liste pour stocker les DataFrames
    dataframes = []

    # Parcourir tous les fichiers dans le dossier
    for filename in os.listdir(folder_path):
        
        if filename.endswith('.csv'):
            
            # Lire le fichier CSV
            file_path = os.path.join(folder_path, filename)
            df = pd.read_csv(file_path)
            
            # Ajouter la colonne 'site' basée sur le nom du fichier
            site_name = os.path.splitext(filename)[0].split("_")[0]
            df['site'] = site_name
            
            # Ajouter le DataFrame à la liste
            dataframes.append(df)

    # Fusionner tous les DataFrames
    combined_df = pd.concat(dataframes, ignore_index=True)

    # Sauvegarder le fichier fusionné
    combined_df.to_csv(output_file_path, index=False)

    print(f"Le fichier fusionné a été créé avec succès : {output_file_path}")

# Exemple d'utilisation de la fonction
folder_path = r'D:\Bureau\MemoiresStages\Travaux_techniques\Scrapping\Datasets\Mai'
output_file_path = r'D:\Bureau\MemoiresStages\Travaux_techniques\Scrapping\Datasets\Mai\merged\Mai.csv'

merge_csv_files(folder_path, output_file_path)


Le fichier fusionné a été créé avec succès : D:\Bureau\MemoiresStages\Travaux_techniques\Scrapping\Datasets\Mai\merged\Mai.csv
