In [3]:
import pandas as pd
import os

# Chemins des dossiers
batch1_folder = r'C:\Users\pc\Desktop\data\batch 1(original)'
batch1_suite_folder = r'C:\Users\pc\Desktop\data\batch1(suite)'
output_folder = r'C:\Users\pc\Desktop\data\combined'

# Créer le dossier de sortie s'il n
os.makedirs(output_folder, exist_ok=True)

# Obtenir la liste des fichiers dans chaque dossier
batch1_files = os.listdir(batch1_folder)
batch1_suite_files = os.listdir(batch1_suite_folder)

# Filtrer et trier les fichiers pour garantir la correspondance
batch1_files = [f for f in batch1_files if f.endswith('.csv')]
batch1_suite_files = [f for f in batch1_suite_files if f.endswith('.csv')]

# Associer les fichiers par leur suffixe
#on utilise la suite pour eviter les fichier complet dans batch1
suffixes = set(f.split('_')[-1] for f in batch1_suite_files)

for suffix in suffixes:
    
    # Trouver les fichiers correspondants dans chaque dossier
    matching_existing_files = [f for f in batch1_files if f.endswith(suffix)]
    matching_new_files = [f for f in batch1_suite_files if f.endswith(suffix)]
    
    if len(matching_existing_files) != 1 or len(matching_new_files) != 1:
        raise ValueError(f"Problème avec les fichiers correspondants pour le suffixe {suffix}")
    
    existing_file = os.path.join(batch1_folder, matching_existing_files[0])
    new_file = os.path.join(batch1_suite_folder, matching_new_files[0])
    
    # Charger les fichiers CSV
    existing_data = pd.read_csv(existing_file)
    new_data = pd.read_csv(new_file)

    # Vérifier l'existence des colonnes nécessaires
    required_columns = ['Data_Point', 'Test_Time', 'Step_Index', 'Cycle_Index']
    for col in required_columns:
        if col not in existing_data.columns or col not in new_data.columns:
            raise ValueError(f"Colonne {col} manquante dans un des fichiers CSV: {existing_file} ou {new_file}.")

    # Récupérer les dernières valeurs des colonnes nécessaires du fichier existant
    last_data_point = existing_data['Data_Point'].iloc[-1]
    last_test_time = existing_data['Test_Time'].iloc[-1]
    last_step_index = existing_data['Step_Index'].iloc[-1]
    last_cycle_index = existing_data['Cycle_Index'].iloc[-1]

    # Ajuster les colonnes nécessaires dans le nouveau fichier
    new_data['Data_Point'] += last_data_point + 1
    new_data['Test_Time'] += last_test_time + 1
    new_data['Step_Index'] += last_step_index + 1
    new_data['Cycle_Index'] += last_cycle_index + 1

    # Concaténer les données ajustées
    combined_data = pd.concat([existing_data, new_data], ignore_index=True)

    # Construire le nom de fichier de sortie en utilisant le nom du fichier existant
    output_file = os.path.join(output_folder, matching_existing_files[0])
    
    # Sauvegarder les données combinées
    combined_data.to_csv(output_file, index=False)

    print(f'Les données des fichiers pour le suffixe {suffix} ont été combinées et sauvegardées avec succès.')


Les données des fichiers pour le suffixe CH1.csv ont été combinées et sauvegardées avec succès.
Les données des fichiers pour le suffixe CH6.csv ont été combinées et sauvegardées avec succès.
Les données des fichiers pour le suffixe CH5.csv ont été combinées et sauvegardées avec succès.
Les données des fichiers pour le suffixe CH2.csv ont été combinées et sauvegardées avec succès.
Les données des fichiers pour le suffixe CH3.csv ont été combinées et sauvegardées avec succès.
