### Construction de la dataset fusionnée par nirs

In [16]:
import pandas as pd
import numpy as np
import os

# Dossiers contenant les données EEG et NIRS
eeg_folder = "/Users/info/Desktop/Stage_Acti-sens/Article/Dataset-EEG"
nirs_folder = "/Users/info/Desktop/Stage_Acti-sens/Article/Dataset-NIRS"
output_folder = "/Users/info/Desktop/Stage_Acti-sens/Article/Dataset-FUSION"

# Liste des noms de fichiers sans répétition (juste les noms de base)
filenames = [
    'AO_2.csv', 'AO_3.csv', 'AO_4.csv', 'AO_6.csv', 'AO_7.csv', 'AO_8.csv', 'AO_9.csv', 'AO_10.csv',
    'AO_11.csv', 'AO_12.csv', 'AO_13.csv', 'AO_14.csv', 'AO_15.csv', 'AO_16.csv', 'AO_17.csv',
    'AO_18.csv', 'AO_19.csv', 'AO_20.csv', 'AO_21.csv', 'AO_22.csv', 'AO_23.csv', 'AO_24.csv',
    'SO_1.csv', 'SO_2.csv', 'SO_3.csv', 'SO_4.csv', 'SO_5.csv', 'SO_6.csv', 'SO_7.csv', 'SO_8.csv',
    'SO_10.csv', 'SO_11.csv', 'SO_12.csv', 'SO_13.csv', 'SO_14.csv', 'SO_16.csv', 'SO_17.csv',
    'SO_19.csv', 'SO_20.csv', 'SO_21.csv', 'SO_23.csv', 'SO_24.csv', 'SO_25.csv', 'SO_26.csv'
]

# Créer le dossier de sortie s’il n’existe pas
os.makedirs(output_folder, exist_ok=True)

# Parcourir chaque fichier
for file in filenames:
    eeg_path = os.path.join(eeg_folder, file)
    nirs_path = os.path.join(nirs_folder, file)

    # Vérifie que les deux fichiers existent
    if not os.path.isfile(eeg_path) or not os.path.isfile(nirs_path):
        print(f"Fichiers manquants pour {file} : ignoré.")
        continue

    # Charger les fichiers
    df_nirs = pd.read_csv(nirs_path)

    # Charger EEG avec précaution
    df_eeg = pd.read_csv(eeg_path, low_memory=False)
    print(len(df_eeg))
    # Convertir toutes les colonnes en numériques si possible, sinon NaN
    df_eeg = df_eeg.apply(pd.to_numeric, errors='coerce')
    
    # Supprimer les colonnes totalement vides (non numériques)
    df_eeg = df_eeg.dropna(axis=1, how='all')
    
    # === 2. Downsample EEG de 512 Hz à 4 Hz (512 / 4 = 128) ===
    eeg_downsampled = df_eeg.groupby(np.arange(len(df_eeg)) // 128).mean()

    print(len(eeg_downsampled))
    # Troncature pour correspondre aux deux longueurs
    min_len = min(len(df_nirs), len(eeg_downsampled))
    df_nirs = df_nirs.iloc[:min_len].reset_index(drop=True)
    eeg_downsampled = eeg_downsampled.iloc[:min_len].reset_index(drop=True)

    print(len(eeg_downsampled))
    
    # Fusionner EEG + NIRS
    df_merged = pd.concat([df_nirs, eeg_downsampled], axis=1)

    # Enregistrer le fichier fusionné
    output_path = os.path.join(output_folder, f"fusion_{file}")
    df_merged.to_csv(output_path, index=False)

    print(f"{file} → Fusion terminée ({min_len} lignes)")

print("✅ Fusion de tous les fichiers terminée.")

605856
4734
4733
AO_2.csv → Fusion terminée (4733 lignes)
606303
4737
4736
AO_3.csv → Fusion terminée (4736 lignes)
595936
4656
4655
AO_4.csv → Fusion terminée (4655 lignes)
571744
4467
4466
AO_6.csv → Fusion terminée (4466 lignes)
Fichiers manquants pour AO_7.csv : ignoré.
595456
4652
4652
AO_8.csv → Fusion terminée (4652 lignes)
453951
3547
3546
AO_9.csv → Fusion terminée (3546 lignes)
625600
4888
4887
AO_10.csv → Fusion terminée (4887 lignes)
493024
3852
3851
AO_11.csv → Fusion terminée (3851 lignes)
615648
4810
4809
AO_12.csv → Fusion terminée (4809 lignes)
591839
4624
4623
AO_13.csv → Fusion terminée (4623 lignes)
573568
4481
4481
AO_14.csv → Fusion terminée (4481 lignes)
596192
4658
4657
AO_15.csv → Fusion terminée (4657 lignes)
594271
4643
4642
AO_16.csv → Fusion terminée (4642 lignes)
111904
875
874
AO_17.csv → Fusion terminée (874 lignes)
595039
4649
4648
AO_18.csv → Fusion terminée (4648 lignes)
265535
2075
2074
AO_19.csv → Fusion terminée (2074 lignes)
609792
4764
4764
AO_20