CSVMulti to CSVSolo

This code is specific to bi2014b in order to split the original csv containing data from 2 subject to 2 distinct file.

It has been specifically conceived for BCI data.



In [None]:
import numpy as np
import pandas as pd
import os

In [None]:
def extract_subject_data(csv_file_path, subject_number):
    """
    Extrait les données EEG pour un sujet spécifique
    """
    if subject_number not in [1, 2]:
        raise ValueError("Le numéro du sujet doit être 1 ou 2")


    df = pd.read_csv(csv_file_path, header=None)


    if subject_number == 1:
        electrode_cols = list(range(1, 33))
    else:
        electrode_cols = list(range(33, 65))


    selected_cols = [0] + electrode_cols + [66]
    extracted_data = df.iloc[:, selected_cols]


    # Modification du nommage des colonnes : champ vide pour timestamp, nombres de 1 à 32 pour les électrodes
    new_columns = [''] + [str(i) for i in range(1, 33)] + ['33']
    extracted_data.columns = new_columns


    return extracted_data

def process_all_subjects(folder_subject1, folder_subject2, output_folder):
    """
    Traite tous les fichiers des deux dossiers et sauvegarde les résultats


    Parameters:
    -----------
    folder_subject1 : str
        Chemin vers le dossier contenant les fichiers du sujet 1
    folder_subject2 : str
        Chemin vers le dossier contenant les fichiers du sujet 2
    output_folder : str
        Chemin vers le dossier où sauvegarder les fichiers de sortie
    """
    # Création du dossier de sortie s'il n'existe pas
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # Traitement des fichiers du sujet 1 (nombres impairs)
    files_subject1 = sorted([f for f in os.listdir(folder_subject1) if f.endswith('.csv')])
    for i, file in enumerate(files_subject1):
        subject_number = 2*i + 1  # Génère 1, 3, 5, 7, ...
        input_path = os.path.join(folder_subject1, file)
        output_filename = f'subject_{subject_number:02d}_session_01.csv'
        output_path = os.path.join(output_folder, output_filename)

        # Extraction et sauvegarde des données
        extracted_data = extract_subject_data(input_path, 1)
        extracted_data.to_csv(output_path, index=False)
        print(f"Fichier créé : {output_filename}")

    # Traitement des fichiers du sujet 2 (nombres pairs)
    files_subject2 = sorted([f for f in os.listdir(folder_subject2) if f.endswith('.csv')])
    for i, file in enumerate(files_subject2):
        subject_number = 2*(i + 1)  # Génère 2, 4, 6, 8, ...
        input_path = os.path.join(folder_subject2, file)
        output_filename = f'subject_{subject_number:02d}_session_01.csv'
        output_path = os.path.join(output_folder, output_filename)

        # Extraction et sauvegarde des données
        extracted_data = extract_subject_data(input_path, 2)
        extracted_data.to_csv(output_path, index=False)
        print(f"Fichier créé : {output_filename}")


In [None]:
# Forward your file with all .csv of the dataset
filepath1 = "C:/Users/doumif/work/Prog/bi2014b-group1"
filepath2 = "C:/Users/doumif/work/Prog/bi2014b-group2"
outputfile = "C:/Users/doumif/work/Prog/bi2014b"

process_all_subjects(
    folder_subject1= filepath1,
    folder_subject2= filepath2,
    output_folder= outputfile
)