In [1]:
import pandas as pd
import matplotlib.pyplot as plt
from main import PreProcessing, Statistics
import numpy as np
import json
from scipy.stats import mode, median_abs_deviation, iqr, trim_mean, entropy as ent, skew, kurtosis
from scipy.signal import welch, correlate, stft
from statsmodels.tsa.ar_model import AutoReg
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import TimeSeriesSplit
from scipy.fft import fft, fftfreq
import entropy as ent

In [2]:
file_path = "C:/Users/antho/Documents/MEMOIRE_M2/c3d_audeline/A_P_1956-02-21_ON_DM_1.c3d"
# file_path = "C:/Users/antho/Documents/MEMOIRE_M2/CODE_STAGE_M2/DATA_FOG/LE_LIEVRE_Emmanuel_1971_03_19_LEEM1971/2023-05-26/2023-05-26_overlay_detectFOG/Video overlay 15.c3d"
# Définir les informations du patient
# Instancier l'objet DetectFog
detector = PreProcessing(file_path)
detector.creation_json_grace_c3d()
detector.extract_data_interval()
detector.normalize_data() 
detector.decoupage_en_fenetres()
detector.label_fenetre()
detector.association_label_fenetre_data()
data = detector.concat_label_fenetre_data()



## Données Temporelles

In [3]:
# def enlever_derniere_ligne_et_colonne_label_frequence(data):
#     for sensor, sensor_data in data.items():
#         if sensor not in ["metadata", "parcours", "FOG"]:
#             for side, side_data in sensor_data.items():
#                 for measure, measure_data in side_data.items():
#                     for axis, axis_data in measure_data.items():
#                         if isinstance(axis_data, pd.DataFrame):
                        
#                             # Supprimer la dernière ligne du DataFrame
#                             data_moins_derniere_ligne_na = axis_data.drop(axis_data.index[-1])
#                             # print(data_moins_derniere_ligne_na)
#                             label = data_moins_derniere_ligne_na["label"]
                        
#                             # Vérifier si la colonne 'label' existe avant de la supprimer
#                             if 'label' in data_moins_derniere_ligne_na.columns:
#                                 data_moins_colonne_label = data_moins_derniere_ligne_na.drop(columns=["label"])
#                                 # Mise à jour du DataFrame dans le dictionnaire
#                                 measure_data[axis] = data_moins_colonne_label
                                                            
#     return data,label

# data,label = enlever_derniere_ligne_et_colonne_label_frequence(data)

## Accélération GYRO

In [4]:
# a = data["Foot"]["Left"]["GYRO"]["X"]
# premiere_colonne = a.iloc[:,0]
# diff = np.diff(a, prepend=premiere_colonne,axis =  1)

In [5]:
def acceleration_gyro (data, fs = 50):
    """
    Calculer l'accélération angulaire à partir des données de vitesse angulaire (gyroscope).

    :param data_gyro: DataFrame contenant les vitesses angulaires pour chaque axe (X, Y, Z).
    :param delta_t: Intervalle de temps entre les mesures en secondes.
    :return: DataFrame contenant l'accélération angulaire pour chaque axe.
    """
    pas_temps = 1/fs
    
    for sensor, sensor_data in data.items():
        if sensor not in ["metadata", "parcours", "FOG"]:
            for side, side_data in sensor_data.items():
                for measure, measure_data in side_data.items():
                    if measure == "GYRO":
                        for axis, axis_data in measure_data.items():
                            # calcul de l'accélération angulaire
                            data_acceleration = np.diff(axis_data,axis=1) / pas_temps
                            measure_data[axis] = data_acceleration

    return data

In [6]:
def extract_temporal_features(data):
    
    # Initialise un DataFrame vide pour stocker les caractéristiques
    df_features = pd.DataFrame()
    
    # Moyenne
    df_features['Mean_Temporal'] = np.mean(data, axis=1)
    
    # Écart type
    df_features['Ecart_Type_Temporal'] = np.std(data, axis=1)
    
    # Variance
    df_features['Variance_Temporal'] = np.var(data, axis=1)
    
    # Énergie
    df_features['Energy_Temporal'] = np.sum(np.square(data), axis=1)
    
    # Range
    df_features['Range'] = np.ptp(data, axis=1)
    
    # Root mean square
    df_features['RMS'] = np.sqrt(np.mean(np.square(data), axis=1))
    
    # Médiane
    df_features['Median_Temporal'] = np.median(data, axis=1)
    
    # Trimmed mean
    df_features['Trimmed_Mean'] = trim_mean(data, 0.1, axis=1)
    
    # Mean absolute value
    df_features['Mean_Absolute_Value'] = np.mean(np.abs(data), axis=1)
    
    # Median absolute deviation
    df_features['Median_Absolute_Deviation'] = median_abs_deviation(data, axis=1, nan_policy='omit')
    
    # Percentiles
    df_features['25th_percentile'] = np.percentile(data, 25, axis=1)
    
    df_features['75th_percentile'] = np.percentile(data, 75, axis=1)
    
    # Interquantile range
    df_features['Interquartile_range'] = iqr(data, axis=1, rng=(25,75), nan_policy="omit")
    
    # Skewness
    df_features['Skewness_Temporal'] = skew(data, axis=1)
    
    # Kurtosis
    df_features['Kurtosis_Temporal'] = kurtosis(data, axis=1)
    
    # Incréments moyennes
    mean = np.mean(data, axis=1)
    df_features['Increments_Mean'] = np.diff(mean, prepend=mean[0])
    
    
    
    # # Coefficients d'autorégression
    # fenetres = [np.array(window) for window in data.values]
    # max_order = 9
    # best_orders = {}
    # best_mse = np.inf 
    # tscv = TimeSeriesSplit(n_splits=4)

    # for i, fenetre in enumerate(fenetres):
    #     best_order = None
    #     best_mse = np.inf
    
    #     for p in range(1, max_order + 1):
    #         mse_scores = []
        
    #         for train_index, test_index in tscv.split(fenetre):
    #             train_data, test_data = fenetre[train_index], fenetre[test_index]
            
    #             model = AutoReg(train_data, lags=p)
    #             result = model.fit()
    #             predictions = result.predict(start=len(train_data), end=len(train_data) + len(test_data) - 1)
    #             mse = mean_squared_error(test_data, predictions)
    #             mse_scores.append(mse)
        
    #         avg_mse = np.mean(mse_scores)

    #         if avg_mse < best_mse:
    #             best_mse = avg_mse
    #             best_order = p
    
    #     best_orders[i] = best_order

    # coefficients_autoreg = []

    # for i, fenetre in enumerate(fenetres):
    #     modele_ar = AutoReg(fenetre, lags=best_orders[i])
    #     resultat = modele_ar.fit()
    #     coefficients = resultat.params[best_orders[i]]
    #     coefficients_autoreg.append(coefficients) 
    # df_features['Ar_Coefficients'] = coefficients_autoreg 

    # Coefficient de variation
    df_features['Coefficient_Variation'] = np.std(data, axis=1) / np.mean(data, axis=1)
    
    # Normalized signal magnitude area
    # features['normalized_signal_magnitude_area'] = np.sum(np.abs(np.diff(data, axis=1)), axis=1) / data.shape[1]
    
    # Mean crossing rate
    # features['mean_crossing_rate'] = np.mean(np.diff(data > np.mean(data, axis=1, keepdims=True), axis=1), axis=1)
    
    # Signal vector magnitude
    # features['signal_vector_magnitude'] = np.sqrt(np.sum(np.square(data), axis=1))
    
    # # Incréments
    # # Calculer les différences entre les éléments consécutifs de chaque ligne
    # diffs = np.diff(data, axis=1)
    # # Insérer une colonne de zéros au début de chaque ligne
    # features['increments'] = np.hstack((np.zeros((data.shape[0], 1)), diffs))
    # df_features['increments'] = features['increments']
    
    # Entropie
    # features['entropy'] = entropy(data, axis=1)
    
    # Pic de la transformée de Fourier (FFT)
    # f, Pxx = welch(data, axis=1)
    # features['fft_peak'] = f[np.argmax(Pxx, axis=1)]
    # df_features['fft_peak'] = features['fft_peak']

    return df_features


# On transforme les données en fréquentiel

In [25]:
def transformation_domaine_frequentiel (data, fs = 50):
    # Nombre de points de données par fenêtre
    n = data.shape[1]  # ou 100 si c'est connu

    # Créer un tableau de fréquences
    frequences = fftfreq(n, d=1/fs)
    frequences = frequences[:n//2] # obligé de laisser la data en série, pour générer le graphique des spectres de magnitudes
    frequencies = fftfreq(n, d=1/fs)
    frequencies = frequencies[:n//2]

    # Transposer le tableau de fréquences pour le mettre en colonnes
    frequencies = frequencies.reshape((1, -1))



    # calculer la transformée de Fourier
    fft_result = fft(data, axis = 1)
    fft_magnitudes = np.abs(fft_result)[:,:n//2] # Garder uniquement les valeurs positives, puisque d'après la symétrie de la FFT, les valeurs négatives sont les mêmes que les valeurs positives



    # chemin_fichier_excel_mag = "C:/Users/antho/Documents/MEMOIRE_M2/magnitude_frequence.csv"
    # chemin_fichier_excel_freq = "C:/Users/antho/Documents/MEMOIRE_M2/frequence.csv"

    # # Créer un DataFrame pour stocker les magnitudes des fréquences
    fft_magnitudes = pd.DataFrame(fft_magnitudes)
    frequencies = pd.DataFrame(frequencies)



    # # # Exporter le DataFrame en tant que fichier CSV
    # fft_magnitudes.to_csv(chemin_fichier_excel_mag, index=False)
    # frequencies.to_csv(chemin_fichier_excel_freq, index=False)
    return fft_magnitudes, frequencies
fft_magnitudes, frequencies = transformation_domaine_frequentiel(data["Foot"]["Left"]["GYRO"]["X"])

In [8]:
# Parcourir le dictionnaire pour trouver et modifier les DataFrames
def enlever_derniere_ligne_et_colonne_label(data):
    for sensor, sensor_data in data.items():
        if sensor not in ["metadata", "parcours", "FOG"]:
            for side, side_data in sensor_data.items():
                for measure, measure_data in side_data.items():
                    for axis, axis_data in measure_data.items():
                        if isinstance(axis_data, pd.DataFrame):
                        
                            # Supprimer la dernière ligne du DataFrame
                            data_moins_derniere_ligne_na = axis_data.drop(axis_data.index[-1])
                            # print(data_moins_derniere_ligne_na)
                            label = data_moins_derniere_ligne_na["label"]
                        
                            # Vérifier si la colonne 'label' existe avant de la supprimer
                            if 'label' in data_moins_derniere_ligne_na.columns:
                                data_moins_colonne_label = data_moins_derniere_ligne_na.drop(columns=["label"])
                                # Mise à jour du DataFrame dans le dictionnaire
                                measure_data[axis] = data_moins_colonne_label
    return data, label

data, label = enlever_derniere_ligne_et_colonne_label(data)
                            
                            # Afficher le DataFrame après la modification
                        # print(data_moins_colonne_label)


# transofmraiton du tableau clean

In [9]:
# # Parcourir le dictionnaire pour trouver et modifier les DataFrames
# def enlever_derniere_ligne_et_colonne_label_et_transformation_fft(data):
#     for sensor, sensor_data in data.items():
#         if sensor not in ["metadata", "parcours", "FOG"]:
#             for side, side_data in sensor_data.items():
#                 for measure, measure_data in side_data.items():
#                     for axis, axis_data in measure_data.items():
#                         if isinstance(axis_data, pd.DataFrame):
                        
#                             # Supprimer la dernière ligne du DataFrame
#                             data_moins_derniere_ligne_na = axis_data.drop(axis_data.index[-1])
#                             # print(data_moins_derniere_ligne_na)
#                             label = data_moins_derniere_ligne_na["label"]
                        
#                             # Vérifier si la colonne 'label' existe avant de la supprimer
#                             if 'label' in data_moins_derniere_ligne_na.columns:
#                                 data_moins_colonne_label = data_moins_derniere_ligne_na.drop(columns=["label"])
#                                 # Mise à jour du DataFrame dans le dictionnaire
#                                 measure_data[axis] = data_moins_colonne_label
                                
#                                 # Calculer la transformée de Fourier
#                             fft_magnitudes, frequencies = transformation_domaine_frequentiel(data_moins_colonne_label)
#     return data, label,fft_magnitudes, frequencies

# data, label, fft_magnitudes, frequencies = enlever_derniere_ligne_et_colonne_label_et_transformation_fft(data)
                            
#                             # Afficher le DataFrame après la modification
#                         # print(data_moins_colonne_label)


# J'ai un tableau tout propre

In [10]:
def calcul_entropie_spectrale (fft_magnitudes):
    # Calculer l'entropie spectrale de puissance pour chaque fenêtre
    entropie_spectrale = []

    for index, row in fft_magnitudes.iterrows():
        # Calculer les proportions pi de la puissance spectrale
        puissance_totale = np.sum(row**2)
        p_i = (row**2) / puissance_totale
    
        # Filtrer les valeurs de p_i égales à 0 pour éviter les erreurs de log(0)
        p_i = p_i[p_i > 0]

        # Calculer l'entropie spectrale pour la fenêtre actuelle
        H = -np.sum(p_i * np.log(p_i))
        entropie_spectrale.append(H)

    # Convertir la liste d'entropie en un tableau numpy pour une manipulation facile
    df_entropie_spectrale = pd.DataFrame({'Entropie_Spectrale': entropie_spectrale})
    return df_entropie_spectrale

# entropie_spectrale = calcul_entropie_spectrale(fft_magnitudes)

In [11]:
def calcul_details_harmoniques (fft_magnitudes, frequencies):

    # Initialiser les listes pour stocker les résultats
    premiere_harmonique_mag = []
    deuxieme_harmonique_mag = []
    premiere_harmonique_freq = []
    deuxieme_harmonique_freq = []
    distance_harmonique_frequence = []  # Liste pour stocker la distance entre les harmoniques
    distance_harmonique_magnitude = []
    centre_densite_spectrale = []
    centre_densite_spectrale_puissance = []
    rapport_harmonique_frequence = []
    rapport_harmonique_magnitude = []
    crete_spectrale_puissance_ponderee_gpt = []
    crete_spectrale_puissance_ponderee_borzi = []
    largeurs_harmoniques = []


    # Itérer sur chaque fenêtre
    for index, row in fft_magnitudes.iterrows():
        magnitudes = row.values
        frequences = frequencies.values.flatten() # Assumer que les fréquences sont constantes et identiques pour toutes les fenêtres
    
        # Trouver les indices des deux plus grandes magnitudes
        indices_harmoniques = np.argsort(magnitudes)[-2:]  # Cela nous donne les indices du second puis du premier
    
        # Assurer que l'indice de la première harmonique est celui de la plus grande magnitude
        if magnitudes[indices_harmoniques[0]] > magnitudes[indices_harmoniques[1]]:
            premiere_harmonique, deuxieme_harmonique = indices_harmoniques[0], indices_harmoniques[1]
        else:
            premiere_harmonique, deuxieme_harmonique = indices_harmoniques[1], indices_harmoniques[0]
    
        # Calculer le centre de densité spectrale (CDS)
        cds = np.sum(frequences * magnitudes) / np.sum(magnitudes)
    
        # Calculer le centre de densité spectrale de puissance
        cds_puissance = np.sum(frequences * magnitudes**2) / np.sum(magnitudes**2)
    
        # Calcul de la crête spectrale de puissance pondérée selon GPT
        cs_puissance_ponderee_gpt = np.max(magnitudes**2) / np.sum(magnitudes**2)
    
        # Calcul de la crête spectrale de puissance pondérée selon Borzi
        cs_puissance_ponderee_borzi = ((magnitudes[premiere_harmonique]**2) * frequences[premiere_harmonique])
    
        # Stocker les résultats
        premiere_harmonique_mag.append(magnitudes[premiere_harmonique])
        deuxieme_harmonique_mag.append(magnitudes[deuxieme_harmonique])
        premiere_harmonique_freq.append(frequences[premiere_harmonique])
        deuxieme_harmonique_freq.append(frequences[deuxieme_harmonique])
        centre_densite_spectrale.append(cds)
        centre_densite_spectrale_puissance.append(cds_puissance)
        crete_spectrale_puissance_ponderee_gpt.append(cs_puissance_ponderee_gpt)
        crete_spectrale_puissance_ponderee_borzi.append(cs_puissance_ponderee_borzi)
    
        # Calculer et stocker la distance de fréquence entre les harmoniques
        distance_harmonique_frequence.append(abs(frequences[premiere_harmonique] - frequences[deuxieme_harmonique]))
    
    
        # Pour éviter Inf, vérifier si le dénominateur est zéro
        if frequences[deuxieme_harmonique] == 0:
            rapport_harmonique_frequence.append(0)
        else:
            rapport_harmonique_frequence.append(frequences[premiere_harmonique] / frequences[deuxieme_harmonique])
    
    
        # Calculer et stocker la distance de magnitude entre les harmoniques
        distance_harmonique_magnitude.append(abs(magnitudes[premiere_harmonique] - magnitudes[deuxieme_harmonique]))
    
        # De même, éviter Inf pour les magnitudes
        if magnitudes[deuxieme_harmonique] == 0:
            rapport_harmonique_magnitude.append(0)
        else:
            rapport_harmonique_magnitude.append(magnitudes[premiere_harmonique] / magnitudes[deuxieme_harmonique])
        
        
           
        # Calculer la largeur des harmoniques
            # Calculer la magnitude de la première harmonique
        premiere_harmonique_magnitude = magnitudes[premiere_harmonique]
    
        # Utiliser la bonne méthode pour trouver les indices gauche et droite
        # Trouver l'indice de gauche
        gauche = np.where(magnitudes[:premiere_harmonique] < premiere_harmonique_magnitude * 0.5)[0]
        if len(gauche) > 0:
            indice_gauche = gauche[-1] + 1  # Prendre le dernier indice sous le seuil et ajouter 1
        else:
            indice_gauche = 0  # S'il n'y a pas de valeur sous le seuil, prendre le début du signal
    
        # Trouver l'indice de droite
        droite = np.where(magnitudes[premiere_harmonique+1:] < premiere_harmonique_magnitude * 0.5)[0]
        if len(droite) > 0:
            indice_droite = droite[0] + premiere_harmonique + 1  # Prendre le premier indice sous le seuil après le pic
        else:
            indice_droite = len(magnitudes) - 1  # S'il n'y a pas de valeur sous le seuil, prendre la fin du signal
    
        # Calculer la largeur en Hz
        largeur_hz = frequences[indice_droite] - frequences[indice_gauche]
        largeurs_harmoniques.append(largeur_hz)

    # Créer un DataFrame pour les résultats
    df_resultats = pd.DataFrame({
        'Premiere_Harmonique_Magnitude': premiere_harmonique_mag,
        'Deuxieme_Harmonique_Magnitude': deuxieme_harmonique_mag,
        'Premiere_Harmonique_Frequence': premiere_harmonique_freq,
        'Deuxieme_Harmonique_Frequence': deuxieme_harmonique_freq,
        'Distance_Harmonique_Frequence': distance_harmonique_frequence,
        'Distance_Harmonique_Amplitude':  distance_harmonique_magnitude,
        'Rapport_Harmonique_Frequence': rapport_harmonique_frequence,
        'Rapport_Harmonique_Amplitude':  rapport_harmonique_magnitude,
        'Centre_Densite_Spectrale': centre_densite_spectrale,
        'Centre_Densite_Spectrale_Puissance': centre_densite_spectrale_puissance,
        'Crete_Spectrale_Puissance_Ponderee_GPT': crete_spectrale_puissance_ponderee_gpt,
        'Crete_Spectrale_Puissance_Ponderee_Borzi': crete_spectrale_puissance_ponderee_borzi,
        'Largeur_Harmonique': largeurs_harmoniques
        })
    
    return df_resultats
    # return premiere_harmonique_mag,deuxieme_harmonique_mag,premiere_harmonique_freq,deuxieme_harmonique_freq, distance_harmonique_frequence,distance_harmonique_magnitude,rapport_harmonique_frequence,rapport_harmonique_magnitude, centre_densite_spectrale,centre_densite_spectrale_puissance, crete_spectrale_puissance_ponderee_gpt, crete_spectrale_puissance_ponderee_borzi, largeurs_harmoniques

# # Afficher les premières lignes du DataFrame résultant pour vérification
# print(df_resultats.head())
# df_resultats = calcul_details_harmoniques(fft_magnitudes, frequencies)


In [12]:
def ecart_type_borne (fft_magnitudes, frequencies):
    # Définissons les bandes de fréquences spécifiées
    bandes_frequence = {
        'ecart_type': (0, 50),
        'ecart_type_0.04_0.68_Hz': (0.04, 0.68),
        'ecart_type_0.68_3_Hz': (0.68, 3),
        'ecart_type_3_8_Hz': (3, 8),
        'ecart_type_8_20_Hz': (8, 20),
        'ecart_type_0.1_8_Hz': (0.1, 8)
    }

    # Extrayons les fréquences depuis le fichier frequence.csv pour l'associer à chaque colonne de magnitude_frequence.csv
    frequences = frequencies.values.flatten()

    # Créons un DataFrame pour stocker les écarts types calculés pour chaque bande de fréquence et pour chaque ligne (fenêtre)
    ecarts_types = pd.DataFrame()

    # Pour chaque bande de fréquence, filtrons les données et calculons l'écart type
    for nom_bande, (freq_min, freq_max) in bandes_frequence.items():
    
        # Identifions les colonnes correspondant à la bande de fréquence
        colonnes_bande = (frequences >= freq_min) & (frequences <= freq_max)
    
        # Filtrons les magnitudes pour cette bande de fréquence
        magnitudes_bande = fft_magnitudes.loc[:, colonnes_bande]
    
        # Calculons l'écart type pour cette bande de fréquence et ajoutons les résultats au DataFrame
        ecarts_types[nom_bande] = magnitudes_bande.std(axis=1)
        
    return ecarts_types

# # # Affichons les premières lignes des résultats pour vérifier
# ecarts_type = ecart_type_borne(fft_magnitudes, frequencies)

In [13]:
def calculer_freeze_index(fft_magnitudes, frequencies):
    """
    Calcule le Freeze Index pour chaque fenêtre de données.
    
    :param magnitudes: Un DataFrame ou un numpy array des magnitudes du spectre de puissance pour chaque fenêtre.
    :param frequences: Un numpy array des fréquences correspondant aux colonnes de magnitudes.
    :return: Un numpy array contenant le Freeze Index pour chaque fenêtre.
    """
    magnitudes = fft_magnitudes.values  # Convertissons le DataFrame en numpy array si ce n'est pas déjà le cas
    frequences = frequencies.values.flatten()
    
    # Définissons une fonction interne pour calculer l'aire sous le spectre de puissance
    def calculer_aire_sous_spectre(frequences, magnitudes, freq_min, freq_max):
        indices_bande = (frequences >= freq_min) & (frequences <= freq_max)
        magnitudes_bande = magnitudes[:, indices_bande]
        aire_sous_spectre = np.trapz(magnitudes_bande, x=frequences[indices_bande], axis=1)
        return aire_sous_spectre

    # Bandes de fréquences pour le Freeze Index
    bande_freeze = (3, 8)  # Bande "freeze"
    bande_locomotrice = (0.5, 3)  # Bande "locomotrice"

    # Calcul de l'aire sous le spectre pour chaque bande
    aire_freeze = calculer_aire_sous_spectre(frequences, magnitudes, *bande_freeze)
    aire_locomotrice = calculer_aire_sous_spectre(frequences, magnitudes, *bande_locomotrice)

    # Calcul du Freeze Index
    freeze_index = (aire_freeze ** 2) / (aire_locomotrice ** 2)
    freeze_index_df = pd.DataFrame({'Freeze_Index': freeze_index})

    return freeze_index_df

# Exemple d'utilisation de la fonction `calculer_freeze_index`
# Assurez-vous que `magnitude_frequence_df` et `frequences` sont définis et chargés correctement
# magnitudes = fft_magnitudes.values  # Convertissons le DataFrame en numpy array si ce n'est pas déjà le cas
# frequences = frequencies.values.flatten()

# # Calculons le Freeze Index
# freeze_index_resultats = calculer_freeze_index(fft_magnitudes, frequencies)

# # Créons un DataFrame pour afficher les Freeze Index calculés
# freeze_index_df = pd.DataFrame({'Freeze Index': freeze_index_resultats})

# # Affichage des premiers résultats
# print(freeze_index_df.head())

In [14]:
## Fréquence de faible Puissance pour une bande fréquence entre 0 et 2 Hz
def ratio_faible_puissance_entre_0_2Hz (fft_magnitudes,frequencies):
    # Assurez-vous que `magnitude_frequence_df` et `frequences` sont définis et chargés correctement
    magnitudes = fft_magnitudes.values  # Convertissons le DataFrame en numpy array si ce n'est pas déjà le cas
    frequences = frequencies.values.flatten()

    ratios = []  # Pour stocker le ratio de chaque fenêtre
    psd = np.abs(magnitudes)**2  # Calcul de la densité spectrale de puissance
    puissance_totale = np.sum(psd, axis=1)  # Calcul de la puissance totale du signal pour chaque fenêtre
    
    # Filtrer pour obtenir la puissance dans la bande 0-2 Hz
    bande_indices = (frequences >= 0) & (frequences <= 2)
    psd_band= psd[:, bande_indices]
    puissance_bande = np.sum(psd_band, axis = 1)
        
    ratios = puissance_bande / puissance_totale
    ratios_df = pd.DataFrame({'Ratio_Faible_Puissance_0_2Hz': ratios})
    return ratios_df

# ratio_faible_puissance_entre = ratio_faible_puissance_entre_0_2Hz(fft_magnitudes, frequencies)

In [35]:
def skewness_band_freq (fft_magnitudes,frequencies):
    magnitudes = fft_magnitudes.values  # Convertissons le DataFrame en numpy array si ce n'est pas déjà le cas
    frequences = frequencies.values.flatten()


    # Définissons les bandes de fréquences spécifiées
    bandes_frequence = {
        'Skewness': (0, 50),
        'Skewness_0.04_0.68_Hz': (0.04, 0.68),
        'Skewness_0.68_3_Hz': (0.68, 3),
        'Skewness_3_8_Hz': (3, 8),
        'Skewness_8_20_Hz': (8, 20),
        'Skewness_0.1_8_Hz': (0.1, 8)
    }

    # Créons un DataFrame pour stocker les écarts types calculés pour chaque bande de fréquence et pour chaque ligne (fenêtre)
    skwenesss = pd.DataFrame()

    # Pour chaque bande de fréquence, filtrons les données et calculons l'écart type
    for nom_bande, (freq_min, freq_max) in bandes_frequence.items():
    
        # Identifions les colonnes correspondant à la bande de fréquence
        colonnes_bande = (frequences >= freq_min) & (frequences <= freq_max)
    
        # Filtrons les magnitudes pour cette bande de fréquence
        magnitudes_bande = fft_magnitudes.loc[:, colonnes_bande]
    
        # Calculons l'écart type pour cette bande de fréquence et ajoutons les résultats au DataFrame
        skwenesss[nom_bande] = magnitudes_bande.skew(axis=1)

    # Affichons les premières lignes des résultats pour vérifier
    # skwenesss.head()
    return skwenesss

# skewnesss = skewness_band_freq(fft_magnitudes, frequencies)
# print(skewnesss)


In [40]:
def kurtosis_band_freq (fft_magnitudes, frequencies) :
    magnitudes = fft_magnitudes.values  # Convertissons le DataFrame en numpy array si ce n'est pas déjà le cas
    frequences = frequencies.values.flatten()
    # Définissons les bandes de fréquences spécifiées
    bandes_frequence = {
        'Kurtosis': (0, 50),
        'Kurtosis_0.04_0.68_Hz': (0.04, 0.68),
        'Kurtosis_0.68_3_Hz': (0.68, 3),
        'Kurtosis_3_8_Hz': (3, 8),
        'Kurtosis_8_20_Hz': (8, 20),
        'Kurtosis_0.1_8_Hz': (0.1, 8)
    }

    # Créons un DataFrame pour stocker les écarts types calculés pour chaque bande de fréquence et pour chaque ligne (fenêtre)
    kurtosiss = pd.DataFrame()

    # Pour chaque bande de fréquence, filtrons les données et calculons l'écart type
    for nom_bande, (freq_min, freq_max) in bandes_frequence.items():
    
        # Identifions les colonnes correspondant à la bande de fréquence
        colonnes_bande = (frequences >= freq_min) & (frequences <= freq_max)
    
        # Filtrons les magnitudes pour cette bande de fréquence
        magnitudes_bande = fft_magnitudes.loc[:, colonnes_bande]
    
        # Calculons l'écart type pour cette bande de fréquence et ajoutons les résultats au DataFrame
        kurtosiss[nom_bande] = magnitudes_bande.kurtosis(axis=1)

    # Affichons les premières lignes des résultats pour vérifier
    kurtosiss.head()
    
    return kurtosiss

# kurtosisss = kurtosis_band_freq(fft_magnitudes,frequencies)



In [17]:
def calcul_locomotion_band_power (fft_magnitudes,frequencies):
# Locomotion band power
    magnitudes = fft_magnitudes.values  # Convertissons le DataFrame en numpy array si ce n'est pas déjà le cas
    frequences = frequencies.values.flatten()
    # Filtrer pour obtenir la puissance dans la bande de locomotion (0.5-3 Hz)
    bande_locomotion_power_list = []
    psd = np.abs(magnitudes)**2 
    bande_locomotion = (frequences >= 0.5) & (frequences <= 3)
    psd_bande_locomotion = psd[:, bande_locomotion]
    puissance_bande_locomotion = np.sum(psd_bande_locomotion, axis=1)

    for window in puissance_bande_locomotion:
        bande_locomotion_power = window / 50
        bande_locomotion_power_list.append(bande_locomotion_power)
    
    df_bande_locomotion_power = pd.DataFrame({'Locomotion_Band_Power': bande_locomotion_power_list})
    return df_bande_locomotion_power

# df_bande_locomotion_power = calcul_locomotion_band_power (fft_magnitudes,frequencies)


In [18]:
def calcul_freeze_band_power (fft_magnitudes,frequencies):
    magnitudes = fft_magnitudes.values  # Convertissons le DataFrame en numpy array si ce n'est pas déjà le cas
    frequences = frequencies.values.flatten()
    # Filtrer pour obtenir la puissance dans la bande de locomotion (3-8 Hz)
    bande_freeze_power_list = []
    psd = np.abs(magnitudes)**2 


    bande_freeze = (frequences >= 3) & (frequences <= 8)
    psd_bande_freeze = psd[:, bande_freeze]
    puissance_bande_freeze = np.sum(psd_bande_freeze, axis=1)

    for window in puissance_bande_freeze:
        bande_freeze_power = window / 50
        bande_freeze_power_list.append(bande_freeze_power)
    
    df_bande_freeze_power = pd.DataFrame({'Freeze_Band_Power': bande_freeze_power_list})
    return df_bande_freeze_power

# df_bande_freeze_power = calcul_freeze_band_power (fft_magnitudes,frequencies)

In [19]:
def calcul_band_power(fft_magnitudes,frequencies):
# Locomotion band power
    magnitudes = fft_magnitudes.values  # Convertissons le DataFrame en numpy array si ce n'est pas déjà le cas
    frequences = frequencies.values.flatten()
    bande_power_list = []
    psd = np.abs(magnitudes)**2 

    # Filtrer pour obtenir la puissance dans la bande de locomotion et de freezing (0.5-8 Hz)
    bande_power = (frequences >= 0.5) & (frequences <= 8)
    psd_bande_power = psd[:, bande_power]
    puissance_bande_power= np.sum(psd_bande_power, axis=1)

    for window in puissance_bande_power:
        bande_power = window / 50
        bande_power_list.append(bande_power)
        
    df_bande_power = pd.DataFrame({'Band_Power': bande_power_list})
    return df_bande_power

# df_bande_power = calcul_band_power(fft_magnitudes,frequencies)

In [30]:
def calcul_energie (fft_magnitudes, frequencies):
    magnitudes = fft_magnitudes.values  # Convertissons le DataFrame en numpy array si ce n'est pas déjà le cas
    
    # Calcul de l'énergie pour chaque signal (chaque ligne)
    energy = np.sum(np.abs(magnitudes)**2 / len(magnitudes), axis=1)
    
    # Créer un DataFrame pour stocker les résultats
    df_energie = pd.DataFrame({'Energie_Frequentielle': energy})
        
    return df_energie

df_energie = calcul_energie(fft_magnitudes, frequencies)

[[1.72566467e-01 9.46192111e-02 1.07801133e-01 ... 2.72972956e-02
  2.74153162e-02 2.75214529e-02]
 [8.95439816e-02 1.37756693e-01 2.56330650e-01 ... 1.29205351e-02
  6.95074148e-03 3.53161617e-03]
 [2.32534969e-02 2.02083559e-01 2.79244124e-01 ... 9.71912585e-03
  4.30092330e-03 1.58857905e-03]
 ...
 [3.94110445e-01 3.78997418e-01 3.66308776e+00 ... 2.31804154e-01
  1.99940405e-01 2.06730770e-01]
 [5.85250917e-01 3.79651419e-01 3.64725374e+00 ... 3.61726803e-02
  3.20103006e-02 1.71799826e-02]
 [2.03156645e+00 1.15160239e+00 4.81574169e+00 ... 4.65950890e-02
  7.35252990e-02 5.73201830e-02]]
             
           0         1         2         3         4         5         6   \
0    0.172566  0.094619  0.107801  0.113411  0.116325  0.098645  0.097024   
1    0.089544  0.137757  0.256331  0.330293  0.364966  0.345725  0.306609   
2    0.023253  0.202084  0.279244  0.281971  0.338149  0.370547  0.333817   
3    0.118937  0.233605  0.284691  0.316140  0.292930  0.424411  0.275582   
4

# Extraction finale de toutes les caractéristiques

# CODE FINAL

In [21]:
def dataframe_caracteristiques_final(data):
    data_collect = []

    for sensor, sensor_data in data.items():
        if sensor not in ["metadata", "parcours", "FOG"]:
            for side, side_data in sensor_data.items():
                for measure, measure_data in side_data.items():
                    for axis, axis_data in measure_data.items():
                        if isinstance(axis_data, pd.DataFrame):
                            # Application des fonctions pour calculer les caractéristiques temporelles
                            df_temporal = extract_temporal_features(axis_data)
                            
                            # Application des fonctions pour calculer les caractéristiques fréquentielles
                            fft_magnitude, frequencies = transformation_domaine_frequentiel(axis_data, fs=50)
                            entropie_spectrale = calcul_entropie_spectrale(fft_magnitude)
                            details_harmoniques = calcul_details_harmoniques(fft_magnitude, frequencies)
                            ecart_types = ecart_type_borne(fft_magnitude, frequencies)
                            freeze_index = calculer_freeze_index(fft_magnitude, frequencies)
                            ratio_faible_puissance = ratio_faible_puissance_entre_0_2Hz(fft_magnitude, frequencies)
                            skewness = skewness_band_freq(fft_magnitude, frequencies)
                            kurtosis = kurtosis_band_freq(fft_magnitude, frequencies)
                            locomotion_band_power = calcul_locomotion_band_power(fft_magnitude, frequencies)
                            freeze_band_power = calcul_freeze_band_power(fft_magnitude, frequencies)
                            band_power = calcul_band_power(fft_magnitude, frequencies)
                            energie = calcul_energie(fft_magnitude, frequencies)
                            

                            # Fusionner toutes les caractéristiques dans un seul DataFrame pour simplification
                            caract_features = pd.concat([df_temporal,   
                                                         entropie_spectrale,
                                                         details_harmoniques, 
                                                         ecart_types,
                                                         freeze_index,
                                                         ratio_faible_puissance,
                                                         skewness,
                                                         kurtosis,
                                                         locomotion_band_power,
                                                         freeze_band_power,
                                                         band_power,
                                                         energie], axis=1)

                            # Renommer les colonnes ici
                            caract_features.rename(columns={feature_name: f"{sensor}_{side}_{measure}_{axis}_{feature_name}" for feature_name in caract_features.columns}, inplace=True)
                            
                            data_collect.append(caract_features)

    # Concaténer toutes les données collectées en alignant les colonnes
    df_final = pd.concat(data_collect, axis=1)
    return df_final

# Supposons que `data` est déjà défini et structuré correctement
df_final = dataframe_caracteristiques_final(data)


In [22]:
chemin_fichier_csv_data_final = "C:/Users/antho/Documents/MEMOIRE_M2/data_final.csv"




    # # # Exporter le DataFrame en tant que fichier CSV
df_final.to_csv(chemin_fichier_csv_data_final, index=False)

In [23]:
label_dataframe = pd.DataFrame(label)

In [24]:
data_concat = pd.concat([df_final,label_dataframe],axis = 1)
combined_df = data_concat[['label'] + [col for col in data_concat.columns if col != 'label']]
