<!DOCTYPE html>
<html lang="fr">
<head>
    <meta charset="UTF-8">
    <title>Analyse de Trajectoires de Tracking</title>
    <style>
        body {
            font-family: Arial, sans-serif;
        }
        h1 {
            color: skyblue;
            font-size: 24px;
        }
        p, li {
            font-size: 16px;
        }
        .green-text{
            color: DarkSeaGreen;
        }
    </style>
</head>
<body>
    <h1>Analyse de Trajectoires de Tracking</h1>
    <p>Ce code d'analyse permet de traiter les données issues du tracking pour extraire et étudier statistiquement les trajectoires pertinentes. Le processus est structuré comme suit :</p>
    <ol>
        <li><strong class="green-text">Récupération des trajectoires :</strong> Collecte de toutes les trajectoires issues des différentes manipulations.</li>
        <li><strong class="green-text">Pré-analyse :</strong> Examen initial des trajectoires pour déterminer celles à conserver pour l'analyse approfondie.</li>
        <li><strong class="green-text">Analyse statistique :</strong> Application de méthodes statistiques aux trajectoires conservées. Les données peuvent être séparées en deux populations pour un traitement spécifique si nécessaire.</li>
    </ol>
    <p>L'analyse se concentre sur les paramètres suivants :</p>
    <ul>
        <li>Angle entre les directions successives d'une particule entre chaque intervalle de temps.</li>
        <li>Vitesses moyennes et instantanées des particules.</li>
        <li>Variation de la vitesse en fonction du temps d'incubation.</li>
        <li>Effet potentiel de la densité de cellules sur la motilité.</li>
    </ul>
</body>
</html>


##
<center><span style="color: seagreen; font-size: 50px; font-style: bold">Chargement et préparation des données.</span></center>
<span style="color: skyblue; font-size: 20px; font-style: bold">Chargement des librairies.</span>

In [None]:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Wed Mar  1 12:46:56 2023.

@author: souchaud
"""

import os
import time
import math
import pandas as pd
import numpy as np
import imageio.v2 as imageio
import matplotlib.pyplot as plt
import matplotlib.gridspec as gridspec
from matplotlib import colormaps
from cycler import cycler
import trackpy as tp
import functions_analyze as lib
import warnings
import importlib
from colorama import init
from typing import List, Optional, Union, Any, Dict, Tuple
from scipy.stats import linregress
from scipy.optimize import curve_fit
import seaborn as sns


# Reload custom library
importlib.reload(lib)

# Initialize colorama
init(autoreset=True)

# Suppress specific warnings
with warnings.catch_warnings():
    warnings.simplefilter("ignore", category=FutureWarning)

# Set default matplotlib style
plt.style.use('default')

<span style="color: skyblue; font-size: 20px; font-style: bold">Paramètres de graphs.</span>

In [None]:
plt.rcParams.update({
    # Figure
    "figure.figsize": (7, 5),  # Taille classique pour une figure d'article
    "figure.dpi": 300,
    "figure.facecolor": "white",
    "figure.edgecolor": "white",
    "figure.titlesize": 14,
    "figure.titleweight": "bold",

    # Axes
    "axes.facecolor": "white",
    "axes.edgecolor": "black",
    "axes.linewidth": 1,
    "axes.titlesize": 12,
    "axes.titleweight": "bold",
    "axes.labelsize": 11,
    "axes.labelweight": "normal",
    "axes.labelcolor": "black",
    "axes.prop_cycle": cycler(color=[
        "#1f77b4", "#ff7f0e", "#2ca02c", "#d62728", "#9467bd", "#8c564b"
    ]),
    "axes.grid": False,

    # Ticks
    "xtick.color": "black",
    "ytick.color": "black",
    "xtick.labelsize": 10,
    "ytick.labelsize": 10,
    "xtick.direction": "out",
    "ytick.direction": "out",
    "xtick.major.size": 5,
    "ytick.major.size": 5,
    "xtick.major.width": 1,
    "ytick.major.width": 1,

    # Lignes
    "lines.linewidth": 1.5,
    "lines.markersize": 6,

    # Police
    "font.size": 11,
    "font.family": "sans-serif",
    "font.sans-serif": ["Arial", "Helvetica", "DejaVu Sans"],
    "text.color": "black",

    # Légendes
    "legend.loc": "best",
    "legend.fontsize": 10,
    "legend.frameon": False,

    # Sauvegarde
    "savefig.dpi": 600,
    "savefig.format": "png",
    "savefig.facecolor": "white",
    "savefig.edgecolor": "white",
    "savefig.transparent": False,

    # Images
    "image.cmap": "viridis",
})

##
<span style="color: skyblue; font-size: 20px; font-style: bold">Initialisation des variables et constantes de travail..</span>

In [None]:
# Set initial time
INITIAL_TIME = time.time()

# Experiment parameters
TIME_FRAME = 15
SIZE_PIX = 0.637
FPS = 1 / TIME_FRAME

# File to study
file_name = 'filtered_final'
N_FRAME_MIN_STUDY = 200

# Study parameters
ROLLING_MEAN = False
PIXELISATION = False
TIME_FRAME_STUDY = False
DRIFT = False

# Plot parameters
IMG_TYPE = 'png'
ALPHA = 0.5
LINEWIDTH = 0.1
COLOR_SUP = 'blue'
COLOR_INF = 'red'
color_sup_inf = (COLOR_SUP, COLOR_INF)

##
<span style="color: skyblue; font-size: 20px; font-style: bold">Définition des path et dossiers de travails / enregistrements.</span>

<span style="color: skyblue; font-size: 20px; font-style: bold">Conditions des manips étudiées.</span>

<span style="color: skyblue; font-size: 20px; font-style: bold">Défintions et créations des différents dossiers d'enregistrements.</span>

In [None]:
# General paths
GENERAL_PATH = '/Users/souchaud/Desktop/Analyses/'
GENERAL_PATH_PICTURES = '/Users/souchaud/Desktop/A_analyser/'

# Condition
CONDITION_simple = 'CytoOne_HL5_AMPC_100pourcent_10x'
CONDITION = f'{CONDITION_simple}_results_tracking'

# Get list of experiments
PATHWAY_EXPERIMENT = [f for f in os.listdir(GENERAL_PATH + CONDITION)
                      if os.path.isdir(os.path.join(GENERAL_PATH + CONDITION, f))]

# Update experiment paths
PATHWAY_EXPERIMENT = [os.path.join(GENERAL_PATH, CONDITION, elem, 'mosaic')
                      for elem in PATHWAY_EXPERIMENT]

# Path to save pictures
path_save_pic = os.path.join(GENERAL_PATH, f'résultats_{CONDITION}_All')

# Create directory if it doesn't exist
os.makedirs(path_save_pic, exist_ok=True)
os.chdir(path_save_pic)


<span style="color: skyblue; font-size: 20px; font-style: bold">Ajout des temps d'incubation.</span>

In [None]:
# Add incubation times to DATA
conditions_to_values = {
    'ASMOT263': 21.33, 'ASMOT264': 24.33, 'ASMOT265': 43.33, 'ASMOT266': 45.33, 'ASMOT267': 48.33, 'ASMOT268': 1.33, 'ASMOT_bis_268': 2.67,
    'ASMOT269': 4.67, 'ASMOT270': 49, 'ASMOT271': 52.50, 'ASMOT272': 73, 'ASMOT273': 76.50,
    
}

experiment_to_dell= {
}


##
<center><span style="color: Crimson; font-size: 30px; font-style: bold">Lecture des données expériementales.</span></center>

<span style="color: skyblue; font-size: 20px">On décide de travailler que sur un certain nombre de frame. Ici je décide de travailler sur les 340 première frames pour normaliser les expériences. 
Donc la cellules doit être suivi sur N_MIN_STUDY sur les 340 premières frames. </span>

<span style="color: skyblue; font-size: 20px">Application de fonctions pour moyenne flissante et pixelisation et étude d'une frame sur x </span>

In [None]:
# Read HDF5 data
importlib.reload(lib)
DATA = lib.read_hdf5_all(
    pathway_experiment=PATHWAY_EXPERIMENT,
    name_file=file_name,
    nbr_frame_min=N_FRAME_MIN_STUDY,
    condition=CONDITION,
    drift=DRIFT,
    search_range=20,
    memory=5
)
# Vérifier si le dictionnaire `experiment_to_dell` n'est pas vide
if experiment_to_dell:
    print(f"Suppression des expériences : {experiment_to_dell}")
    
    # Supprimer les expériences spécifiées
    DATA = DATA[~DATA['experiment'].isin(experiment_to_dell)]
    DATA.reset_index(drop=True, inplace=True)
    print(f"Nombre d'expériences restantes après suppression des expériences ratées: {DATA['experiment'].nunique()}")
else:
    print("Aucune expérience à supprimer, `experiment_to_dell` est vide.")

# Sort DATA by 'frame'
DATA.sort_values(by='frame', inplace=True)

# Filter DATA
print("Nombre de particules avant tri: ", DATA['particle'].nunique())
DATA = DATA[DATA['frame'] < 340]

# Keep particles with sufficient frames
DATA = DATA.groupby('particle').filter(lambda x: len(x) >= N_FRAME_MIN_STUDY)
print("Nombre de particules après tri: ", DATA['particle'].nunique())

# Apply optional data transformations
if ROLLING_MEAN:
    DATA = lib.rolling_mean(datas=DATA, roll=3)
if PIXELISATION:
    DATA = lib.pixelisation(datas=DATA, size_pix=SIZE_PIX)
if TIME_FRAME_STUDY:
    DATA, TIME_FRAME = lib.keep_nth_image(traj=DATA, n=N_FRAME_MIN_STUDY, time_frame=TIME_FRAME)

# Calculate instant velocities
DATA['time (min)'] = DATA['frame'] * TIME_FRAME / 60
DATA = lib.vit_instant_new(traj=DATA, lag_time=TIME_FRAME, pix_size=SIZE_PIX, triage=1)

DATA['time to incubation (hours)'] = DATA['experiment'].map(conditions_to_values).fillna(0.0)

###
<center><span style="color: skyblue; font-size: 20px"> Mean Mass and size plot </span></center>

In [None]:
# Plot Mean Mass and Size per Manipulation
def plot_mean_mass_size(DATA, path_save_pic, IMG_TYPE):
    manips = DATA['experiment'].unique()
    num_manips = len(manips)
    fig = plt.figure(figsize=(16, 6 * num_manips))
    gs = gridspec.GridSpec(num_manips, 3, fig)
    colors = ['skyblue', 'lightgreen', 'salmon']
    for i, manip in enumerate(manips):
        data_manip = DATA[DATA['experiment'] == manip]
        mass_means = data_manip.groupby('particle')['mass'].mean()
        size_means = data_manip.groupby('particle')['size'].mean()
        filtered_data = data_manip[data_manip['frame'] == 0]

        ax1 = fig.add_subplot(gs[i, 0])
        ax1.hist(mass_means, bins=100, color=colors[0], density=True)
        ax1.set_title(f"Mean mass of particles for {manip}")
        ax1.set_xlabel("Mean mass")
        ax1.set_ylabel("Density")

        ax2 = fig.add_subplot(gs[i, 1])
        ax2.hist(size_means, bins=100, color=colors[1], density=True)
        ax2.set_title(f"Mean size of particles for {manip}")
        ax2.set_xlabel("Mean size")
        ax2.set_ylabel("Density")

        ax3 = fig.add_subplot(gs[i, 2])
        ax3.scatter(filtered_data['size'], filtered_data['mass'], c="#d62728", edgecolors="#d62728", alpha=0.7)
        ax3.set_title(f"Mass vs. Size at frame 0 for {manip}")
        ax3.set_xlabel("Size")
        ax3.set_ylabel("Mass")
        ax3.grid(True, linestyle="--", alpha=0.5)

    plt.tight_layout()
    plt.show()
    fig.savefig(os.path.join(path_save_pic, f"Mean_Mass_Size_manip.{IMG_TYPE}"), format=IMG_TYPE)

plot_mean_mass_size(DATA, path_save_pic, IMG_TYPE='svg')


###
<center><span style="color: skyblue; font-size: 20px"> plot total path for each partciel in each experiment (histograms) </span></center>

In [None]:
# Calculate total path for the first N frames
path_data = lib.calculate_total_path_first_frames(DATA, first_n_frames=100)

# Plot Total Path in First 100 Frames per Experiment
def plot_total_path(path_data):
    grouped = path_data.groupby('experiment')
    n_experiments = len(grouped)
    fig, axes = plt.subplots(nrows=n_experiments, figsize=(10, 4 * n_experiments))
    axes = axes if n_experiments > 1 else [axes]
    for (experiment, group), ax in zip(grouped, axes):
        ax.hist(group['total_path_first_n'], bins=50, range=[0, 100], density=True, alpha=0.5)
        ax.set_title(f"Total path in first 100 frames for {experiment}")
        ax.set_xlabel('Length path (μm)')
        ax.set_ylabel('Density')
    plt.tight_layout()
    plt.savefig(os.path.join(path_save_pic, f"Total path in first 100 frames.{IMG_TYPE}"), format=IMG_TYPE)
    plt.show()

plot_total_path(path_data)

###
<center><span style="color: skyblue; font-size: 20px"> Creation des traj centrées / distance cumulée / IMSD </span></center>


In [None]:
# Center trajectories
DATA.reset_index(inplace=True)
DATA = lib.center(traj=DATA)

print(f"\n\nTemps de préparation des données pour {CONDITION}: {time.time() - INITIAL_TIME} sec\n\n")

# Calculate total and cumulative displacement
DATA, start_end = lib.length_displacement(traj=DATA, size_pix=SIZE_PIX)

# Compute MSD and cutoff
DATA2 = DATA.copy()
DATA2['frame'] = pd.factorize(DATA2['frame'])[0]
IMSD = tp.imsd(traj=DATA2, mpp=SIZE_PIX, fps=FPS, max_lagtime=200, statistic='msd')

###
<center><span style="color: skyblue; font-size: 20px"> Premier fit pour exclure certaines traj </span></center>

In [None]:
# Trajectory clustering with fit and defining a cutoff
LAG_TIME_FIT = 5
importlib.reload(lib)
COEF_INF, COEF_SUP, PART_COEF_INF, PART_COEF_SUP, CUTOFF = lib.traj_clustering_with_fit_cutoff(
    DATA2, imsd=IMSD, hist=True, lag_time_fit=LAG_TIME_FIT, micronperpixel=SIZE_PIX,
    fps=FPS, binsize=250, peak_height=50, peak_width=1, save=True, pathway_fig=path_save_pic,
    name='all_experiment_autocorr', img_type=IMG_TYPE, plot=True, color_sup_inf=color_sup_inf,
    cutoff_default=0
)

# Keep only particles above cutoff
DATA = DATA[DATA['particle'].isin(PART_COEF_SUP)]

In [None]:
DATA

###
<center><span style="color: skyblue; font-size: 20px"> Nombre de particules par frame pour les expériences. </span></center>

ça n'a pas un grand interêt ici, mais c'est par principe pour vérification et compréhension d'éventuels phenomènes.

In [None]:
# Plot Number of Particles per Frame for All Experiments in One Graph
def plot_nbr_particles_per_frame_combined(DATA, path_save_pic, IMG_TYPE):
    """
    Plot the number of unique particles per frame for all experiments on a single graph with different colors.

    Parameters:
    - DATA (DataFrame): The input data containing tracking information.
    - path_save_pic (str): The path where the plot will be saved.
    - IMG_TYPE (str): The format for saving the plot (e.g., 'png', 'jpg').
    """
    experiments = DATA['experiment'].unique()

    # Generate a colormap with enough unique colors for all experiments
    colormap = plt.colormaps['tab20']  # Use the modern colormap API
    colors = [colormap(i / len(experiments)) for i in range(len(experiments))]

    plt.figure(figsize=(12, 13))
    for i, exp in enumerate(experiments):
        # Group data by time and calculate the number of unique particles per frame
        nbr_part_per_frame = DATA[DATA['experiment'] == exp].groupby('time (min)')['particle'].nunique()
        plt.plot(
            nbr_part_per_frame.index, nbr_part_per_frame.values, 
            label=exp, color=colors[i], alpha=1, linewidth=0.8
        )

    # Add labels, legend, and title
    plt.title('Number of Particles per Frame for All Experiments', fontsize=14)
    plt.xlabel('Time (min)', fontsize=12)
    plt.ylabel('Number of Particles', fontsize=12)
    plt.legend(title="Experiments", bbox_to_anchor=(1.05, 1), loc='upper left', fontsize=10)
    plt.grid(True, linestyle='--', alpha=0.6)
    plt.tight_layout()

    # Save and show the plot
    fig_path = os.path.join(path_save_pic, f"Nbr_particle_per_Frame_combined.{IMG_TYPE}")
    plt.savefig(fig_path, format=IMG_TYPE, bbox_inches='tight')
    plt.show()

    print(f"Plot saved to {fig_path}")

# Appel de la fonction
plot_nbr_particles_per_frame_combined(DATA, path_save_pic, IMG_TYPE)

In [None]:
# # Plot Number of Particles per Frame per Experiment
# def plot_nbr_particles_per_frame(DATA, path_save_pic, IMG_TYPE):
#     experiments = DATA['experiment'].unique()
#     n_cols = 2
#     n_rows = (len(experiments) + n_cols - 1) // n_cols
#     fig, axs = plt.subplots(n_rows, n_cols, figsize=(20 * n_cols, 10 * n_rows))
#     axs = axs.flatten()
#     for i, exp in enumerate(experiments):
#         nbr_part_per_frame = DATA[DATA['experiment'] == exp].groupby('time (min)')['particle'].nunique()
#         ax = axs[i]
#         ax.plot(nbr_part_per_frame.index, nbr_part_per_frame.values)
#         ax.set_ylim([0, nbr_part_per_frame.max() + 10])
#         ax.set_title(f'Nbr particle per Frame - {exp}')
#         ax.set_xlabel('Time (min)')
#         ax.set_ylabel('Number of particles')
#     for ax in axs[len(experiments):]:
#         ax.axis('off')
#     plt.tight_layout()
#     plt.savefig(os.path.join(path_save_pic, f"Nbr_particle_per_Frame_manip_par_manip.{IMG_TYPE}"), format=IMG_TYPE)
#     plt.show()

# plot_nbr_particles_per_frame(DATA, path_save_pic, IMG_TYPE)

###
<center><span style="color: skyblue; font-size: 20px"> Nombre de particules par frame pour toutes les paticules. </span></center>


In [None]:
# Plot Number of Particles per Frame
nbr_part_per_frame = DATA.groupby('time (min)')['particle'].nunique()
lib.plot_datas(
    x_values=nbr_part_per_frame.index,
    y_values=nbr_part_per_frame.values,
    title='Nbr particles per Frame',
    x_label='Time (min)', y_label='Number of particles',
    x_lim=[0, nbr_part_per_frame.index.max()], y_lim=[0, 10000],
    save=True, path_save_pic=path_save_pic, img_type=IMG_TYPE
)

###
<center><span style="color: skyblue; font-size: 40px">Trajectoires toutes rassemblées. </span></center>


In [None]:
# Plot Trajectories after Removing Suspicious Particles
fig, axis = plt.subplots(figsize=(12, 12), dpi=300)
axis.set_aspect('equal', 'box')
plt.title('Trajectories after removing suspicious particles', fontsize=16)
tp.plot_traj(DATA, label=False, ax=axis)
for line in axis.get_lines():
    line.set_linewidth(0.1)
plt.show()
fig.savefig(os.path.join(path_save_pic, f'Trajectories_after_removing_suspicious_particles.{IMG_TYPE}'),
            format=IMG_TYPE, dpi=300, bbox_inches='tight')

In [None]:
# Plot centered Trajectories after Removing Suspicious Particles
fig, axis = plt.subplots(figsize=(12, 12), dpi=300)
axis.set_aspect('equal', 'box')
plt.title('Centered trajectories after removing suspicious particles', fontsize=16)
tp.plot_traj(DATA[['Xc [pix]', 'Yc [pix]', 'frame', 'particle']].rename(columns={'Xc [pix]': 'x', 'Yc [pix]': 'y'}), label=False, ax=axis)
for line in axis.get_lines():
    line.set_linewidth(0.2)
plt.show()
fig.savefig(os.path.join(path_save_pic, f'Centered trajectories_after_removing_suspicious_particles.{IMG_TYPE}'),
            format=IMG_TYPE, dpi=300, bbox_inches='tight')

In [None]:
# Plot Trajectories on Original Frames
def plot_trajectories_on_frames(DATA, path_save_pic, GENERAL_PATH_PICTURES, CONDITION_simple):
    image_path = os.path.join(GENERAL_PATH_PICTURES, f"{CONDITION_simple}_faits")
    plot_exp = DATA.groupby('experiment')
    num_experiments = len(plot_exp)
    num_cols = 2
    num_rows = (num_experiments + num_cols - 1) // num_cols
    fig, axes = plt.subplots(num_rows, num_cols, figsize=(20, num_rows * 10))
    axes = axes.flatten()
    for ax, (exp_name, exp_data) in zip(axes, plot_exp):
        exp_directories = []
        for dirpath, dirnames, _ in os.walk(image_path):
            for dirname in dirnames:
                if exp_name in dirname:
                    full_path = os.path.join(dirpath, dirname)
                    exp_directories.append(full_path)
        if exp_directories:
            image_path_directory = os.path.join(exp_directories[0], 'mosaic', 'mosaic_total_0.tif')
            frame = imageio.imread(image_path_directory)
            ax.set_aspect('equal', 'box')
            ax.set_title(f'Trajectories for {exp_name}')
            tp.plot_traj(exp_data, superimpose=frame, label=False, ax=ax)
        else:
            print(f"No directory found for {exp_name}")
            ax.axis('off')
    plt.tight_layout()
    plt.show()
    fig.savefig(os.path.join(path_save_pic, 'trajectories_on_frame_all_experiment.pdf'), format='pdf')

plot_trajectories_on_frames(DATA, path_save_pic, GENERAL_PATH_PICTURES, CONDITION_simple)

###
<center><span style="color: skyblue; font-size: 20px"> Vitesse instantanée moyenne par frame. </span></center>


In [None]:
# Plot Mean Instantaneous Speed per Frame
mean_VitInst_per_frame = DATA.groupby('time (min)')['VitInst [um/min]'].median()
mean_VitInst_per_frame = mean_VitInst_per_frame.rolling(5).mean().dropna()

# Appel avec vérification du répertoire
lib.plot_datas(
    x_values=mean_VitInst_per_frame.index,
    y_values=mean_VitInst_per_frame.values,
    title='Mean VitInst [um/min] per Frame',
    x_label='Time (min)', y_label='Mean VitInst [um/min]',
    x_lim=[0, mean_VitInst_per_frame.index.max()], y_lim=[0, 10],
    save=True, path_save_pic=path_save_pic, img_type=IMG_TYPE
)

In [None]:
# Recompute MSD
# DATA_intermediaire = DATA.copy()
DATA['frame'] = pd.factorize(DATA['frame'])[0]
IMSD = tp.imsd(traj=DATA, mpp=SIZE_PIX, fps=FPS, max_lagtime=200, statistic='msd')

lib.plot_msd(IMSD, fps=FPS, name="MSD of all frames vs lag time (s)",
             color_plot='forestgreen', save=True, pathway_saving=path_save_pic,
             alpha=0.3, linewidth=0.1, img_type=IMG_TYPE)

In [None]:
# Reload custom library
importlib.reload(lib)

In [None]:
# Recompute trajectory clustering with new cutoff
LAG_TIME_FIT = 5
COEF_INF, COEF_SUP, PART_COEF_INF, PART_COEF_SUP, CUTOFF = lib.traj_clustering_with_fit_cutoff(
    DATA, imsd=IMSD, hist=True, lag_time_fit=LAG_TIME_FIT, micronperpixel=SIZE_PIX,
    fps=FPS, binsize=250, peak_height=50, peak_width=1, save=True, pathway_fig=path_save_pic,
    name='MSD and slopes', img_type=IMG_TYPE, plot=True, color_sup_inf=color_sup_inf,
    cutoff_default=1.0
)

# Ajouter les colonnes 'is_inf' et 'is_sup' à DATA
DATA['particle'] = DATA['particle'].astype(int)
PART_COEF_INF = set(map(int, PART_COEF_INF))
PART_COEF_SUP = set(map(int, PART_COEF_SUP))

# Ajout des colonnes 'is_inf' et 'is_sup'
DATA['is_inf'] = DATA['particle'].isin(PART_COEF_INF).astype(int)
DATA['is_sup'] = DATA['particle'].isin(PART_COEF_SUP).astype(int)


###
<center><span style="color: skyblue; font-size: 40px">Calculs des différents metrics importants </span></center>


In [None]:
def calculate_metrics(DATA):
    # Calculer les vitesses moyennes instantanées pour toutes les particules
    mean_vitinst_df = DATA.groupby(['experiment', 'particle'])['VitInst [um/min]'].mean().reset_index()
    mean_vitinst_df = mean_vitinst_df.rename(columns={'VitInst [um/min]': 'mean_vit_inst'})

    # Calculer les médianes des vitesses instantanées pour toutes les particules
    median_vitinst_df = DATA.groupby(['experiment', 'particle'])['VitInst [um/min]'].median().reset_index()
    median_vitinst_df = median_vitinst_df.rename(columns={'VitInst [um/min]': 'median_vit_inst'})

    # Initialisation d'une liste pour stocker les résultats
    metrics = []

    # Parcours de chaque particule pour calculer les métriques
    for particle, group in DATA.groupby('particle'):
        experiment = group['experiment'].iloc[0]

        # Limiter aux 200 premières lignes
        limited_group = group.head(200)

        # Somme des déplacements (seulement sur les 200 premières lignes)
        displacement_sum = limited_group['displacement [pix]'].sum()

        # Récupérer la vitesse moyenne instantanée pré-calculée
        mean_vit_inst = mean_vitinst_df.loc[
            (mean_vitinst_df['experiment'] == experiment) & (mean_vitinst_df['particle'] == particle),
            'mean_vit_inst'
        ].values[0]

        # Récupérer la médiane des vitesses instantanées pré-calculée
        median_vit_inst = median_vitinst_df.loc[
            (median_vitinst_df['experiment'] == experiment) & (median_vitinst_df['particle'] == particle),
            'median_vit_inst'
        ].values[0]

        # Distance entre la position de départ et d'arrivée
        start_position = limited_group.iloc[0][['x', 'y']].values
        end_position = limited_group.iloc[-1][['x', 'y']].values
        start_end_distance = np.linalg.norm(end_position - start_position)

        # Stocker les résultats dans un dictionnaire
        metrics.append({
            'experiment': experiment,
            'particle': particle,
            'displacement_sum [um]': displacement_sum,
            'mean_vit_inst [um/min]': mean_vit_inst,
            'median_vit_inst [um/min]': median_vit_inst,
            'start_end_distance [um]': start_end_distance
        })

    # Conversion en DataFrame
    metrics_df = pd.DataFrame(metrics)
    return metrics_df

# Appel de la fonction pour obtenir le DataFrame consolidé
metrics_df = calculate_metrics(DATA)

# Affichage pour vérification
metrics_df.head(10)

In [None]:
def calculate_all_metrics(DATA):
    """
    Calcule diverses métriques pour chaque expérience, y compris la vitesse moyenne
    des particules sup et inf.
    """
    # Calculer le temps d'incubation et le nombre de particules (exp_hours)
    exp_hours = (
        DATA.groupby('experiment')
        .agg({
            'time to incubation (hours)': 'first',
            'particle': 'nunique'
        })
        .reset_index()
        .rename(columns={'particle': 'number_of_particles'})
    )

    # Compter les particules is_inf et is_sup
    particle_counts = (
        DATA.groupby(['experiment', 'particle'])
        .agg(
            is_inf=('is_inf', 'max'),
            is_sup=('is_sup', 'max')
        )
        .reset_index()
        .groupby('experiment')
        .agg(
            number_of_inf=('is_inf', 'sum'),
            number_of_sup=('is_sup', 'sum')
        )
        .reset_index()
    )
    particle_counts['proportion_inf'] = particle_counts['number_of_inf'] / (
        particle_counts['number_of_inf'] + particle_counts['number_of_sup']
    )

    # Calculer les métriques issues de metrics_df
    metrics_df = DATA.groupby(['experiment', 'particle']).apply(
        lambda group: {
            'displacement_sum [um]': group.head(200)['displacement [pix]'].sum(),
            'start_end_distance [um]': np.linalg.norm(
                group.head(200).iloc[0][['x', 'y']].values -
                group.head(200).iloc[-1][['x', 'y']].values
            ),
            'mean_vit_inst [um/min]': group['VitInst [um/min]'].median()
        }
    ).apply(pd.Series).reset_index()

    # Ajouter la vitesse mediane pour les particules sup et inf
    sup_inf_speeds = DATA.groupby(['experiment', 'particle']).agg(
        is_sup=('is_sup', 'max'),
        is_inf=('is_inf', 'max'),
        mean_vit_inst=('VitInst [um/min]', 'median')
    ).reset_index()

    # Calculer la vitesse mediane des particules sup et inf par expérience
    sup_inf_speeds_agg = sup_inf_speeds.groupby('experiment').agg(
        mean_speed_sup=('mean_vit_inst', lambda x: x[sup_inf_speeds['is_sup'] == 1].median() if (sup_inf_speeds['is_sup'] == 1).any() else 0),
        mean_speed_inf=('mean_vit_inst', lambda x: x[sup_inf_speeds['is_inf'] == 1].median() if (sup_inf_speeds['is_inf'] == 1).any() else 0)
    ).reset_index()

    # Calculer taille et particules par champ
    spatial_metrics = DATA.groupby('experiment').apply(lambda group: {
        'taille': math.ceil(group['y'].max() / 2048) * math.ceil(group['x'].max() / 2048),
        'nombre_part_par_champs': group['particle'].nunique() /
        (math.ceil(group['y'].max() / 2048) * math.ceil(group['x'].max() / 2048)) if (
            math.ceil(group['y'].max() / 2048) * math.ceil(group['x'].max() / 2048)) > 0 else 0
    }).apply(pd.Series).reset_index()

    # Calculer d'autres métriques
    result_metrics = metrics_df.groupby('experiment').agg(
        displacement_sum_mean=('displacement_sum [um]', 'median'),
        start_end_distance_mean=('start_end_distance [um]', 'median'),
        mean_speed=('mean_vit_inst [um/min]', 'median')
    ).reset_index()

    # Fusionner toutes les métriques
    consolidated_metrics = (
        exp_hours
        .merge(particle_counts, on='experiment', how='outer')
        .merge(result_metrics, on='experiment', how='outer')
        .merge(sup_inf_speeds_agg, on='experiment', how='outer')
        .merge(spatial_metrics, on='experiment', how='outer')
    )

    # Renommer les colonnes après la fusion
    consolidated_metrics = consolidated_metrics.rename(columns={
        'displacement_sum_mean': 'displacement_sum_mean [um]',
        'start_end_distance_mean': 'start_end_distance_mean [um]',
        'mean_speed': 'mean_speed [um/min]',
        'mean_speed_sup': 'mean_speed_sup [um/min]',
        'mean_speed_inf': 'mean_speed_inf [um/min]'
    })

    return consolidated_metrics

# Appel de la fonction
all_metrics_df = calculate_all_metrics(DATA)

# Affichage pour vérification
all_metrics_df.head(10)

In [None]:
print(DATA[DATA['is_inf']==True]['particle'].nunique())
print(DATA['particle'].nunique())

In [None]:
# Plot Displacement
importlib.reload(lib)
lib.plot_displacement(
    DATA,
    start_end=metrics_df[['particle', 'start_end_distance [um]']],
    alpha=0.1,
    linewidth=0.3,
    ylim=[0, 750],
    xlim=[0, DATA['time (min)'].max()],
    save=True,
    pathway_saving=path_save_pic,
    name='displacement start-end all',
    img_type=IMG_TYPE
)

In [None]:
# Plot Histograms of Start-End Distances
def plot_histograms(start_end, PART_COEF_SUP, PART_COEF_INF, IMG_TYPE):
    fig, axes = plt.subplots(3, 1, figsize=(5, 10), sharex=True, sharey=True)
    axes[0].hist(metrics_df['start_end_distance [um]'], bins=250, color='royalblue', alpha=0.7, density=True)
    axes[0].set_xlim([0, 400])
    axes[0].set_ylim([0, 0.03])
    axes[0].set_title('Start-End Distances - All Particles', fontsize=16)
    axes[0].set_ylabel('Density', fontsize=14)
    axes[0].grid(True, linestyle='--', alpha=0.6)

    axes[1].hist(metrics_df[metrics_df['particle'].isin(PART_COEF_SUP)][['start_end_distance [um]']], bins=250, color='blue', alpha=0.7, density=True)
    axes[1].set_xlim([0, 400])
    axes[1].set_title('Start-End Distances - High Coefficient Particles', fontsize=16)
    axes[1].set_ylabel('Density', fontsize=14)
    axes[1].grid(True, linestyle='--', alpha=0.6)

    axes[2].hist(metrics_df[metrics_df['particle'].isin(PART_COEF_INF)][['start_end_distance [um]']], bins=250, color='red', alpha=0.7, density=True)
    axes[2].set_xlim([0, 400])
    axes[2].set_title('Start-End Distances - Low Coefficient Particles', fontsize=16)
    axes[2].set_xlabel('Distance (μm)', fontsize=14)
    axes[2].set_ylabel('Density', fontsize=14)
    axes[2].grid(True, linestyle='--', alpha=0.6)

    plt.tight_layout()
    plt.savefig(os.path.join(path_save_pic, f"Nstart_end inf supp and all.{IMG_TYPE}"), format=IMG_TYPE)
    plt.show()

plot_histograms(start_end, PART_COEF_SUP, PART_COEF_INF, IMG_TYPE=IMG_TYPE)

In [None]:
# Plot Results in Function of Number of Particles per Field
def plot_results_vs_particles(all_metrics_df, path_save_pic, CONDITION_simple, img_type='svg'):
    fig, axes = plt.subplots(1, 2, figsize=(20, 6))
    ax1, ax2 = axes.flatten()
    ax1.scatter(all_metrics_df['nombre_part_par_champs'], all_metrics_df['displacement_sum_mean [um]'], marker='+', color='orange')
    ax1.set_title('Average distance traveled vs. Number of particles per field')
    ax1.set_xlabel('Number of particles per field')
    ax1.set_ylabel('Average distance traveled')
    ax2.scatter(all_metrics_df['nombre_part_par_champs'], all_metrics_df['mean_speed [um/min]'], marker='+', color='blue')
    ax2.set_title('Mean Speed vs. Number of particles per field')
    ax2.set_xlabel('Number of particles per field')
    ax2.set_ylabel('Mean Speed [μm/min]')
    plt.tight_layout()
    plt.show()
    fig.savefig(os.path.join(path_save_pic, f"Results_vs_particles_{CONDITION_simple}.{img_type}"), format=img_type)

plot_results_vs_particles(all_metrics_df, path_save_pic, CONDITION_simple, img_type=IMG_TYPE)

In [None]:
# Compute Angle Changes between Directions
def compute_angle_changes(DATA, PART_COEF_SUP, PART_COEF_INF):
    def angle_between_directions(row):
        dx1, dy1 = row['dir_x'], row['dir_y']
        dx2, dy2 = row['dir_x_next'], row['dir_y_next']
        angle_initial = np.arctan2(dy1, dx1)
        angle_final = np.arctan2(dy2, dx2)
        angle_change = angle_final - angle_initial
        angle_change = (angle_change + np.pi) % (2 * np.pi) - np.pi
        return np.degrees(angle_change)

    df_sup = DATA[DATA['particle'].isin(PART_COEF_SUP)].copy()
    df_sup.sort_values(by=['particle', 'frame'], inplace=True)
    df_sup['dir_x'] = df_sup.groupby('particle')['x'].diff().fillna(0)
    df_sup['dir_y'] = df_sup.groupby('particle')['y'].diff().fillna(0)
    df_sup['dir_x_next'] = df_sup.groupby('particle')['dir_x'].shift(-1)
    df_sup['dir_y_next'] = df_sup.groupby('particle')['dir_y'].shift(-1)
    df_sup['angle_change'] = df_sup.apply(angle_between_directions, axis=1)
    df_sup.dropna(subset=['dir_x_next', 'dir_y_next'], inplace=True)

    df_inf = DATA[DATA['particle'].isin(PART_COEF_INF)].copy()
    df_inf.sort_values(by=['particle', 'frame'], inplace=True)
    df_inf['dir_x'] = df_inf.groupby('particle')['x'].diff().fillna(0)
    df_inf['dir_y'] = df_inf.groupby('particle')['y'].diff().fillna(0)
    df_inf['dir_x_next'] = df_inf.groupby('particle')['dir_x'].shift(-1)
    df_inf['dir_y_next'] = df_inf.groupby('particle')['dir_y'].shift(-1)
    df_inf['angle_change'] = df_inf.apply(angle_between_directions, axis=1)
    df_inf.dropna(subset=['dir_x_next', 'dir_y_next'], inplace=True)

    return df_sup, df_inf

df_sup, df_inf = compute_angle_changes(DATA, PART_COEF_SUP, PART_COEF_INF)

In [None]:
# Plot histograms of angle changes
def plot_angle_histograms(df_all, df_sup, df_inf, img_type='svg'):
    fig, axes = plt.subplots(3, 1, figsize=(5, 10), sharex=True)
    axes[0].hist(df_all['angle_change'], bins=1000, alpha=0.5, color='green')
    axes[0].set_title('Angle Changes - All Particles')
    axes[0].set_xlabel('Angle (degrees)')
    axes[0].set_ylabel('Density')

    axes[1].hist(df_sup['angle_change'], bins=1000, color='blue', alpha=0.5)
    axes[1].set_title('Angle Changes - High Coefficient Particles')
    axes[1].set_xlabel('Angle (degrees)')
    axes[1].set_ylabel('Density')

    axes[2].hist(df_inf['angle_change'], bins=1000, color='red', alpha=0.5)
    axes[2].set_title('Angle Changes - Low Coefficient Particles')
    axes[2].set_xlabel('Angle (degrees)')
    axes[2].set_ylabel('Density')

    plt.tight_layout()
    plt.show()
    
    fig.savefig(os.path.join(path_save_pic, f'Angle_Changes_Histograms.{img_type}'), format=img_type)

df_all = pd.concat([df_sup, df_inf])
plot_angle_histograms(df_all, df_sup, df_inf, img_type=IMG_TYPE)

In [None]:
def plot_mean_vit_histograms_comparison(metrics_df, part_coef_sup, part_coef_inf, alpha=0.5, path_save_pic=None, img_type='png'):
    """
    Trace sur le même graphique les histogrammes des mean_vit_inst [um/min]
    pour les particules avec coefficients supérieurs et inférieurs.

    Parameters:
    - metrics_df (DataFrame): DataFrame contenant les données, avec une colonne 'mean_vit_inst [um/min]'.
    - part_coef_sup (list): Liste des particules avec coefficients supérieurs.
    - part_coef_inf (list): Liste des particules avec coefficients inférieurs.
    - path_save_pic (str, optional): Chemin pour sauvegarder l'image. Si None, l'image ne sera pas sauvegardée.
    - img_type (str, optional): Format de l'image pour la sauvegarde (par défaut 'png').

    Returns:
    None
    """
    # Vérification de la présence de la colonne nécessaire
    if 'mean_vit_inst [um/min]' not in metrics_df.columns:
        raise ValueError("La colonne 'mean_vit_inst [um/min]' est absente de metrics_df.")
    
    # Filtrer les données
    df_sup = metrics_df[metrics_df['particle'].isin(part_coef_sup)]
    df_inf = metrics_df[metrics_df['particle'].isin(part_coef_inf)]
    
    median_value_sup = df_sup['median_vit_inst [um/min]'].median()
    median_value_inf = df_inf['median_vit_inst [um/min]'].median()

    # Préparer le graphique
    plt.figure(figsize=(10, 10))
    plt.hist(df_sup['median_vit_inst [um/min]'], bins=100, color='blue', alpha=alpha, label="hight slope", density=True)
    plt.hist(df_inf['median_vit_inst [um/min]'], bins=100, color='red', alpha=alpha, label="low slope", density=True)

     # Ajouter une barre verticale à la médiane
    plt.axvline(median_value_inf, color='red', linestyle='--', linewidth=2, label=f'Median: {median_value_inf:.2f} μm/min')
    plt.axvline(median_value_sup, color='blue', linestyle='--', linewidth=2, label=f'Median: {median_value_sup:.2f} μm/min')


    # Ajouter des titres et des légendes
    plt.title("Median speed [μm/min]", fontsize=14)
    plt.xlabel("Median Instantaneous Velocity [μm/min]", fontsize=12)
    plt.ylabel("Density", fontsize=12)
    plt.grid(True, linestyle='--', alpha=0.6)
    plt.legend(fontsize=12)
    
    # Sauvegarde de l'image si un chemin est spécifié
    if path_save_pic:
        save_path = os.path.join(path_save_pic, f'Median_Velocity_Histograms_Comparison.{img_type}')
        plt.savefig(save_path, format=img_type)
        print(f"Plot sauvegardé à : {save_path}")
    
    # Afficher le graphique
    plt.tight_layout()
    plt.show()

In [None]:
plot_mean_vit_histograms_comparison(metrics_df, PART_COEF_SUP, PART_COEF_INF, path_save_pic=path_save_pic, img_type=IMG_TYPE, alpha=0.7)

In [None]:
# Préparer le graphique
plt.figure(figsize=(10, 10))
plt.hist(DATA['VitInst [um/min]'], bins=500, color='limegreen', alpha=0.8, label="all speed", density=True)

# Ajouter une barre verticale à la médiane
# plt.axvline(median_value, color='red', linestyle='--', linewidth=2, label=f'Median: {median_value:.2f} μm/min')

# Ajouter des titres et des légendes
plt.title("VitInst[μm/min]", fontsize=14)
plt.xlabel("Instantaneous Velocity [μm/min]", fontsize=12)
plt.ylabel("Density", fontsize=12)
plt.grid(True, linestyle='--', alpha=0.6)
plt.legend(fontsize=12)

In [None]:
def plot_mean_vit_histograms_comparison(metrics_df, path_save_pic=None, img_type='png', alpha=0.7):
    """
    Trace sur le même graphique les histogrammes des mean_vit_inst [um/min]
    pour les particules avec coefficients supérieurs et inférieurs.

    Parameters:
    - metrics_df (DataFrame): DataFrame contenant les données, avec une colonne 'mean_vit_inst [um/min]'.
    - path_save_pic (str, optional): Chemin pour sauvegarder l'image. Si None, l'image ne sera pas sauvegardée.
    - img_type (str, optional): Format de l'image pour la sauvegarde (par défaut 'png').

    Returns:
    None
    """
    # Vérification de la présence de la colonne nécessaire
    if 'median_vit_inst [um/min]' not in metrics_df.columns:
        raise ValueError("La colonne 'median_vit_inst [um/min]' est absente de metrics_df.")
    
    # Calcul de la médiane
    median_value = metrics_df['median_vit_inst [um/min]'].median()
    print(f"Median value: {median_value}")

    # Préparer le graphique
    plt.figure(figsize=(10, 10))
    plt.hist(metrics_df['median_vit_inst [um/min]'], bins=100, color='limegreen', alpha=alpha, label="all speed", density=True)

    # Ajouter une barre verticale à la médiane
    plt.axvline(median_value, color='red', linestyle='--', linewidth=2, label=f'Median: {median_value:.2f} μm/min')

    # Ajouter des titres et des légendes
    plt.title("Median speed [μm/min]", fontsize=14)
    plt.xlabel("Median Instantaneous Velocity [μm/min]", fontsize=12)
    plt.ylabel("Density", fontsize=12)
    plt.grid(True, linestyle='--', alpha=0.6)
    plt.legend(fontsize=12)
    
    # Sauvegarde de l'image si un chemin est spécifié
    if path_save_pic:
        save_path = os.path.join(path_save_pic, f'Median_Velocity_Histograms_all.{img_type}')
        plt.savefig(save_path, format=img_type)
        print(f"Plot sauvegardé à : {save_path}")
    
    # Afficher le graphique
    # Sans tight_layout (les titres peuvent se chevaucher)
    plt.tight_layout()  # Ajuste automatiquement l'espacement
    plt.show()

In [None]:
plot_mean_vit_histograms_comparison(metrics_df, path_save_pic=path_save_pic, img_type=IMG_TYPE, alpha=0.5)

In [None]:
import os
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import colormaps

def plot_velocity_histograms(all_metrics_df, metrics_df, path_save_pic, img_type):
    """
    Plot histograms of median instantaneous velocities for each experiment, sorted by incubation time.

    Parameters:
    - all_metrics_df (DataFrame): Aggregated metrics per experiment.
    - metrics_df (DataFrame): Metrics for each particle and experiment.
    - path_save_pic (str): Path where the plot will be saved.
    - img_type (str): Image format for saving the plot.
    """
    # Trier les expériences par temps d'incubation
    exp_hours = all_metrics_df[['experiment', 'time to incubation (hours)']].sort_values(by='time to incubation (hours)')
    experiments = exp_hours['experiment'].tolist()
    incubation_times = exp_hours['time to incubation (hours)'].tolist()

    # Déterminer les bornes de l'axe X
    global_min = metrics_df['median_vit_inst [um/min]'].min()
    global_max = metrics_df['median_vit_inst [um/min]'].max()
    delta = (global_max - global_min) * 0.1  # Ajouter 10% de marge pour l'affichage
    global_min -= delta
    global_max += delta

    # Liste pour stocker les médianes des vitesses moyennes instantanées
    median_values_list = []

    # Nombre d'expériences à afficher
    n_experiments = len(experiments)
    fig, axes = plt.subplots(nrows=n_experiments, ncols=1, figsize=(10, 3 * n_experiments), sharex=True, sharey=True)

    if n_experiments == 1:
        axes = [axes]  # S'assurer que 'axes' est une liste si un seul subplot

    # Palette de couleurs
    palette = colormaps['tab20']
    colors = [palette(i / n_experiments) for i in range(n_experiments)]

    # Boucle sur chaque expérience
    for idx, ax in enumerate(axes):
        exp = experiments[idx]
        hour = incubation_times[idx]

        # Filtrer les données pour cette expérience
        data_exp = metrics_df[metrics_df['experiment'] == exp]
        num_particles = len(data_exp)  # Nombre de particules dans cette expérience

        # Calculer la médiane des vitesses moyennes instantanées pour cette expérience
        median_value = data_exp['median_vit_inst [um/min]'].median()
        median_values_list.append(median_value)  # Stocker la médiane

        # Tracer l'histogramme
        ax.hist(data_exp['median_vit_inst [um/min]'], bins=30, alpha=0.3, range=(global_min, global_max), color=colors[idx])

        # Ajouter titre et labels
        ax.set_title(f'Vit. Inst. Mediane [μm/min] - {exp} (Incubation: {hour}h)')
        ax.set_xlabel('VitInst [μm/min]')
        ax.set_ylabel('Nombre de particules')

        # Ajouter la médiane avec une ligne verticale rouge
        ax.axvline(median_value, color='red', linestyle='dashed', linewidth=1)
        ax.text(
            median_value + 0.05 * (global_max - global_min), 
            # ax.get_ylim()[1] * 0.95,
            75,
            f'Médiane: {median_value:.2f}',
            color='red',
            ha='left'
        )

        # Ajouter le nombre total de particules sur le graphique
        ax.text(
            global_max - 0.1 * (global_max - global_min),  # Position X
            # ax.get_ylim()[1] * 0.85,  # Position Y (haut du graphe)
            75,
            f'Nb Particules: {num_particles}',
            color='black',
            ha='right',
            fontsize=10,
            bbox=dict(facecolor='white', alpha=0.5, edgecolor='black')
        )

        # Ajuster les limites de l'axe X
        ax.set_xlim(global_min, global_max)

    # Calculer la moyenne et la médiane des médianes enregistrées
    overall_median_of_medians = np.median(median_values_list)
    overall_mean_of_medians = np.mean(median_values_list)

    # Afficher les résultats finaux
    print(f"Médiane globale des médianes : {overall_median_of_medians:.2f} μm/min")
    print(f"Moyenne globale des médianes : {overall_mean_of_medians:.2f} μm/min")

    # Ajuster l'affichage et sauvegarder la figure
    plt.tight_layout()
    fig_path = os.path.join(path_save_pic, f'Velocity_Histograms.{img_type}')
    fig.savefig(fig_path, format=img_type)
    plt.show()
    
    print(f"Plot saved to {fig_path}")

    return overall_median_of_medians, overall_mean_of_medians  # Retourner ces valeurs si besoin

In [None]:
# plot_velocity_histograms(all_mean_vitinst, medians, exp_hours, path_save_pic, IMG_TYPE)
plot_velocity_histograms(all_metrics_df, metrics_df, path_save_pic, IMG_TYPE)

###
<center><span style="color: skyblue; font-size: 20px"> Calcul de l'autocorrelation de la vitesse </span></center>


In [None]:
def velocity_autocorrelation_per_particle(data, max_lag, fps):
    """
    Calcule l'autocorrélation de la vitesse pour chaque particule individuellement.

    Paramètres:
    ----------
    - data : pd.DataFrame
        DataFrame contenant les trajectoires, avec les colonnes :
        ['experiment', 'particle', 'frame', 'dx [pix]', 'dy [pix]']
    - max_lag : int
        Nombre maximum d'intervalle de temps (tau) pour l'autocorrélation.
    - fps : float
        Nombre d'images par seconde, pour convertir le temps en secondes.

    Retourne:
    ----------
    - autocorr_df : pd.DataFrame
        DataFrame contenant l'autocorrélation moyenne et individuelle par particule.
    """

    # Vérifier que les colonnes nécessaires existent
    required_columns = {'experiment', 'particle', 'frame', 'dx [pix]', 'dy [pix]'}
    if not required_columns.issubset(data.columns):
        raise KeyError(f"🚨 Erreur : Les colonnes requises {required_columns} ne sont pas toutes présentes dans DATA.")

    # Trier les données
    data = data.sort_values(by=['experiment', 'particle', 'frame'])

    # Calculer les composantes de vitesse vx et vy
    data['vx'] = data['dx [pix]'] / data.groupby(['experiment', 'particle'])['frame'].diff()
    data['vy'] = data['dy [pix]'] / data.groupby(['experiment', 'particle'])['frame'].diff()

    # Remplir les NaN initiaux (première frame de chaque particule)
    data[['vx', 'vy']] = data[['vx', 'vy']].fillna(0)

    # Dictionnaire pour stocker les résultats
    autocorr_dict = {'lag': []}
    particle_corrs = {}

    # Parcourir chaque particule et calculer son autocorrélation individuelle
    for particle, group in data.groupby(['experiment', 'particle']):
        group = group.sort_values(by='frame')

        # Vérifier qu'il y a assez de points pour calculer l'autocorrélation
        if len(group) < max_lag:
            continue

        v_t = np.sqrt(group['vx']**2 + group['vy']**2).values

        autocorr_values = []
        for tau in range(1, max_lag + 1):
            v_tau = np.roll(v_t, -tau)  # Décaler les vitesses de tau frames
            valid_idx = np.arange(len(v_t)) < (len(v_t) - tau)  # Éviter les valeurs hors limites

            # Calculer l'autocorrélation
            corr = np.mean(v_t[valid_idx] * v_tau[valid_idx]) / np.mean(v_t[valid_idx]**2)
            autocorr_values.append(corr)

        particle_corrs[particle] = autocorr_values

    # Transformer en DataFrame
    autocorr_df = pd.DataFrame.from_dict(particle_corrs, orient='index', columns=[f'lag_{tau}' for tau in range(1, max_lag + 1)])
    autocorr_df.index.name = 'particle'

    # Calculer la moyenne des autocorrélations par lag
    autocorr_df.loc['mean'] = autocorr_df.mean()

    return autocorr_df

# Définition des paramètres
max_lag = 30  # Nombre de frames de décalage maximal
fps = FPS  # Images par seconde

# Calcul de l'autocorrélation par particule
autocorr_result = velocity_autocorrelation_per_particle(DATA, max_lag=max_lag, fps=fps)

# Afficher les résultats
import matplotlib.pyplot as plt

lags = np.arange(1, max_lag + 1) / fps  # Convertir en secondes
plt.plot(lags, autocorr_result.loc['mean'].values, marker='o', label="Autocorrélation moyenne")

plt.xlabel("Décalage temporel (s)")
plt.ylabel("Autocorrélation de la vitesse")
plt.title("Autocorrélation de la vitesse (moyenne sur particules)")
plt.grid()
plt.legend()
plt.show()

In [None]:
# Définition des paramètres
max_lag = 30  # Nombre de frames de décalage maximal
fps = FPS  # Images par seconde

# Calcul de l'autocorrélation par particule
autocorr_result = velocity_autocorrelation_per_particle(DATA, max_lag=max_lag, fps=fps)

# Afficher les résultats
import matplotlib.pyplot as plt

lags = np.arange(1, max_lag + 1) / fps  # Convertir en secondes
plt.plot(lags, autocorr_result.loc['mean'].values, marker='o', label="Autocorrélation moyenne")

plt.xlabel("Décalage temporel (s)")
plt.ylabel("Autocorrélation de la vitesse")
plt.title("Autocorrélation de la vitesse (moyenne sur particules)")
plt.grid()
plt.legend()
plt.show()

In [None]:
def velocity_autocorrelation_by_experiment_and_global(data, max_lag, fps):
    """
    Calcule l'autocorrélation de la vitesse par particule, puis :
      1) Moyenne par expérience
      2) Moyenne globale (sur toutes les particules de toutes les expériences).
    
    Retourne un DataFrame dont :
      - L'index = décalages en secondes (1/fps, 2/fps, ..., max_lag/fps).
      - Les colonnes = chaque expérience + la colonne 'All' (moyenne globale).
    
    Paramètres
    ----------
    data : pd.DataFrame
        DataFrame contenant les trajectoires, avec colonnes :
        ['experiment', 'particle', 'frame', 'dx [pix]', 'dy [pix]']
    max_lag : int
        Nombre maximum d'intervalle de temps (tau) pour l'autocorrélation.
    fps : float
        Nombre d'images par seconde, pour convertir frames -> secondes.
    
    Retourne
    --------
    autocorr_df : pd.DataFrame
        * index : lags (s)
        * colonnes : expériences + 'All'
    """
    # Vérifier colonnes
    required_cols = {'experiment', 'particle', 'frame', 'dx [pix]', 'dy [pix]'}
    if not required_cols.issubset(data.columns):
        raise KeyError(
            f"🚨 Les colonnes requises {required_cols} ne sont pas toutes présentes dans 'data'."
        )
    
    # Trier la DataFrame
    data = data.sort_values(by=['experiment', 'particle', 'frame'])
    
    # Calcul des composantes de vitesse vx, vy
    data['delta_frame'] = data.groupby(['experiment', 'particle'])['frame'].diff()
    data['vx'] = data['dx [pix]'] / data['delta_frame']
    data['vy'] = data['dy [pix]'] / data['delta_frame']
    data[['vx', 'vy']] = data[['vx', 'vy']].fillna(0)
    
    # Stockage des autocorrélations
    # experiment_autocorrs[exp_name] = [ [autocorr_part1], [autocorr_part2], ... ]
    experiment_autocorrs = {}
    # Liste globale de toutes les particules, toutes expériences confondues
    all_autocorrs = []
    
    # Calcul de l'autocorrélation par particule
    for (exp_name, particle_id), group in data.groupby(['experiment', 'particle']):
        group = group.sort_values(by='frame')
        
        # Norme de la vitesse
        v_t = np.sqrt(group['vx']**2 + group['vy']**2).values
        
        if len(v_t) < max_lag:
            # Pas assez de points
            continue
        
        # Calcul de l'autocorrélation pour tau = 1..max_lag
        autocorr_values = []
        for tau in range(1, max_lag + 1):
            v_tau = np.roll(v_t, -tau)
            valid_idx = np.arange(len(v_t)) < (len(v_t) - tau)
            
            numerator = np.mean(v_t[valid_idx] * v_tau[valid_idx])
            denominator = np.mean(v_t[valid_idx]**2)
            corr = numerator / denominator if denominator != 0 else np.nan
            autocorr_values.append(corr)
        
        # Stocker dans experiment_autocorrs
        if exp_name not in experiment_autocorrs:
            experiment_autocorrs[exp_name] = []
        experiment_autocorrs[exp_name].append(autocorr_values)
        
        # Stocker aussi dans la liste globale
        all_autocorrs.append(autocorr_values)
    
    # Moyenne par expérience
    experiment_mean_corr = {}
    for exp_name, list_autocorrs in experiment_autocorrs.items():
        arr = np.array(list_autocorrs)  # shape: (nb_particules, max_lag)
        mean_by_lag = np.nanmean(arr, axis=0)
        experiment_mean_corr[exp_name] = mean_by_lag
    
    # Moyenne globale (All) sur toutes les particules de TOUTES les expériences
    if len(all_autocorrs) > 0:
        arr_all = np.array(all_autocorrs)  # shape: (nb_total_particules, max_lag)
        global_mean = np.nanmean(arr_all, axis=0)
    else:
        global_mean = np.full(shape=(max_lag,), fill_value=np.nan)
    
    # Construire le DataFrame final
    lags_in_sec = np.arange(1, max_lag + 1) / fps
    autocorr_df = pd.DataFrame(experiment_mean_corr, index=lags_in_sec)
    autocorr_df.index.name = "lag (s)"
    
    # Ajouter la colonne 'All'
    autocorr_df['All'] = global_mean
    
    return autocorr_df


max_lag = 30
fps = FPS  # par exemple

autocorr_df = velocity_autocorrelation_by_experiment_and_global(DATA, max_lag, fps)

# Création de la figure
plt.figure()#figsize=(8, 5))

# Tracé de "All" en bleu avec un style spécifique
plt.plot(autocorr_df.index, autocorr_df["All"], marker='o', linestyle='-', 
         label="All", color="blue", linewidth=2, alpha=1.0)

# Tracé des expériences avec transparence et ligne fine
for col in autocorr_df.columns:
    if col != "All":  # On exclut "All"
        plt.plot(autocorr_df.index, autocorr_df[col], marker='+', linestyle='-', 
                 alpha=0.5, linewidth=0.5, label=col)

# Ajout de légende unique
plt.legend(title="Expériences et All", loc="upper right")

# Axes et titre
plt.xlabel("Lag (s)")
plt.ylabel("Autocorrélation")
plt.title("Autocorrélation de la vitesse, par expérience et globale")
plt.grid(True)

# Affichage
plt.show()

Fit exponnentiel de l'autocorrelation de la vitesse

In [None]:
def exponential_decay(t, A, tau_c):
    """
    Modèle simple d'exponentielle décroissante pour l'autocorrélation.
    f(t) = A * exp(-t / tau_c)
    """
    return A * np.exp(-t / tau_c)

def exponential_decay_offset(t, A, tau_c, B):
    """
    Modèle exponentiel avec offset.
    f(t) = A * exp(-t / tau_c) + B
    """
    return A * np.exp(-t / tau_c) + B

def fit_velocity_autocorrelation(xdata, ydata, model=exponential_decay_offset, p0=(1.0, 1.0, 0.1)):
    """
    Ajuste la courbe d'autocorrélation de la vitesse à un modèle donné.
    
    Paramètres
    ----------
    xdata : array-like
        Les temps (lags) en secondes.
    ydata : array-like
        Les valeurs d'autocorrélation correspondantes.
    model : callable
        Fonction du modèle f(t, *params). Par défaut : exponential_decay_offset.
    p0 : tuple
        Valeurs initiales pour le fit. Par défaut : (1.0, 1.0, 0.1).
        Correspond ici aux 3 paramètres (A, tau_c, B).

    Retourne
    -------
    popt : ndarray
        Paramètres optimaux du fit (selon 'model').
    pcov : 2D ndarray
        Matrice de covariance estimée des paramètres du fit.
    """
    popt, pcov = curve_fit(model, xdata, ydata, p0=p0)
    return popt, pcov


# On va fitter la colonne "All"
xdata = autocorr_df.index.to_numpy()    # lags en secondes (ex: [0.1, 0.2, 0.3, ...])
ydata = autocorr_df["All"].values       # autocorrélation globale

# Ajustement
popt, pcov = fit_velocity_autocorrelation(
    xdata, 
    ydata,
    model=exponential_decay_offset, 
    p0=(1.0, 1.0, 0.1)  # initial guess
)

# Résultats
A_opt, tau_c_opt, B_opt = popt
print(f"Paramètres optimaux : A = {A_opt:.3f}, tau_c = {tau_c_opt:.3f}, B = {B_opt:.3f}")

# Construction d'un vecteur de points pour tracer la fonction ajustée
x_fit = np.linspace(xdata.min(), xdata.max(), 200)
y_fit = exponential_decay_offset(x_fit, A_opt, tau_c_opt, B_opt)

# Affichage
plt.figure(figsize=(6,4))
plt.plot(xdata, ydata, 'o', label="Autocorr (colonne 'All')")
plt.plot(x_fit, y_fit, '-', label=(
    f"Fit: A={A_opt:.3f}, tau_c={tau_c_opt:.3f}, B={B_opt:.3f}")
)
plt.xlabel("Décalage temporel (s)")
plt.ylabel("Autocorrélation de la vitesse")
plt.title("Fit exponentiel de la courbe 'All'")
plt.legend()
plt.grid(True)
plt.show()

In [None]:
def single_exp_decay(t, C0, tau_c):
    """Modèle exponentiel simple"""
    return C0 * np.exp(-t / tau_c)

def double_exp_decay(t, C0, tau1, C1, tau2):
    """Modèle double exponentiel"""
    return C0 * np.exp(-t / tau1) + C1 * np.exp(-t / tau2)

def fit_exponential_decay(
    autocorr_result,
    max_lag,
    fps,
    use_double_exp=False,
    cut_time=1.0,
    p0_single=None,
    p0_double=None
):
    """
    Ajuste une décroissance exponentielle sur l'autocorrélation de la vitesse.
    
    Paramètres
    ----------
    autocorr_result : pd.DataFrame
        DataFrame contenant l'autocorrélation moyenne par lag ('lag_1', 'lag_2', ...).
        Il doit contenir une ligne 'mean' avec les valeurs moyennes.
    max_lag : int
        Nombre maximal de décalages temporels utilisés pour l'ajustement.
    fps : float
        Nombre d'images par seconde (convertit le lag en secondes).
        Exemple : fps=10 => 10 images/s, fps=1/15 => 1 image/15s.
    use_double_exp : bool
        Si True, ajuste un modèle double exponentiel au lieu d'un simple exponentiel.
    cut_time : float
        Temps (en secondes) en-deçà duquel on effectue l'ajustement (filtre t < cut_time).
        Si aucun lag n'est inférieur à cut_time, on ne filtre pas du tout.
    p0_single : list ou tuple, optionnel
        Valeurs initiales pour le fit simple exponentiel (C0, tau_c).
    p0_double : list ou tuple, optionnel
        Valeurs initiales pour le fit double exponentiel (C0, tau1, C1, tau2).
    
    Retourne
    --------
    popt : ndarray
        Paramètres ajustés du modèle.
    """

    # -- Vérification de la présence d'une ligne 'mean' --
    if 'mean' not in autocorr_result.index:
        raise KeyError("⚠️ La ligne 'mean' est absente de `autocorr_result`.")

    # -- Nombre de lags disponibles dans le DataFrame --
    num_lags = len(autocorr_result.columns)
    # On veille à ne pas dépasser max_lag
    num_lags = min(num_lags, max_lag)

    # -- Construction du vecteur de temps pour chaque lag (en s) --
    #    lag 1 => t = 1/fps, lag 2 => t = 2/fps, etc.
    lags = np.arange(1, num_lags + 1) / fps

    # -- Récupération de l'autocorrélation moyenne --
    autocorr_values = autocorr_result.loc['mean'].values[:num_lags]

    # -- Application du filtre lags < cut_time (si pertinent) --
    mask = (lags < cut_time)
    if mask.sum() == 0:
        # Si aucun lag n'est < cut_time, on ne filtre pas du tout
        print(f"⚠️ Aucun lag n'est < {cut_time}s. On utilise toutes les données pour le fit.")
        lags_fit = lags
        autocorr_fit = autocorr_values
    else:
        lags_fit = lags[mask]
        autocorr_fit = autocorr_values[mask]

    # -- Ajustement par curve_fit --
    #    On choisit des valeurs initiales adaptées au simple ou double exponentiel
    if p0_single is None:
        # p0_single par défaut
        p0_single = [0.8, 1.0]    # Valeurs arbitraires : amplitude=0.8, tau=1s
    if p0_double is None:
        # p0_double par défaut
        p0_double = [0.8, 1.0, 0.2, 5.0]  # Valeurs arbitraires

    try:
        if use_double_exp:
            popt, _ = curve_fit(double_exp_decay, lags_fit, autocorr_fit, p0=p0_double)
            model_label = (
                f"Ajustement double exp.\n"
                f"C0={popt[0]:.2f}, tau1={popt[1]:.2f} s, "
                f"C1={popt[2]:.2f}, tau2={popt[3]:.2f} s"
            )
        else:
            popt, _ = curve_fit(single_exp_decay, lags_fit, autocorr_fit, p0=p0_single)
            model_label = (
                f"Ajustement simple exp.\n"
                f"C0={popt[0]:.2f}, tau_c={popt[1]:.2f} s"
            )
    except RuntimeError:
        print("⚠️ Échec de l'ajustement exponentiel, vérifiez les données.")
        return None

    # -- Affichage du résultat --
    plt.figure(figsize=(8, 5))
    plt.plot(lags, autocorr_values, marker='o', label="Autocorrélation mesurée")

    # On définit t_fit sur toute la plage de lags (0 jusqu’à lags.max())
    t_fit = np.linspace(0, lags.max(), 300)

    # Calcul de la courbe en utilisant tous les paramètres optimaux
    if use_double_exp:
        plt.plot(t_fit, double_exp_decay(t_fit, *popt), linestyle="--", label=model_label)
    else:
        plt.plot(t_fit, single_exp_decay(t_fit, *popt), linestyle="--", label=model_label)

    plt.xlabel("Décalage temporel (s)")
    plt.ylabel("Autocorrélation de la vitesse")
    plt.title("Autocorrélation avec ajustement exponentiel")
    plt.legend()
    plt.grid()
    plt.show()

    return popt

# Définition des paramètres
max_lag = 400  # Nombre de frames de décalage maximal

# Ajustement exponentiel simple
# Ajustement double exponentiel
popt_double = fit_exponential_decay(
    autocorr_result,
    max_lag=max_lag,
    fps=FPS,
    use_double_exp=True,
    cut_time=200,
    p0_double=[0.5, 30.0, 0.3, 100.0]  # exemple
)

<center><span style="color: skyblue; font-size: 20px"> Mean speed vs time to incubation </span></center>


In [None]:
def plot_mean_speed_with_sup_inf(all_metrics_df, path_save_pic, xlim: list = None):
    """
    Plot mean speed, mean speed sup, and mean speed inf as a function of incubation time
    on the same graph.

    Parameters:
    - all_metrics_df (DataFrame): DataFrame containing aggregated metrics for each experiment.
                                  Must include columns: 'time to incubation (hours)',
                                  'mean_speed [um/min]', 'mean_speed_sup [um/min]', 
                                  and 'mean_speed_inf [um/min]'.
    - path_save_pic (str): Path where the plot will be saved.
    - xlim (list, optional): Limit for the x-axis.

    Returns:
    None
    """
    # Trier les données par temps d'incubation
    all_metrics_sorted = all_metrics_df.sort_values(by='time to incubation (hours)')

    # Préparer le tracé
    plt.figure(figsize=(10, 5))

    # Courbe pour la vitesse moyenne totale
    plt.plot(
        all_metrics_sorted['time to incubation (hours)'],
        all_metrics_sorted['mean_speed [um/min]'],
        linestyle='--', color='green', alpha=0.6,
        label='Mean Speed (Total)'
    )

    # Courbe pour les particules sup
    plt.plot(
        all_metrics_sorted['time to incubation (hours)'],
        all_metrics_sorted['mean_speed_sup [um/min]'],
        linestyle='--', color='blue', alpha=0.6,
        label='Mean Speed (Sup)'
    )

    # Courbe pour les particules inf
    plt.plot(
        all_metrics_sorted['time to incubation (hours)'],
        all_metrics_sorted['mean_speed_inf [um/min]'],
        linestyle='--', color='red', alpha=0.6,
        label='Mean Speed (Inf)'
    )

    # Ajouter des labels et des titres
    plt.title('Mean Speed vs. Time to Incubation (Total, Sup, Inf)', fontsize=14)
    plt.xlabel('Time to Incubation (hours)', fontsize=12)
    plt.ylabel('Mean Speed [μm/min]', fontsize=12)
    plt.ylim([0, 15])  # Limites pour l'axe des y
    if xlim:
        plt.xlim(xlim)  # Limites pour l'axe des x (optionnel)
    plt.grid(True, linestyle='--', alpha=0.6)
    plt.legend(fontsize=10)

    # Sauvegarder et afficher
    plt.tight_layout()
    fig_path = os.path.join(path_save_pic, 'Mean_Speed_vs_Time_Sup_Inf.png')
    plt.savefig(fig_path, format='png')
    plt.show()

    print(f"Plot saved to {fig_path}")

# Exemple d'appel de la fonction
plot_mean_speed_with_sup_inf(all_metrics_df, path_save_pic)

In [None]:
def plot_median_velocity_vs_time(all_metrics_df, path_save_pic, xlim: list = None):
    """
    Plot median velocities as a function of incubation time using all_metrics_df.
    Adds a trendline with a transparent error band to the data.

    Parameters:
    - all_metrics_df (DataFrame): DataFrame containing aggregated metrics for each experiment.
    - path_save_pic (str): Path where the plot will be saved.
    - xlim (list, optional): Limit for the x-axis.
    """
    # Trier les données par temps d'incubation
    all_metrics_sorted = all_metrics_df.sort_values(by='time to incubation (hours)')

    # Extraire les données
    x = all_metrics_sorted['time to incubation (hours)'].values
    y = all_metrics_sorted['mean_speed [um/min]'].values

    # Préparer le tracé
    plt.figure(figsize=(10, 5))
    plt.scatter(x, y, color='forestgreen', label='Médiane')  # Points
    plt.plot(x, y, linestyle='--', color='limegreen', alpha=0.6)  # Ligne connectant les points

    # Régression linéaire (y = ax + b)
    slope, intercept, r_value, p_value, std_err = linregress(x, y)
    trendline = slope * x + intercept

    # Calcul de la zone d'erreur
    error_band = 100*std_err * np.sqrt(1 / len(x) + (x - np.mean(x))**2 / np.sum((x - np.mean(x))**2))
    # Ajouter la ligne de tendance
    plt.plot(x, trendline, color='red', label=f"Tendance (y = {slope:.2f}x + {intercept:.2f})", linestyle='-', linewidth=1.5)

    # Ajouter l'aire d'erreur
    plt.fill_between(x, trendline - error_band, trendline + error_band, color='red', alpha=0.2, label="Marge d'erreur")

    # Ajouter des labels et des titres
    plt.title('Mean Speed vs. Time to Incubation', fontsize=14)
    plt.xlabel('Time to Incubation (hours)', fontsize=12)
    plt.ylabel('Mean Speed [μm/min]', fontsize=12)
    plt.ylim([0, 15])
    if xlim:
        plt.xlim(xlim)
    plt.grid(True, linestyle='--', alpha=0.6)
    plt.legend(fontsize=10)

    # Sauvegarder et afficher
    plt.tight_layout()
    fig_path = os.path.join(path_save_pic, 'Mean_Speed_vs_Time_with_Trendline_and_ErrorBand.png')
    plt.savefig(fig_path, format='png')
    plt.show()

    print(f"Plot saved to {fig_path}")

#utilisation
plot_median_velocity_vs_time(all_metrics_df, path_save_pic)

In [None]:
def plot_median_velocity_vs_time(all_metrics_df, path_save_pic, xlim: list = None):
    """
    Plot median velocities as a function of incubation time using all_metrics_df.

    Parameters:
    - all_metrics_df (DataFrame): DataFrame containing aggregated metrics for each experiment.
    - path_save_pic (str): Path where the plot will be saved.
    """
    # Trier les données par temps d'incubation
    all_metrics_sorted = all_metrics_df.sort_values(by='time to incubation (hours)')

    # Préparer le tracé
    plt.figure(figsize=(10, 5))
    plt.scatter(all_metrics_sorted['time to incubation (hours)'], 
                all_metrics_sorted['mean_speed [um/min]'],  # Correction de la colonne utilisée
                color='forestgreen', label='Médiane')
    plt.plot(all_metrics_sorted['time to incubation (hours)'], 
             all_metrics_sorted['mean_speed [um/min]'],  # Correction de la colonne utilisée
             linestyle='--', color='limegreen', alpha=0.6)

    # Ajouter des labels et des titres
    plt.title('Mean Speed vs. Time to Incubation', fontsize=14)
    plt.xlabel('Time to Incubation (hours)', fontsize=12)
    plt.ylim([0, 15])
    plt.ylabel('Mean Speed [μm/min]', fontsize=12)
    plt.grid(True, linestyle='--', alpha=0.6)

    # Sauvegarder et afficher
    plt.tight_layout()
    fig_path = os.path.join(path_save_pic, 'Mean_Speed_vs_Time.png')
    plt.savefig(fig_path, format='png')
    plt.show()

    print(f"Plot saved to {fig_path}")

# Appel de la fonction corrigée
plot_median_velocity_vs_time(all_metrics_df, path_save_pic)

In [None]:
def plot_proportion_vs_time(all_metrics_df, path_save_pic, img_type):
    """
    Plot the proportion of low coefficient particles (proportion_inf) vs. time to incubation.

    Parameters:
    - all_metrics_df (DataFrame): DataFrame containing aggregated metrics for each experiment.
    - path_save_pic (str): Path where the plot will be saved.
    - img_type (str): Image format for saving the plot.
    """
    # Trier les données par temps d'incubation
    all_metrics_sorted = all_metrics_df.sort_values(by='time to incubation (hours)')

    # Préparer le tracé
    plt.figure(figsize=(10, 5))
    plt.scatter(all_metrics_sorted['time to incubation (hours)'], 
                all_metrics_sorted['proportion_inf'], 
                color='red', marker='+', label='Proportion inf')
    
    # Ajouter des titres et des labels
    plt.title('Proportion of Low Coefficient Particles vs. Time to Incubation', fontsize=14)
    plt.xlabel('Time to Incubation (hours)', fontsize=12)
    plt.ylabel('Proportion of Low Coefficient Particles', fontsize=12)
    plt.grid(True, linestyle='--', alpha=0.6)

    # Ajuster et sauvegarder
    plt.tight_layout()
    fig_path = os.path.join(path_save_pic, f'Proportion_Low_Coeff_Particles_vs_Time.{img_type}')
    plt.savefig(fig_path, format=img_type)
    plt.show()

    print(f"Plot saved to {fig_path}")

# Appel de la fonction
plot_proportion_vs_time(all_metrics_df, path_save_pic, IMG_TYPE)

In [None]:
def plot_proportion_per_time_bins(all_metrics_df, path_save_pic, img_type):
    """
    Plot proportions of particles (Inf and Sup) per incubation time bins.

    Parameters:
    - all_metrics_df (DataFrame): DataFrame containing aggregated metrics for each experiment.
    - path_save_pic (str): Path where the plot will be saved.
    - img_type (str): Image format for saving the plot.
    """
    # Définir les intervalles de temps d'incubation
    bins = np.arange(0, all_metrics_df['time to incubation (hours)'].max() + 10, 10)
    labels = [f"{int(left)}-{int(right)}" for left, right in zip(bins[:-1], bins[1:])]
    all_metrics_df['time_bin'] = pd.cut(all_metrics_df['time to incubation (hours)'], bins=bins, labels=labels, right=False)

    # Calculer les proportions moyennes pour chaque bin
    proportion_per_bin_inf = all_metrics_df.groupby('time_bin')['proportion_inf'].mean()
    proportion_per_bin_sup = 1 - proportion_per_bin_inf

    # Configuration des barres pour le tracé
    x = np.arange(len(proportion_per_bin_inf))
    width = 0.35

    # Tracé des proportions
    fig, ax = plt.subplots(figsize=(12, 6))
    ax.bar(x - width/2, proportion_per_bin_inf, width, color='red', alpha=0.7, label='Proportion Inf')
    ax.bar(x + width/2, proportion_per_bin_sup, width, color='blue', alpha=0.7, label='Proportion Sup')
    ax.set_title('Proportion of Particles per Incubation Time Bin', fontsize=14)
    ax.set_xlabel('Incubation Time Bin (hours)', fontsize=12)
    ax.set_ylabel('Average Proportion of Particles', fontsize=12)
    ax.set_xticks(x)
    ax.set_xticklabels(labels, rotation=45)
    ax.legend()
    plt.grid(True, linestyle='--', alpha=0.6)

    # Sauvegarder et afficher le graphique
    plt.tight_layout()
    fig_path = os.path.join(path_save_pic, f'Proportion_vs_Time_Bins.{img_type}')
    plt.savefig(fig_path, format=img_type)
    plt.show()

    print(f"Plot saved to {fig_path}")

# Appel de la fonction
plot_proportion_per_time_bins(all_metrics_df, path_save_pic, IMG_TYPE)

In [None]:
# Plot displacement comparison between low and high coefficient particles
lib.plot_displacement_low_and_high(
    traj_sup=df_sup,
    traj_inf=df_inf,
    part_coef_inf=PART_COEF_INF,
    part_coef_sup=PART_COEF_SUP,
    start_end=start_end,
    save=True,
    pathway_saving=path_save_pic,
    name="displacement_start-end_time",
    img_type=IMG_TYPE
)

In [None]:
def max_displacement_from_start(traj, size_pix):
    """
    Calcule la distance maximale entre le point de départ et toutes les positions
    atteintes par chaque particule.

    Parameters
    ----------
    traj : pandas.DataFrame
        Trajectoire des particules avec colonnes 'x', 'y', 'particle'.
    size_pix : float
        Taille d'un pixel en micromètres.

    Returns
    -------
    max_displacements : pandas.Series
        Distance maximale pour chaque particule.
    """
    # Identifier les coordonnées de départ pour chaque particule
    start_positions = traj.groupby('particle')[['x', 'y']].first()

    # Ajouter les coordonnées de départ au DataFrame
    traj = traj.join(start_positions, on='particle', rsuffix='_start')

    # Calculer les distances à partir du point de départ
    traj['distance_from_start [um]'] = size_pix * np.sqrt(
        (traj['x'] - traj['x_start'])**2 + 
        (traj['y'] - traj['y_start'])**2
    )

    # Trouver la distance maximale pour chaque particule
    max_displacements = traj.groupby('particle')['distance_from_start [um]'].max()

    return max_displacements

# Calcul des distances maximales
max_distances = max_displacement_from_start(DATA, size_pix=SIZE_PIX)

# Filtrage des particules appartenant à PART_COEF_INF et PART_COEF_SUP
distances_part_coef_inf = max_distances[max_distances.index.isin(PART_COEF_INF)]
distances_part_coef_sup = max_distances[max_distances.index.isin(PART_COEF_SUP)]

# Tracer les deux histogrammes sur le même graphique
plt.figure(figsize=(12, 7))
plt.hist(distances_part_coef_inf, bins=100, color='red', alpha=0.5, label='PART_COEF_INF')
plt.hist(distances_part_coef_sup, bins=100, color='blue', alpha=0.5, label='PART_COEF_SUP')
plt.title('Histogramme des distances maximales par catégorie', fontsize=16)
plt.xlabel('Distance maximale [μm]', fontsize=14)
plt.ylabel('Nombre de particules', fontsize=14)
plt.legend(fontsize=12)
plt.grid(True, linestyle='--', alpha=0.6)
plt.show()

In [None]:
def plot_size_histograms(DATA, PART_COEF_SUP, save=False, pathway_saving=None, img_type="png"):
    """
    Trace un histogramme des tailles des particules par expérience sur une seule figure,
    avec un subplot par expérience.

    Parameters
    ----------
    DATA : pandas.DataFrame
        Contient les colonnes 'experiment', 'particle', et 'size'.
    PART_COEF_SUP : set
        Ensemble des particules appartenant à PART_COEF_SUP (bleu).
    save : bool, optional
        Si True, sauvegarde les plots.
    pathway_saving : str, optional
        Chemin pour sauvegarder les plots si save=True.
    img_type : str, optional
        Format d'image pour la sauvegarde (png, jpg, etc.).

    Returns
    -------
    None
    """
    # Vérifier si les colonnes nécessaires sont présentes
    if not all(col in DATA.columns for col in ['experiment', 'particle', 'size']):
        raise ValueError("Les colonnes 'experiment', 'particle', et 'size' doivent être présentes dans DATA.")
    
    # Obtenir la liste unique des expériences
    experiments = DATA['experiment'].unique()
    n_experiments = len(experiments)

    # Calculer le nombre de lignes et colonnes pour les subplots
    n_cols = 3  # Fixé pour avoir 3 colonnes
    n_rows = math.ceil(n_experiments / n_cols)

    # Création de la figure
    fig, axes = plt.subplots(n_rows, n_cols, figsize=(5 * n_cols, 4 * n_rows))
    axes = axes.flatten()  # Convertir les axes en tableau 1D pour itération facile

    for i, experiment in enumerate(experiments):
        # Filtrer les données pour l'expérience courante
        exp_data = DATA[DATA['experiment'] == experiment]

        # Séparer les tailles en deux catégories
        sizes_sup = exp_data[exp_data['particle'].isin(PART_COEF_SUP)]['ecc']
        sizes_other = exp_data[~exp_data['particle'].isin(PART_COEF_SUP)]['ecc']

        # Histogramme dans le subplot correspondant
        ax = axes[i]
        ax.hist(sizes_sup, bins=20, alpha=0.7, color='blue', label="PART_COEF_SUP")
        ax.hist(sizes_other, bins=20, alpha=0.7, color='red', label="Autres")

        ax.set_title(f"Expérience : {experiment}", fontsize=12)
        ax.set_xlabel("Taille", fontsize=10)
        ax.set_ylabel("Nombre", fontsize=10)
        ax.legend(fontsize=9)
        ax.grid(alpha=0.4)

    # Supprimer les axes inutilisés
    for j in range(len(experiments), len(axes)):
        fig.delaxes(axes[j])

    # Ajuster les espaces entre subplots
    fig.tight_layout()

    # Sauvegarder ou afficher
    if save and pathway_saving:
        filename = f"{pathway_saving}/size_histograms.{img_type}"
        plt.savefig(filename, format=img_type, bbox_inches="tight")
        print(f"Figure sauvegardée : {filename}")
    plt.show()

# Exemple d'utilisation
plot_size_histograms(
    DATA=DATA,
    PART_COEF_SUP=PART_COEF_SUP,
    save=False,
    pathway_saving=None,
    img_type="png"
)

In [None]:
def plot_speed_vs_density(all_metrics_df, save=False, pathway_saving=None, img_type="png"):
    """
    Trace la vitesse moyenne des particules en fonction de la densité cellulaire,
    en utilisant uniquement Matplotlib et des croix pour les points.

    Parameters
    ----------
    all_metrics_df : pandas.DataFrame
        Contient les colonnes 'mean_speed [um/min]' et 'nombre_part_par_champs'.
    save : bool, optional
        Si True, sauvegarde le graphique.
    pathway_saving : str, optional
        Chemin pour sauvegarder le graphique si save=True.
    img_type : str, optional
        Format d'image pour la sauvegarde (png, jpg, etc.).

    Returns
    -------
    None
    """
    # Vérification des colonnes nécessaires
    if not all(col in all_metrics_df.columns for col in ['mean_speed [um/min]', 'nombre_part_par_champs']):
        raise ValueError("Les colonnes 'mean_speed [um/min]' et 'nombre_part_par_champs' doivent être présentes dans all_metrics_df.")
    
    # Créer le graphique
    plt.figure(figsize=(10, 6))
    ax = plt.gca()  # Récupérer les axes actuels avec le style Matplotlib

    # Tracé des points avec des croix
    ax.scatter(
        all_metrics_df['nombre_part_par_champs'],
        all_metrics_df['mean_speed [um/min]'],
        s=100,  # Taille des symboles
        alpha=0.7,
        color='#1f77b4',  # Couleur compatible avec axes.prop_cycle
        marker='+',  # Utiliser des croix
        label="Points"
    )

    # Régression linéaire
    x = all_metrics_df['nombre_part_par_champs']
    y = all_metrics_df['mean_speed [um/min]']
    coeffs = np.polyfit(x, y, 1)  # Ajustement linéaire
    y_fit = np.polyval(coeffs, x)
    ax.plot(x, y_fit, color='#ff7f0e', label="Régression linéaire")  # Ligne de tendance

    # Titre et axes
    ax.set_title("Vitesse moyenne vs Densité cellulaire", fontsize=16, color='white')
    ax.set_xlabel("Nombre de particules par champ", fontsize=14, color='white')
    ax.set_ylabel("Vitesse moyenne [µm/min]", fontsize=14, color='white')
    ax.legend(fontsize=12)
    ax.grid(alpha=0.4)

    # Sauvegarder ou afficher
    if save and pathway_saving:
        filename = f"{pathway_saving}/mean_speed_vs_density.{img_type}"
        plt.savefig(filename, format=img_type, bbox_inches="tight", facecolor=plt.rcParams["figure.facecolor"])
        print(f"Graphique sauvegardé : {filename}")
    plt.show()

# Exemple d'utilisation
plot_speed_vs_density(
    all_metrics_df=all_metrics_df,
    save=False,
    pathway_saving=None,
    img_type="png"
)

In [None]:
def plot_speed_vs_density(all_metrics_df, save=False, pathway_saving=None, img_type="png"):
    """
    Trace la vitesse moyenne des particules en fonction de la densité cellulaire,
    en respectant les paramètres Matplotlib globaux.

    Parameters
    ----------
    all_metrics_df : pandas.DataFrame
        Contient les colonnes 'mean_speed [um/min]' et 'nombre_part_par_champs'.
    save : bool, optional
        Si True, sauvegarde le graphique.
    pathway_saving : str, optional
        Chemin pour sauvegarder le graphique si save=True.
    img_type : str, optional
        Format d'image pour la sauvegarde (png, jpg, etc.).

    Returns
    -------
    None
    """
    # Vérification des colonnes nécessaires
    if not all(col in all_metrics_df.columns for col in ['mean_speed [um/min]', 'nombre_part_par_champs']):
        raise ValueError("Les colonnes 'mean_speed [um/min]' et 'nombre_part_par_champs' doivent être présentes dans all_metrics_df.")
    
    # Désactiver le style Seaborn pour respecter Matplotlib
    sns.set_theme(style=None)

    # Créer le graphique
    plt.figure(figsize=(10, 6))
    ax = plt.gca()  # Récupérer les axes actuels avec le style Matplotlib

    # Tracé des points avec scatterplot
    sns.scatterplot(
        x='nombre_part_par_champs',
        y='mean_speed [um/min]',
        data=all_metrics_df,
        s=100,  # Taille des points
        alpha=0.7,
        color='#1f77b4',  # Couleur compatible avec axes.prop_cycle
        edgecolor='white'
    )

    # Ajouter une ligne de tendance avec régression
    sns.regplot(
        x='nombre_part_par_champs',
        y='mean_speed [um/min]',
        data=all_metrics_df,
        scatter=False,
        color='#ff7f0e',  # Deuxième couleur du cycle
        line_kws={'label': "Régression linéaire"}
    )

    # Titre et axes
    ax.set_title("Vitesse moyenne vs Densité cellulaire", fontsize=16, color='white')
    ax.set_xlabel("Nombre de particules par champ", fontsize=14, color='white')
    ax.set_ylabel("Vitesse moyenne [µm/min]", fontsize=14, color='white')
    ax.legend(fontsize=12)
    ax.grid(alpha=0.4)

    # Sauvegarder ou afficher
    if save and pathway_saving:
        filename = f"{pathway_saving}/mean_speed_vs_density.{img_type}"
        plt.savefig(filename, format=img_type, bbox_inches="tight", facecolor=plt.rcParams["figure.facecolor"])
        print(f"Graphique sauvegardé : {filename}")
    plt.show()

# utilisation
plot_speed_vs_density(
    all_metrics_df=all_metrics_df,
    save=False,
    pathway_saving=None,
    img_type="png"
)

In [None]:
def add_condition_and_save_hdf5(data, condition, name, save_path):
    """
    Ajoute une colonne 'condition' à DATA et sauvegarde le DataFrame au format HDF5.

    Parameters:
    - DATA (pd.DataFrame): DataFrame auquel ajouter la colonne.
    - CONDITION_simple (str): Valeur à ajouter dans la colonne 'condition'.
    - save_path (str): Chemin pour sauvegarder le fichier HDF5.
    -name (str): détail du fichier enregistré

    Returns:
    - None
    """
    # Ajouter la colonne 'condition'
    data['condition'] = condition

    # Vérifier si le DataFrame est non vide
    if data.empty:
        raise ValueError("Le DataFrame est vide, aucune donnée à sauvegarder.")

    # Sauvegarder au format HDF5
    data.to_hdf(save_path + condition + f"_{name}.hdf5", key='DATA', mode='w', format='table')
    print(f"DataFrame {name} sauvegardé avec la colonne 'condition' à l'emplacement : {save_path}")

In [None]:
add_condition_and_save_hdf5(data=DATA, condition=CONDITION_simple, name="data", save_path="/Users/souchaud/Desktop/Analyses/tables_resultats/")
add_condition_and_save_hdf5(data=all_metrics_df, condition=CONDITION_simple, name="all_metrics", save_path="/Users/souchaud/Desktop/Analyses/tables_resultats/")
add_condition_and_save_hdf5(data=metrics_df, condition=CONDITION_simple, name="metrics", save_path="/Users/souchaud/Desktop/Analyses/tables_resultats/")

In [None]:
len(PART_COEF_INF)/(len(PART_COEF_INF)+len(PART_COEF_SUP))

In [None]:
len(PART_COEF_SUP)/(len(PART_COEF_INF)+len(PART_COEF_SUP))