# <center> Résultats de la macro de classification des oligodendrcoytes </center>
**Lancer la macro de classification des oligodendrocytes avec le logiciel ImageJ FIJI sur le répertoire contenant tous les puits. Si vous avez besoin des étapes pour lancer la macro lire la section Lancer la macro de comptage ou la macro de classification de la fiche utilisateur**. Cette macro produit un fichier CSV par image et chacun de ces fichiers contient en ligne les cellules d'oligodendrocytes présents sur l'image et en colonne les caractéristiques associées (ex: nombre de branches, nombre de jonctions ...). Exécuter la suite du script pour les analyser.


## Importer les bibliothèques et modification des variables
**Veuillez exécuter la cellule suivante qui permet d'importer les bibliothèques nécessaires pour l'utilisation de ce script et la modification des chemins.** Les variables suivantes représentent les chemins contenant les fichiers CSV produits par les macros et qui sont analysés par ce script. Certaine variables représentent le chemin du répertoire qui contiendra les fichier csv produit par ce script. Pour savoir quel chemin mettre pour chaque variable lire les commentaires qui sont associés à la variable.


## Modifier les variables suivantes (en bleu) 
 - <font color='blue'> **csv_dir** </font> par le chemin du répertoire contenant les fichiers à analyser produit par la macro de classification des oligodendrocytes
 - <font color='blue'>  **rep_result_classification** </font> par le chemin du répertoire qui contiendra le fichier csv produit lors de l'analyse qui contient le pourcentage d'oligodendrocytes par classe. (Exemple : "Chemin\du\repertoire")
- <font color='blue'> **name_result_classification** </font> le nom du fichier csv produit par le script pour la classification des oligodendrocytes.

In [9]:
import os
import glob
import pandas as pd
import pprint

# Macro de classification des oligodendrocytes
# Chemin répertoire contenant les fichiers csv à analyser pour la classification d'oligodendrocytes
csv_dir = r"C:\Users\naima.ammiche\Desktop\Données - traitement images\new result classification"
# Chemin répertoire qui contiendra le fichier csv produit par l'analyse qui contient pourcentage d'oligodendrocytes par classe  et le graphique correspondant
rep_result_classification = r"C:\Users\naima.ammiche\Desktop\Données - traitement images"
# Nom du fichier csv qui contiendra le pourcentage O4 pour chaque classe et chaque puits
name_result_classification = "classification"

## Visualisez-le data frame correspondant à chaque puits
La macro de classification des oligodendrocytes a permis d'avoir un fichier csv par images donc plusieurs fichiers csv par puits. Ce code permet de concaténer les fichiers csv d'un même puits les fichiers produits *exemple le fichier produit nommé A01_save* contient l'ensemble des oligodendrocytes du puits A01 en lignes et les caractéristique telle que nombre de branches, nombre de jonctions etc. en colonne. Avant de lancer l'analyse une visualisation pour chaque puits du data frame associé permet de voir quelle caractéristique étudier et modifier le code en conséquence.

La ligne de code **df.describe()** permet d'avoir une description globale du data frame, pour chaque colonne correspondant au différentes caractérisques nous aurons le nombre total de ligne **count**, la moyenne **mean**, l'écart-type **std**, le minimum **min**, le maximum **max** et les quartiles **25%, 50% et 75%** <font color='red'> **ATTENTION exécutée qu'une fois la cellule suivante pour obtenir les résultats voulus c'est-à-dire les fichiers concaténer pour chaque puits** </font>

In [10]:
# Récupérer l'ensemble des fichiers csv dans la liste csv_files
csv_regex = os.path.join(csv_dir.replace("\\", "/"), "*.csv") # Une chaîne de caractère contenant nom des fichiers à sélectionner
csv_files = glob.glob(csv_regex) # Liste de l'ensemble des fichiers CSV

# Liste vide
all_puits = []

# Parcourt le répertoire et pour chaque fichier 
for csv in csv_files:
    # Parcourir csv et ajouter à la liste chaque puits ex [A01, A02, B01 ...]
    puits = csv[-7:-4] 
    if puits not in all_puits:
        all_puits.append(puits) 

# Afficher la liste contenant l'ensemble des puits à analyser
print(f"L'ensemble des puits {all_puits}")

# Parcourt la liste des puits A01, A02, B01... 
for name in all_puits:
    
    # Parcourt les fichiers csv obtenus par la macro de classification des oligodendrocytes
    for csv in csv_files:
        name_puits = csv[-7:-4]
        if name_puits == name: 
                       
            # Essayer d'ouvrir le fichier CSV en data frame et affiché un message lorsque le fichier est vide 
            # (probablement causé lorsque des reflets présent sur l'image empêche l'analyse)
            try:  
                cluster_skeleton = pd.read_csv(csv) 
            except:
                print(f"Ce fichier est vide :  {csv}") 
    
            # Si c'est le prermier fichier CSV crée un data frame, sinon l'ajouter au dataframe existant
            if csv == csv_files[0]:
                df = cluster_skeleton
            else :
                df = pd.concat(objs = [cluster_skeleton,df], axis =0)
            os.remove(csv) 

    # Enregistrer le fichier data contenant les résultats de l'ensemble du puits au format CSV
    df.to_csv(os.path.join(csv_dir.replace("\\", "/"), name+"_save.csv"), index = False) # Sauvegarder les résultats dans un seul fichier csv
    df = pd.read_csv(csv_dir.replace("\\", "/")+"\\"+name+"_save.csv") # Ouvrir le fichier csv à analyser # Ouvrir un fichier CSV seulement
    print(f"Puits {name}\n{df.describe()}\n\n")
    
    # Supprimer le dataframe, vous pouvez retrouver le data frame le fichier csv sauvegarder
    df.drop(df.index[::], inplace=True) 

L'ensemble des puits ['A01', 'A04', 'A07', 'A10', 'B01', 'B04', 'B07', 'B10', 'C01', 'C04', 'C07', 'C10', 'D01', 'D04', 'D07', 'D10', 'E01', 'E04', 'E07', 'E10', 'F01', 'F04', 'F07', 'F10', 'G01', 'G04', 'G07', 'G10', 'H01', 'H04', 'H07', 'H10']
Puits A01
                     # Branches  # Junctions  # End-point voxels  \
count  6195.000000  6195.000000  6195.000000         6195.000000   
mean     55.741082   120.097821    33.477805           38.723487   
std      35.057066    84.043501    23.152628           27.539578   
min       1.000000    18.000000     1.000000            1.000000   
25%      26.000000    64.000000    18.000000           21.000000   
50%      52.000000    96.000000    27.000000           31.000000   
75%      82.000000   151.000000    43.000000           49.000000   
max     165.000000  1313.000000   284.000000          427.000000   

       # Junction voxels  # Slab voxels  Average Branch Length  \
count        6195.000000    6195.000000            6195.000000   

Puits B01
                     # Branches  # Junctions  # End-point voxels  \
count  4929.000000  4929.000000  4929.000000         4929.000000   
mean     44.785758    91.054169    34.452222           30.262325   
std      28.385042    75.890635    20.882940           23.031501   
min       1.000000    18.000000     3.000000            4.000000   
25%      21.000000    50.000000    20.000000           18.000000   
50%      42.000000    71.000000    29.000000           25.000000   
75%      65.000000   105.000000    43.000000           36.000000   
max     135.000000   949.000000   209.000000          360.000000   

       # Junction voxels  # Slab voxels  Average Branch Length  \
count        4929.000000    4929.000000            4929.000000   
mean          306.786366     309.001623               4.819505   
std           558.493207     183.480974               4.085633   
min            31.000000      38.000000               2.690000   
25%           137.000000     184.000000        

Puits C01
                     # Branches  # Junctions  # End-point voxels  \
count  5170.000000  5170.000000  5170.000000         5170.000000   
mean     46.385687    97.418956    37.644101           32.651644   
std      29.295477    62.250274    24.053035           20.463159   
min       1.000000    22.000000     1.000000            4.000000   
25%      22.000000    55.000000    21.000000           19.000000   
50%      44.000000    79.000000    31.000000           27.000000   
75%      67.000000   121.000000    48.000000           40.000000   
max     132.000000   650.000000   297.000000          210.000000   

       # Junction voxels  # Slab voxels  Average Branch Length  \
count        5170.000000    5170.000000            5170.000000   
mean          302.137911     318.632689               4.455855   
std           229.927831     200.580977               1.077505   
min            39.000000      25.000000               2.820000   
25%           157.250000     177.000000        

Puits D01
                     # Branches  # Junctions  # End-point voxels  \
count  5389.000000  5389.000000  5389.000000         5389.000000   
mean     47.601596    96.537391    34.469104           33.549453   
std      29.481392    76.764354    22.842721           28.588861   
min       1.000000    23.000000     2.000000            2.000000   
25%      23.000000    53.000000    19.000000           19.000000   
50%      45.000000    76.000000    28.000000           26.000000   
75%      69.000000   115.000000    43.000000           40.000000   
max     138.000000  1574.000000   320.000000          631.000000   

       # Junction voxels  # Slab voxels  Average Branch Length  \
count        5389.000000    5389.000000            5389.000000   
mean          317.220078     278.870662               4.576261   
std           308.646092     176.986551               1.371038   
min            42.000000      34.000000               2.620000   
25%           159.000000     161.000000        

Puits E01
                     # Branches  # Junctions  # End-point voxels  \
count  5183.000000  5183.000000  5183.000000         5183.000000   
mean     46.220722    88.450897    33.816323           30.431410   
std      29.231880    60.289264    20.215107           21.859201   
min       1.000000    21.000000     2.000000            4.000000   
25%      22.000000    51.000000    20.000000           18.000000   
50%      44.000000    72.000000    28.000000           25.000000   
75%      67.000000   105.000000    41.000000           36.000000   
max     157.000000   743.000000   185.000000          335.000000   

       # Junction voxels  # Slab voxels  Average Branch Length  \
count        5183.000000    5183.000000            5183.000000   
mean          273.182520     285.523635               4.403322   
std           242.092009     163.171818               1.152156   
min            34.000000      41.000000               2.870000   
25%           148.000000     171.000000        

Puits F01
                     # Branches  # Junctions  # End-point voxels  \
count  4063.000000  4063.000000  4063.000000         4063.000000   
mean     37.036919    94.882353    39.969727           31.266306   
std      23.449215    57.660383    25.410569           17.075396   
min       1.000000    21.000000     4.000000            4.000000   
25%      17.000000    54.000000    22.000000           19.000000   
50%      35.000000    79.000000    33.000000           27.000000   
75%      54.000000   119.000000    50.000000           39.000000   
max     118.000000  1046.000000   438.000000          182.000000   

       # Junction voxels  # Slab voxels  Average Branch Length  \
count        4063.000000    4063.000000            4063.000000   
mean          266.211666     352.887029               4.231836   
std           180.564285     222.330360               0.737374   
min            33.000000      35.000000               2.800000   
25%           149.000000     193.000000        

Puits G01
                     # Branches  # Junctions  # End-point voxels  \
count  5432.000000  5432.000000  5432.000000         5432.000000   
mean     48.022275    81.463549    34.473490           27.388807   
std      29.215907    44.226103    19.175925           14.204693   
min       1.000000    24.000000     5.000000            6.000000   
25%      23.000000    50.000000    21.000000           17.000000   
50%      46.000000    69.000000    29.000000           24.000000   
75%      70.000000   100.000000    43.000000           34.000000   
max     133.000000   454.000000   202.000000          151.000000   

       # Junction voxels  # Slab voxels  Average Branch Length  \
count        5432.000000    5432.000000            5432.000000   
mean          224.164580     304.782769               4.162472   
std           134.505871     165.489441               0.576884   
min            42.000000      52.000000               2.390000   
25%           134.000000     187.000000        

Puits H01
                     # Branches  # Junctions  # End-point voxels  \
count  5461.000000  5461.000000  5461.000000         5461.000000   
mean     47.641091    83.216078    36.127449           27.595862   
std      28.889681    46.362442    20.741719           14.322458   
min       1.000000    19.000000     3.000000            3.000000   
25%      23.000000    50.000000    21.000000           17.000000   
50%      46.000000    70.000000    30.000000           24.000000   
75%      70.000000   104.000000    45.000000           34.000000   
max     131.000000   436.000000   198.000000          133.000000   

       # Junction voxels  # Slab voxels  Average Branch Length  \
count        5461.000000    5461.000000            5461.000000   
mean          222.257828     330.123421               4.204486   
std           136.402513     179.843845               0.552381   
min            41.000000      59.000000               3.010000   
25%           128.000000     202.000000        

## Analyse des résultats 
L'initialisation consiste à produire des listes vide pour chaque classe d'oligodendrocytes **in150, entre150_300, entre300_450, sup450** et une liste vide pour ajouter les puits analysés **index_classification**. Ouvrir le répertoire contenant les fichiers au format csv produit par la macro de classification des oligodendrocytes et parcourir l'ensemble des fichiers csv correspondant au même puits pour les concaténer en un fichier csv avant d'être analysé et récupérer les pourcentages d'oligodendrocytes pour chaque classe. 

Le répertoire contenant les fichiers au format csv à analyser est ouvert et l'ensemble des fichiers csv sont récupérés dans la liste **csv_files**. Une liste vide **all_puits** est créée. Parcourir la liste csv_files et utiliser le nom du fichier pour récupérer le nom du puits, *Exemple: le fichier se nomme img1_A01.csv alors les caractères A01 sont récupérés*. Vérifier si le nom du puits est présent dans la liste **all_puits**,dans le cas contraire l'ajouter à la liste. La fonction *print("message")* permet d'afficher un message à l'utilisateur, ici nous affichons la liste des puits qui est à analyser *Exemple : ['A01','A04', 'B01' ].* 

Parcourir la liste **all_puits** d'abord le puits *A01* puis le puits *A04* etc. et parcourir en même temps la liste **csv_files** contenant l'ensemble des fichiers csv. Vérifier que le nom du puits Vérifier que le nom du puits qui est en train d'être parcouru *exemple A01* correspond à celui inscrit sur le nom du fichier csv comme img1_A01.csv. Dans ce cas ouvrir le fichier csv, si le ce fichier est vide avertir l'utilisateur via un message sinon vérifier que c'est le premier fichier csv ouvert correspondant à ce puits et crée un data frame sinon l'ajouter au data frame existant. A partir ce data frame contenant à présent l'ensemble des données d'un même puits l'enregistrer dans un fichier au format csv et supprimer les autres fichiers. Nous venons de concaténer les fichiers csv par exemple du puits A01 en un seul fichier csv dont le nom du fichier csv est *A01_save*. 

Sur se data frame récupérer la colonne *# branches* pour récupérer le nombre de branches inférieur à 150, entre 150 et 300, entre 300 et 450 et le nombre de branches supérieures à 450. Calculer le pourcentage correspondant et pour chacun ajouter à la liste correspondante. *Exemple le nombre de branche inférieur à 150 est ajouté à la liste **in150**, le nombre de branches entre 150 et 300 est ajouté à la liste **entre150_300** et de même pour les autres classes*. Ajouter le nom du puits analyser à la liste **index_classification**. Ces étapes décrites sont réaliser pour chaque puits et le pourcentage d'oligodendrocytes pour chaque classe et dimension du data frame  est affiché pour chaque puits. La data frame produit pour un puits est ensuite supprimer lors que valeurs nécessaire sont extraites pour produire un nouveau data frame pour un autre puits. Les listes **in150, entre150_300, entre300_450, sup450 et index_classification** sont affichés.


In [11]:
# Initialisation
inf150 = []
entre150_300 = []
entre300_450 = []
sup450 = []

# Légende: les puits analysé
index_classification = []

In [12]:
# Récupérer l'ensemble des fichiers csv produit à l'étape précèdente (Exemple A01_save.csv, A04_save.csv etc.)
csv_regex = os.path.join(csv_dir.replace("\\", "/"), "*.csv") # Une chaîne de caractère contenant nom des fichiers à sélectionner
csv_files = glob.glob(csv_regex) # Liste de l'ensemble des fichiers CSV

# Parcourt les fichiers csv produit à l'étape précèdente
for csv in csv_files:
    
    # Nom du puits
    puits = csv[-12:-9] 
    # Ajouter le puits analyser
    index_classification.append(puits)
    
    # Ouvrir le fichier csv si celui ci est vide un message apparaît
    try :
        df = pd.read_csv(csv)
    except:
        print(f"Ce fichier est vide :  {csv}") 
                
    # La caractéristique nombre de branches est analysé et divisé en 4 classes
    cluster1 = df[df['# Branches'] < 150]
    cluster2 = df[(df['# Branches'] >= 150) & (df['# Branches'] < 300)]
    cluster3 = df[(df['# Branches'] >= 300) & (df['# Branches'] < 450)]
    cluster4 = df[df['# Branches'] >= 450]

    # % d'oligodendrocytes pour chaque classe
    oligo_total = df.shape[0] # Nombre total d'oligodendrocytes dans le puits
    value1 = (cluster1.shape[0]/oligo_total)*100 # avec moins de 150 branches
    value2 = (cluster2.shape[0]/oligo_total)*100 # entre 150 et 300 branches
    value3 = (cluster3.shape[0]/oligo_total)*100 # entre 300 et 450 branches
    value4 = (cluster4.shape[0]/oligo_total)*100 # avec plus de 450 branches
    
    # Ajouter ces pourcentage aux listes correspondantes
    inf150.append(value1)
    entre150_300.append(value2)
    entre300_450.append(value3)
    sup450.append(value4)

    # AFFICHAGE
    #Dimension du data frame et pourcentage de chaque classe d'oligodendrocytes
    print(f"\nPuits {puits} : \nDimension totale du data frame : {df.shape} : Il y a {df.shape[0]} oligodendrocytes dans ce puits. Il y a {df.shape[1]} caractéristiques étudiées sur ces oligodendrocytes")
    print(f"Pourcentage d'oligodendrocytes par cluster pour le puits {name}") 
    print(f"<150 : {value1:.2f} %\nentre 150 et 300 : {value2:.2f}%\nentre 300 et 450 : {value3:.2f}%\n>450 : {value4:.2f}%")
    
    # Affichage
    df.drop(df.index[::], inplace=True) # Supprimer le dataframe


Puits A01 : 
Dimension totale du data frame : (6195, 14) : Il y a 6195 oligodendrocytes dans ce puits. Il y a 14 caractéristiques étudiées sur ces oligodendrocytes
Pourcentage d'oligodendrocytes par cluster pour le puits H10
<150 : 74.51 %
entre 150 et 300 : 21.97%
entre 300 et 450 : 2.74%
>450 : 0.77%

Puits A04 : 
Dimension totale du data frame : (4132, 14) : Il y a 4132 oligodendrocytes dans ce puits. Il y a 14 caractéristiques étudiées sur ces oligodendrocytes
Pourcentage d'oligodendrocytes par cluster pour le puits H10
<150 : 94.26 %
entre 150 et 300 : 5.66%
entre 300 et 450 : 0.07%
>450 : 0.00%

Puits A07 : 
Dimension totale du data frame : (3928, 14) : Il y a 3928 oligodendrocytes dans ce puits. Il y a 14 caractéristiques étudiées sur ces oligodendrocytes
Pourcentage d'oligodendrocytes par cluster pour le puits H10
<150 : 95.29 %
entre 150 et 300 : 4.58%
entre 300 et 450 : 0.10%
>450 : 0.03%

Puits A10 : 
Dimension totale du data frame : (3901, 14) : Il y a 3901 oligodendrocyte


Puits H10 : 
Dimension totale du data frame : (3624, 14) : Il y a 3624 oligodendrocytes dans ce puits. Il y a 14 caractéristiques étudiées sur ces oligodendrocytes
Pourcentage d'oligodendrocytes par cluster pour le puits H10
<150 : 97.54 %
entre 150 et 300 : 2.37%
entre 300 et 450 : 0.08%
>450 : 0.00%


## Production du dataframe de la classification des oligodendrocytes
Ce data frame regroupe les informations sur pourcentage d'oligodendrocytes pour chaque classe inférieur à 150 branches, entre 150 et 300 branches, entre 300 et 450 branches et supérieure à 450 branches. En lignes sont représentés les puits et en colonne ces caractéristiques.

In [13]:
# Production du dataframe
data_result_classification = pd.DataFrame({'% <=150': inf150,
                   '% entre 150 et 300': entre150_300,
                   '% entre 300 et 450': entre300_450,
                   '% >=450':sup450,
                  }, index=index_classification)

# Sauvegarde du data frame au format csv
data_result_classification.to_csv(os.path.join(rep_result_classification, name_result_classification+".csv")) # A modifier nom et rep

# Visualisation du data frame
data_result_classification

Unnamed: 0,% <=150,% entre 150 et 300,% entre 300 et 450,% >=450
A01,74.511703,21.96933,2.744149,0.774818
A04,94.264279,5.663117,0.072604,0.0
A07,95.290224,4.582485,0.101833,0.025458
A10,94.309151,5.306332,0.256345,0.128172
B01,89.429905,8.683303,0.994116,0.892676
B04,94.743398,5.032387,0.149477,0.074738
B07,93.831246,5.719688,0.354526,0.09454
B10,94.507898,5.346294,0.145808,0.0
C01,85.222437,13.268859,1.276596,0.232108
C04,92.59676,7.110711,0.247525,0.045005
