# Comparaison du traitement sur plusieurs fichiers

Ce fichier permet de facilement parcourir un dossier de chromatogrammes pour vérifier leur intégrité, et trier les différents cas.

Pour parcourir les données, il est possible de changer la variable `PATH` qui contient le chemin du dossier qui nous intéresse, `nb_plot` qui contient le nombre de chromatogrammes qui seront affichés en même temps et `start` qui contient l'indice du premier chromatogramme affiché.

In [1]:
from os import listdir
from os.path import join
import plotly.graph_objects as go
from plotly.subplots import make_subplots

import tools
from importlib import reload
reload(tools)

PATH = '../data/all-data/'
nb_plot = 10
start = 0

Comparaison de données brutes avec les données traitées sur `nb_plot` exemples :

In [2]:
files = [f for f in listdir(PATH) if (f.endswith(tools.CHROM_EXT) or f.endswith(tools.CHROM_EXT.upper()))]
print('Nombre de fichier détectés : ', len(files))

i=0
for file in files[start:start+nb_plot]:
    file_path = join(PATH, file) # on récupère le chemin relatif du fichier
    print(file)
    df = tools.readCSV(file_path)  # données brutes
    # réduction de l'intervalle
    df = df.drop(df[df.index > tools.INTERVAL[1]].index)
    df = df.drop(df[df.index < tools.INTERVAL[0]].index)
    try:
        dt = tools.readAndAdaptDataFromCSV(PATH, file[: -17]) # données traitées
    except tools.ReadDataException as e:
        print(e)
        continue
    newdf = dt.df
    #df = tools.alignSpikes(df, dt.spikes[0:4])
    print(dt.spikes)
    dt.printProblems()
    print(len(newdf))
    fig = make_subplots(rows = 2, cols=1, subplot_titles=['Avant traitement', 'Après traitement'])
    fig.add_trace(go.Scatter(x=df.index, y=df["values"], mode='lines'), row=1, col=1)
    fig.add_trace(go.Scatter(x=newdf.index, y=newdf["values"], mode='lines'), row=2, col=1)
    fig.update_layout(height=600, width=1000, title_text="Résultat du traitement pour " + file_path)
    fig.show()
    i+=1

Nombre de fichier détectés :  1366
0-chromatogram.csv
[7.18, 22.796, 24.032, 38.812, 10.203, 12.705, 17.489, 19.264, 19.884, 21.722, 22.407, 24.677, 29.737, None, None, 21.782]

505


1-chromatogram.csv
[7.186, 22.783, 24.023, 38.837, None, None, 17.457, None, 19.856, 20.283, None, None, 29.744, None, None, None]
La molécule 3 methyl-glutaconique est présente à 39 % du pic de référence à 20.283 minutes
La molécule Acide 3CH3-Glutarique est présente à 22 % du pic de référence à 19.856 minutes

504


10-chromatogram.csv
[6.558, 22.121, 23.35, 38.168, 9.538, 12.014, 16.81, 18.594, 19.213, 21.056, 21.733, 23.875, 29.07, None, None, 21.222]
La molécule Acide Lactique est présente à 495 % du pic de référence à 6.558 minutes

505


100-chromatogram.csv
[7.093, 22.703, 23.924, 38.755, 10.095, 12.607, None, 19.153, 19.774, 21.594, 22.285, 24.442, 29.649, None, None, 22.703]
La molécule Acide Homovanillique est présente à 29 % du pic de référence à 29.649 minutes

504


1000-chromatogram.csv
[5.77, 21.181, 22.414, 37.25, 8.682, 11.15, 15.928, 17.71, 18.33, 18.742, 20.826, 22.957, 28.139, None, None, None]

505


1001-chromatogram.csv
[5.771, 21.181, 22.413, 37.252, 8.683, 11.156, 15.92, 17.713, 18.33, 18.736, 20.825, 22.95, 28.136, None, None, None]
La molécule Acide Lactique est présente à 307 % du pic de référence à 5.771 minutes

504


1002-chromatogram.csv
[5.769, 21.182, 22.419, 37.254, 8.691, 11.158, 15.927, 17.707, 18.337, 18.749, 20.833, 22.962, 28.142, None, None, None]
La molécule 3 methyl-glutaconique est présente à 19 % du pic de référence à 18.749 minutes

505


1003-chromatogram.csv
[6.464, 21.978, 23.204, 38.0, 9.445, 11.933, 16.688, 18.476, 19.066, 20.919, 21.586, 23.705, 28.918, None, None, None]

505


1004-chromatogram.csv
[7.004, 22.607, 23.83, 38.672, 9.996, 12.487, 17.276, 19.055, 19.671, 20.098, 22.194, 24.308, 29.552, None, None, None]

504


1005-chromatogram.csv
[6.469, 21.979, 23.207, 38.006, 9.439, 11.922, 16.688, 18.467, 19.101, 20.924, 21.594, 23.756, 28.922, None, None, 21.006]

505
