# <span style="font-size: 24px;">Code Python pour analyse des données de l'étuve</span>

#### Installation et importation des modules

In [None]:
!pip install pandas numpy chart-studio cufflinks seaborn plotly ipywidgets termcolor

In [1]:
import pandas as pd
import numpy as np
import chart_studio.plotly as py
import cufflinks as cf
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
import ipywidgets
%matplotlib inline
from termcolor import colored
from IPython.display import clear_output

# Permet à plotly de fonctionner sur Jupyter Notebook
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
init_notebook_mode(connected=True)
# Utiliser Plotly localement
cf.go_offline()

In [2]:
# Fonction pour mettre du texte en gras
def gras(chaine):
    chaine = "\033[1m"+chaine+"\033[0m"
    return chaine

#### Importation du fichier

In [3]:
#importer le fichier (les 7 premières lignes sont inutiles)
data = pd.read_csv("fichierSource.txt",skiprows=range(7),delimiter='	',header=None)
data.columns=["capteur","temps","temperature"]

# Enlever la dernière ligne qui contient : ***End of data***
data = data.drop(data.index[-1])

#Enlever les deux caractères avant le nom du capteur (espace et double côte)
data["capteur"] = data["capteur"].str[2:]

# Utiliser pivot pour remodeler le DataFrame
pivot_df = data.pivot(index='temps', columns='capteur', values='temperature')

pivot_df

capteur,S01,S02,S03,S04,S05,S06,S07,S08,S09,S10,...,S12,S13,S14,S15,S16,S17,S18,S19,S20,S21
temps,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
0.0,29.9,29.9,22.1,22.0,167.0,29.9,22.1,29.9,29.8,30.0,...,29.9,30.0,30.0,30.0,30.0,22.2,21.3,30.0,29.8,22.5
0.1,29.9,29.9,22.1,22.0,167.0,29.9,22.1,29.9,29.8,30.0,...,29.9,30.0,30.0,30.0,30.0,22.2,21.3,30.0,29.8,22.5
0.3,29.9,29.9,22.1,22.1,167.0,29.9,22.1,29.9,29.8,30.0,...,29.9,30.0,30.0,30.0,30.0,22.2,21.4,30.1,29.8,22.5
0.5,29.9,29.9,22.1,22.1,167.0,29.9,22.1,29.9,29.8,30.0,...,29.9,30.0,30.0,30.0,30.0,22.2,21.4,30.1,29.9,22.5
0.7,29.9,29.9,22.1,22.1,167.0,29.9,22.1,29.9,29.8,30.0,...,29.9,30.0,30.0,30.0,30.0,22.2,21.4,30.1,29.9,22.4
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2055.0,4.5,4.0,22.3,22.2,167.0,4.3,22.2,3.7,3.8,4.4,...,3.8,4.4,3.9,3.9,4.5,22.3,21.5,4.1,4.0,22.6
2055.2,4.5,4.0,22.3,22.2,167.0,4.3,22.1,3.7,3.8,4.4,...,3.8,4.3,3.9,3.9,4.5,22.3,21.4,4.1,4.0,22.6
2055.4,4.5,4.0,22.3,22.2,167.0,4.3,22.1,3.8,3.8,4.4,...,3.8,4.4,3.9,3.9,4.5,22.3,21.4,4.2,4.0,22.6
2055.6,4.5,4.0,22.3,22.2,167.0,4.3,22.2,3.8,3.8,4.4,...,3.8,4.3,3.9,3.9,4.5,22.3,21.4,4.1,4.0,22.6


In [5]:
df_criteres = pd.read_csv("CritereEtape.csv")
df_criteres



Unnamed: 0,T-2.5%,Tconsigne,"T+2,5%"
etape 1,19.5,20,20.5
etape 2,36.08,37,37.93
etape 3,92.63,95,97.38
etape 4,11.7,12,12.3
etape 5,3.9,4,4.1
etape 6,19.5,20,20.5
etape 7,36.08,37,37.93
etape 8,92.63,95,97.38
etape 9,11.7,12,12.3
etape 10,3.9,4,4.1


#### Associer les capteurs à leur position

In [6]:
dictionnaire = {
    "S01": "A1",
    "S02": "D1",
    "S06": "A4",
    "S08": "E4",
    "S09": "H4",
    "S10": "A7",
    "S11": "D7",
    "S12": "H7",
    "S13": "A10",
    "S14": "E10",
    "S15": "H10",
    "S16": "A12",
    "S19": "D12",
    "S20": "H12",
}


#### Mapping des lettres aux coordonnées

In [7]:
lettres_vers_x = {
    "A": 1,
    "B": 2,
    "C": 3,
    "D": 4,
    "E": 5,
    "F": 6,
    "G": 7,
    "H": 8
}


In [8]:
#Transformer les coordonées des cellules en x,y
coordonnees_x_y = {}
for cle, valeur in dictionnaire.items():
    x, y = lettres_vers_x[valeur[0]], int(valeur[1:])
    coordonnees_x_y[cle] = [x, y]
coordonnees_x_y

{'S01': [1, 1],
 'S02': [4, 1],
 'S06': [1, 4],
 'S08': [5, 4],
 'S09': [8, 4],
 'S10': [1, 7],
 'S11': [4, 7],
 'S12': [8, 7],
 'S13': [1, 10],
 'S14': [5, 10],
 'S15': [8, 10],
 'S16': [1, 12],
 'S19': [4, 12],
 'S20': [8, 12]}

#### Associer chaque capteur à ses coordonnées dans le dataframe

In [9]:
data['coordonnees'] = data['capteur'].map(coordonnees_x_y)
data

Unnamed: 0,capteur,temps,temperature,coordonnees
0,S01,0.0,29.9,"[1, 1]"
1,S01,0.1,29.9,"[1, 1]"
2,S01,0.3,29.9,"[1, 1]"
3,S01,0.5,29.9,"[1, 1]"
4,S01,0.7,29.9,"[1, 1]"
...,...,...,...,...
212872,S21,2055.0,22.6,
212873,S21,2055.2,22.6,
212874,S21,2055.4,22.6,
212875,S21,2055.6,22.6,


#### Gestion des capteurs non référencés

In [10]:
# Mettre les coordonnées dans deux colonnes distinctes x et y (pour les capteurs non associés on vérifie si les coordonnées sont bien une liste)
data["x"] = data["coordonnees"].apply(lambda x: x[0] if isinstance(x, list) else x)
data["y"] = data["coordonnees"].apply(lambda x: x[1] if isinstance(x, list) else x)
data

Unnamed: 0,capteur,temps,temperature,coordonnees,x,y
0,S01,0.0,29.9,"[1, 1]",1.0,1.0
1,S01,0.1,29.9,"[1, 1]",1.0,1.0
2,S01,0.3,29.9,"[1, 1]",1.0,1.0
3,S01,0.5,29.9,"[1, 1]",1.0,1.0
4,S01,0.7,29.9,"[1, 1]",1.0,1.0
...,...,...,...,...,...,...
212872,S21,2055.0,22.6,,,
212873,S21,2055.2,22.6,,,
212874,S21,2055.4,22.6,,,
212875,S21,2055.6,22.6,,,


#### Création du dataframe pour réaliser le graphique

In [11]:
# Retirer la colonne coordonnées car on a maintenant deux colonnes distinctes avec x et y
dfGraph = data.drop(['coordonnees'], axis=1)

# Stocker les capteurs non associés
capteurNonAssoc = dfGraph[dfGraph.isnull().any(axis=1)]

# Colonnes sans NaN (à commenter si on veut garder les capteurs non référencés)
dfGraph = dfGraph[~dfGraph.isnull().any(axis=1)]


# Associer le capteur S20 à S20a qui est le nom donné dans le fichier Excel
dfGraph["capteur"][dfGraph["capteur"]=="S20"] = "S20a"


print(capteurNonAssoc["capteur"].unique())

['S03' 'S04' 'S05' 'S07' 'S17' 'S18' 'S21']


#### Top 8 des périodes avec le plus de capteurs préoccupants

In [12]:
# Diviser les données en intervalles de temps (à changer selon le besoin)
intervalle_temps = 10 
dfGraph['periode'] = (dfGraph['temps'] // intervalle_temps) * intervalle_temps

# Calculer la moyenne par capteur
dfAggr = dfGraph.groupby(['periode', 'capteur']).agg({'x': 'mean', 'y': 'mean', 'temperature': 'mean'}).reset_index()

# Différence à la moyenne
dfAggr['Différence à la moyenne'] = dfAggr.groupby('periode')['temperature'].transform(lambda x: x - x.mean())

# Identifier les capteurs préoccupants
dfAggr['preoccupant'] = abs(dfAggr['Différence à la moyenne']) > 0.5

# Calculer le nombre de capteurs préoccupants par période
preoccupant_count = dfAggr.groupby('periode')['preoccupant'].sum()

# Top 8 des périodes
top_8_periods = preoccupant_count.nlargest(8)

# Convertir le top 8 des périodes en un DataFrame
df_top_8_periods = top_8_periods.reset_index()
df_top_8_periods.columns = ['Temps (en secondes)', 'Nombre de capteurs préoccupants']

# Afficher le top 8
print(gras("Top 8 des périodes de "+str(intervalle_temps)+ " sec avec le plus grand nombre de capteurs préoccupants :"))
display(df_top_8_periods)

[1mTop 8 des périodes de 10 sec avec le plus grand nombre de capteurs préoccupants :[0m


Unnamed: 0,Temps (en secondes),Nombre de capteurs préoccupants
0,350.0,9
1,970.0,9
2,1590.0,8
3,1600.0,8
4,340.0,7
5,360.0,6
6,960.0,6
7,1580.0,6


#### Cartographie de la température des capteurs en fonction du temps

In [13]:
print(colored("Il est possible de cliquer sur le curseur, puis de faire défiler avec les flèches","blue"))
def plot_fct(temps=0):
    
    # Filtrer le dataframe en fonction de la valeur du curseur (+/- 10 secondes)
    dfUtilise = dfGraph[(dfGraph["temps"] >= (temps - 10)) & (dfGraph["temps"] <= (temps + 10))]
    
    # Calculer la moyenne par capteur des 20 secondes filtrées (on garde les coordonnées)
    dfAggr = dfUtilise.groupby("capteur").agg({"x": "mean", "y": "mean", "temperature": "mean"}).reset_index()

    # Arrondir la température à deux décimales
    dfAggr['temperature'] = dfAggr['temperature'].round(2)

    # Créer le graphique avec un titre interactif
    if temps > 10:
        titre = f"Température moyenne des capteurs dans l'intervalle [{round(temps - 10, 2)} sec, {round(temps + 10, 2)} sec]"
    else:
        titre = "Température moyenne des capteurs dans les "+ str(temps+10)+" premières secondes"
    
    fig = px.scatter(dfAggr, x="x", y="y", color="temperature", hover_name="capteur", title=titre)
    
    # Utiliser des carrés comme grille
    fig.update_layout(yaxis_scaleanchor="x")

    # Définir les limites de l'axe x et y
    x_min, x_max = 0, 9
    y_min, y_max = 0, 13
    
    # Ajouter un rectangle en utilisant les annotations pour délimiter les limites
    fig.add_shape(
        go.layout.Shape(
            type="rect",
            x0=x_min,
            y0=y_min,
            x1=x_max,
            y1=y_max,
            line=dict(color="#616161", width=3),  # Couleur et épaisseur du contour
        )
    )

    # Définir un pas de 1 pour les axes
    fig.update_yaxes(dtick=1)
    fig.update_xaxes(dtick=1)

    # Cacher les étiquettes des axes x et y, ainsi que les titres
    fig.update_xaxes(showticklabels=False, title=None)
    fig.update_yaxes(showticklabels=False, title=None)

    # Modifier la taille des points
    fig.update_traces(marker=dict(size=15))

    # Définir la couleur de l'arrière-plan du graphique
    fig.update_layout(plot_bgcolor='#EFEFEF')

    # Afficher le graphique
    fig.show()

    #==================================================================================================================================================#
    ######################################################### Afficher le tableau (bouton) #############################################################
    #==================================================================================================================================================#

    def montrerTable(b): # Fonction pour afficher le tableau lorsque le bouton est cliqué
        with output:
            clear_output()  # Effacez le tableau précédent
            display(dfAggr[['capteur', 'temperature']])
            
    
    
    # Créer un bouton pour demander l'affichage du tableau
    button = ipywidgets.Button(description="Afficher le tableau des données",layout=ipywidgets.Layout(width='300px', height='40px'))

    # Créer une sortie pour afficher le tableau
    output = ipywidgets.Output()

    
    # Ajouter une annotation pour la température maximale, minimale et la moyenne
    tmax = round(dfAggr['temperature'].max(), 2)
    tmin = round(dfAggr['temperature'].min(), 2)
    tmoyenne = round(dfAggr['temperature'].mean(), 2)
    tect = round(dfAggr['temperature'].std(), 2)
    
    print("Max : " + gras(str(tmax) + "°C"))
    print("Min : " + gras(str(tmin) + "°C"))
    print("Moyenne : " + gras(str(tmoyenne) + "°C"))
    print("Ecart-type : " + gras(str(tect) + "°C"))
    
    # Afficher le bouton pour montrer le tableau
    display(button)  
    
    # Afficher le tableau ou non
    display(output)  
    button.on_click(montrerTable)



# Créer un widget interactif pour ajuster la valeur de temps
ipywidgets.interact(plot_fct, temps=(0, int(dfGraph['temps'].max()), 15),description = "sec")


[34mIl est possible de cliquer sur le curseur, puis de faire défiler avec les flèches[0m


interactive(children=(IntSlider(value=0, description='temps', max=2055, step=15), Output()), _dom_classes=('wi…

<function __main__.plot_fct(temps=0)>

#### Cartographie de la Différence de température à la moyenne

In [14]:
#########################################################################################################################################################
#================================================== Différence à la moyenne à la moyenne =============================================================#
#########################################################################################################################################################
print(colored("Il est possible de cliquer sur le curseur, puis de faire défiler avec les flèches","blue"))

# Diviser les données en intervalles de temps (à changer selon le besoin)
intervalle_temps = 10 
dfGraph['periode'] = (dfGraph['temps'] // intervalle_temps) * intervalle_temps


def plot_fct(temps=0):
    # Filtrer le dataframe en fonction de la valeur du curseur (+/- 10 secondes)
    dfUtilise = dfGraph[(dfGraph["periode"] == temps)]

    # Calculer la moyenne par capteur des 20 secondes filtrées 
    dfAggr = dfUtilise.groupby("capteur").agg({"x": "mean", "y": "mean", "temperature": "mean"}).reset_index()


    # Arrondir la température à deux décimales
    dfAggr['temperature'] = dfAggr['temperature'].round(2)
    
    #Faire les différences à la moyenne
    dfAggr["Différence à la moyenne"] = round(dfAggr["temperature"]-dfAggr['temperature'].mean(),3)
    
   #Changer le titre dynamiquement avec le curseur
    if temps > 10:
        titre = f"Différence de température à la moyenne dans l'intervalle : [{round(temps - intervalle_temps, 2)} sec; {round(temps + intervalle_temps, 2)} sec]"
    else:
        titre = "Différence de température à la moyenne dans les "+str(temps+10)+" premières secondes"
        
    # Créer le graphique 
    fig = px.scatter(dfAggr, x="x", y="y",
                     color="Différence à la moyenne",
                     hover_name="capteur",
                     # Afficher seulement température et différence à la moyenne quand on passe la souris sur un point
                     hover_data={"temperature": True, "Différence à la moyenne": True,"x":False,"y":False},
                     title=titre,
                     color_continuous_scale='picnic',
                    )

    # Utiliser des carrés comme grille
    fig.update_layout(yaxis_scaleanchor="x")

    
    # Ajouter un rectangle en utilisant les annotations pour délimiter les limites
    fig.add_shape(
        go.layout.Shape(
            type="rect",
            x0=0,
            y0=0,
            x1=9,
            y1=13,
            line=dict(color="#616161", width=3),  # Couleur et épaisseur du contour
        )
    )

    # Définir un pas de 1 pour les axes
    fig.update_yaxes(dtick=1)
    fig.update_xaxes(dtick=1)

    # Cacher les étiquettes des axes x et y, les titres et la grille
    fig.update_xaxes(showticklabels=False, title=None)
    fig.update_yaxes(showticklabels=False, title=None)

    # Modifier la taille des points
    fig.update_traces(marker=dict(size=15))

    # Définir la couleur de l'arrière-plan du graphique
    fig.update_layout(plot_bgcolor='#EFEFEF')

    # Calculer la moyenne des températures
    moyenne_temperature = dfAggr['temperature'].mean()
    
    # afficher la moyenne sur le graphique
    annotation = go.layout.Annotation(
        text=f'Moyenne des températures : {moyenne_temperature:.2f}°C', #Arrondi à deux chiffres
        xref='paper',
        yref='paper',
        x=1,  
        y=1, 
        showarrow=False,
        font=dict(size=14, color='red'),  # Ajustez la taille et la couleur du texte
    )
    
    # Ajouter l'annotation au graphique
    fig.add_annotation(annotation)



    #==================================================================================================================================================#
    ################################################# Afficher les capteurs préoccupants ###############################################################
    #==================================================================================================================================================#
    # Colonne préocuppant si une température est 0,5 degrès supérieure ou inférieure à la moyenne 
    dfAggr["preoccupant"] = abs(dfAggr["Différence à la moyenne"]) > 0.5 # valeur à changer selon les normes

    # Filtrer les capteurs préoccupants dans un df
    capteurs_preoccupants = dfAggr[dfAggr["preoccupant"]]

    # Afficher le tableau des capteurs préoccupants
    if len(capteurs_preoccupants)>1:
        print(colored(str(len(capteurs_preoccupants))+" capteurs préoccupants :","red"))
        display(capteurs_preoccupants[['capteur', 'temperature',"Différence à la moyenne",'preoccupant']])
        
    elif len(capteurs_preoccupants)==1:
        print(colored("1 capteur préoccupant :","yellow"))
        display(capteurs_preoccupants[['capteur', 'temperature',"Différence à la moyenne",'preoccupant']])
        
    else:
        print(colored("Aucun capteur préoccupant","green"))

    #==================================================================================================================================================#
    ################################################### Afficher le graphique ##########################################################################
    #==================================================================================================================================================#
    
    print("\n",colored("Astuce : passer la souris sur les points pour voir le capteur et sa différence température à la moyenne","blue"))
    fig.show()

    #==================================================================================================================================================#
    ######################################################### Afficher le tableau (bouton) #############################################################
    #==================================================================================================================================================#

    def montrerTable(b): # Fonction pour afficher le tableau lorsque le bouton est cliqué
        with output:
            clear_output()  # Effacez le tableau précédent
            display(dfAggr[['capteur', 'temperature', "Différence à la moyenne", 'preoccupant']])
            
    # Créer un bouton pour demander l'affichage du tableau
    button = ipywidgets.Button(description="Afficher le tableau des données",layout=ipywidgets.Layout(width='300px', height='40px'))

    # Créer une sortie pour afficher le tableau
    output = ipywidgets.Output()

    # Ajouter une annotation pour la température maximale, minimale et la moyenne ("\033[1m" et "\033[0m" pour mettre en gras)
    
    difference_max = dfAggr['Différence à la moyenne'].max()
    difference_min = dfAggr['Différence à la moyenne'].min()
    difference_moyenne = round(dfAggr['Différence à la moyenne'].mean(), 2)
    
    print(gras("\nIndicateurs des différences de températures à la moyenne"))
    print("Max : " + gras(str(difference_max) + "°C"))
    print("Min : " + gras(str(difference_min) + "°C"))
    
    # Afficher le bouton pour montrer le tableau
    display(button)  
    
    # Afficher le tableau ou non
    display(output)  
    button.on_click(montrerTable)
    


# Créer un widget interactif pour ajuster la valeur du temps => temps = (min,max,pas)
ipywidgets.interact(plot_fct, temps=(0,int(dfGraph['temps'].max()) , intervalle_temps))




[34mIl est possible de cliquer sur le curseur, puis de faire défiler avec les flèches[0m


interactive(children=(IntSlider(value=0, description='temps', max=2055, step=10), Output()), _dom_classes=('wi…

<function __main__.plot_fct(temps=0)>