<h1 style="color:#000000;">Projet PoC – Machine learning-based approach for online fault diagnosis of Discrete Event System</h1>

<h2 style="color:red;">I. Introduction au problème et à sa modélisation</h2>
<p>
L’objectif de ce projet est de mettre en place un système capable de <b>détecter et classifier automatiquement des pannes</b>
dans un processus industriel à partir de signaux provenant de capteurs et d’actionneurs.
</p>
<p>
Le problème est formulé comme une <b>classification multi-classes</b> où chaque séquence temporelle
d’observations est associée à une classe <code>fault_class</code> (C0 à C7).
</p>
<p>
Le modèle retenu est un réseau de neurones récurrent de type <b>LSTM (Long Short-Term Memory)</b>,
adapté à l’analyse de données séquentielles.
</p>

<h2 style="color:red;">II. Critères d’évaluation de la solution</h2>
<ul>
  <li><b>Accuracy</b> : taux global de classification correcte</li>
  <li><b>Loss</b> : mesure de l’erreur pendant l’entraînement</li>
  <li><b>Matrice de confusion</b> : visualisation des erreurs par classe</li>
</ul>

<h2 style="color:red;">III. Présentation du jeu de données</h2>
<p>
Le jeu de données est composé de scénarios simulés représentant :
</p>
<ul>
  <li>Un fonctionnement normal (Classe 0)</li>
  <li>Plusieurs types de pannes (Classes 1 à 7)</li>
</ul>

<p>Chaque observation contient :</p>
<ul>
  <li><b>sensor_start</b> : état du capteur de départ</li>
  <li><b>sensor_end</b> : état du capteur de fin</li>
  <li><b>actuator_conveyor</b> : état du moteur</li>
  <li><b>duration_ms</b> : durée de l’événement</li>
  <li><b>fault_class</b> : type de panne</li>
</ul>


<h2 style="color:red;">IV. Modélisation du problème </h2>
<h3 style="color: green;">1. pseudo-code 1</h3>

<ol>
  <li><b>Configuration</b>
    <ul>
      <li>Définir les variables : <code>FEATURES</code> et <code>TARGET</code></li>
      <li>Créer le dossier de sortie et le fichier Excel</li>
    </ul>
  </li>

  <li><b>Fonctions principales</b>
    <ul>
      <li><b>base_state()</b> : initialise un état avec toutes les valeurs à zéro</li>
      <li><b>create_event()</b> : crée un nouvel événement à partir de l’état précédent</li>
      <li><b>generate_sequence()</b> : génère une séquence d’événements (normale ou en panne)</li>
    </ul>
  </li>

  <li><b>Programme principal</b>
    <ul>
      <li>Générer plusieurs séquences normales</li>
      <li>Générer plusieurs séquences de pannes</li>
      <li>Concaténer toutes les données</li>
    </ul>
  </li>

  <li><b>Export</b>
    <ul>
      <li>Conversion des données en DataFrame</li>
      <li>Sauvegarde dans un fichier Excel</li>
      <li>Affichage du résumé des données générées</li>
    </ul>
  </li>
</ol>

<p><b>FIN</b></p>

<h3 style="color: green;">2. Complexité en temps et en mémoire</h3>


<h4> Nombre total de lignes générées</h4>

<p>On note <b>M</b> = nombre total d’événements (lignes).</p>

<ul>
  <li><b>Classe 0 (normal)</b> : une séquence = <b>7</b> événements → total = <code>7 × N_NORMAL</code></li>
  <li><b>Pannes C1 à C6</b> : par itération de <code>N_FAULT</code>, total = <b>35</b> événements → total = <code>35 × N_FAULT</code></li>
  <li><b>Classe 7 (aléatoire)</b> : une séquence = <code>steps = S</code> événements → total = <code>S × N_FAULT</code></li>
</ul>

<p><b>Formule :</b></p>
<p style="margin-left:10px;">
  <code>M = 7·N_NORMAL + N_FAULT·(35 + S)</code>
</p>

<p><b>Avec tes valeurs</b> : <code>N_NORMAL=70</code>, <code>N_FAULT=70</code>, <code>S=10</code></p>

<table border="1" cellpadding="6" style="border-collapse:collapse;">
  <thead>
    <tr>
      <th>Partie</th>
      <th>Calcul</th>
      <th>Lignes</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>Classe 0</td>
      <td><code>70 × 7</code></td>
      <td><b>490</b></td>
    </tr>
    <tr>
      <td>Pannes C1..C6</td>
      <td><code>70 × 35</code></td>
      <td><b>2450</b></td>
    </tr>
    <tr>
      <td>Classe 7</td>
      <td><code>70 × 10</code></td>
      <td><b>700</b></td>
    </tr>
    <tr>
      <td><b>Total</b></td>
      <td></td>
      <td><b>3640</b></td>
    </tr>
  </tbody>
</table>



<h4> Complexité en temps (Time)</h4>
<p>
  Le code fait un travail “similaire” pour chaque ligne créée + DataFrame + Excel.
  Donc le temps grandit comme le nombre de lignes.
</p>
<p style="margin-left:10px;">
  <b>Temps :</b> <code>O(M)</code>
</p>
<p><i>Si tu doubles le nombre de lignes, le temps double (en gros).</i></p>


<h4>Complexité mémoire (Space)</h4>
<p>
  Le code stocke toutes les lignes dans <code>all_data</code> puis dans <code>df</code>.
  Donc la mémoire grandit aussi comme le nombre de lignes.
</p>
<p style="margin-left:10px;">
   <b>Mémoire :</b> <code>O(M)</code>
</p>
<p><i>Si tu doubles le nombre de lignes, la RAM nécessaire double (en gros).</i></p>



<h2 style="color:red;">V. Scénarios simulés</h2>
<ul>
  <li><b>C0</b> : fonctionnement normal</li>
  <li><b>C1</b> : capteur de fin bloqué</li>
  <li><b>C2</b> : capteur de départ inactif</li>
  <li><b>C3</b> : moteur bloqué</li>
  <li><b>C4</b> : capteur de départ bloqué</li>
  <li><b>C5</b> : capteur de fin inactif</li>
  <li><b>C6</b> : moteur ne démarre jamais</li>
  <li><b>C7</b> : panne aléatoire</li>
</ul>





<h3 style="color: green;">1. Importation des bibliothèques nécessaires</h3>

In [74]:
import pandas as pd          # Importation de pandas pour manipuler les DataFrames et lire/écrire les fichiers Excel
import numpy as np           # Importation de numpy pour les opérations numériques
import os                    # Importation de os pour gérer les chemins de fichiers et les dossiers
import random                # Importation de random pour générer des valeurs aléatoires

<h3 style="color: green;">2. Définition des caractéristiques utilisées</h3>

<p>
Les données utilisées pour l’apprentissage du modèle représentent l’état du système à différents instants.
Elles sont constituées d’un ensemble de variables décrivant le comportement des capteurs et de l’actionneur.
</p>

<p>
Dans ce travail, le système est décrit à l’aide de <strong>3 caractéristiques principales</strong> :
</p>

<ul>
  <li><strong>sensor_start</strong> : état du capteur de démarrage (0 ou 1)</li>
  <li><strong>sensor_end</strong> : état du capteur de fin (0 ou 1)</li>
  <li><strong>actuator_conveyor</strong> : état du moteur / convoyeur (0 ou 1)</li>
</ul>

<p>
À ces caractéristiques s’ajoute une variable temporelle :
</p>

<ul>
  <li><strong>duration_ms</strong> : durée de l’état en millisecondes</li>
</ul>

<p>
Ainsi, chaque observation est décrite par <strong>4 caractéristiques au total</strong>.
La variable cible associée à chaque observation est :
</p>

<ul>
  <li><strong>fault_class</strong> : type de panne ou fonctionnement normal</li>
</ul>


In [75]:
KEY_FEATURES = ['sensor_start','sensor_end','actuator_conveyor'] #Liste des caractéristiques

    # Une seule caractéristique de durée (en millisecondes)
FEATURE_DURATION = ['duration_ms']

# Liste finale de toutes les colonnes sauf la cible
ALL_FEATURES = KEY_FEATURES + FEATURE_DURATION 

# Nom de la colonne cible
TARGET_COLUMN = 'fault_class'



<h3 style="color: green;">3. Répertoire de stockage des données</h3>


In [76]:

# Nom du fichier Excel de sortie
NEW_EXCEL_OUTPUT_FILE = 'donnees_lstm_panne.xlsx'
#'data_lstm': le nom du répertoire contenant le fichier Excel
#'donnees_lstm_panne':le nom de fichier
# Chemin complet du fichier Excel de sortie
EXCEL_OUTPUT_PATH = os.path.join('data_lstm', NEW_EXCEL_OUTPUT_FILE)

# Création du dossier data_lstm s’il n’existe pas déjà
os.makedirs('data_lstm', exist_ok=True)# Une méthode qui signifie "make directories" (créer des répertoires).
#ndique à Python de ne pas générer d’erreur si le dossier existe


<h3 style="color: green;">4. Fonctions de simulation </h3>



<ul style="color: #2E86C1; font-weight: bold;">
  4.1. création  d'un état initial </ul>

In [77]:
def get_base_state():
    """Crée un état de base où toutes les caractéristiques sont à 0."""
    return {feat: 0 for feat in ALL_FEATURES}     # Dictionnaire : chaque feature = 0




<ul style="color: #2E86C1; font-weight: bold;">
  4.2.Création d’un nouvel événement à partir de l’état précédent </ul>

In [78]:
def create_event(state, changes, fault_class, duration_ms):
    new_state = state.copy()
    new_state.update(changes)
    new_state['duration_ms'] = duration_ms
    new_state[TARGET_COLUMN] = fault_class
    return new_state


<h4 style="color: #2E86C1;">4.4. Définition des scénarios de fonctionnement et de pannes</h4>

<p>
Cette partie décrit le comportement normal du système à travers une séquence
d’états successifs représentant un cycle de fonctionnement complet.
</p>

<p>
Le scénario normal est constitué de <strong>sept étapes successives</strong> :
</p>

<ul>
  <li>Attente initiale (système au repos)</li>
  <li>Activation du capteur de départ (<i>sensor_start</i>)</li>
  <li>Mise en marche du moteur (<i>actuator_conveyor</i>)</li>
  <li>Désactivation du capteur de départ</li>
  <li>Activation du capteur de fin (<i>sensor_end</i>)</li>
  <li>Arrêt du moteur</li>
  <li>Retour à l’état initial</li>
</ul>

<p>
Chaque étape est associée à une durée générée aléatoirement afin de simuler
un comportement réaliste du système.  
Cette séquence représente un fonctionnement normal sans défaut et sert de
référence pour la génération des différents scénarios de panne.
</p>


In [79]:
def generate_normal_sequence():
    events = []                                   # Liste contenant les états successifs
    state = get_base_state()                      # État initial à 0
    
    events.append(create_event(state, {}, 0, np.random.randint(1000, 2000)))
    events.append(create_event(events[-1], {'sensor_start': 1}, 0, np.random.randint(50, 100)))
    events.append(create_event(events[-1], {'actuator_conveyor': 1}, 0, np.random.randint(50, 100)))
    events.append(create_event(events[-1], {'sensor_start': 0}, 0, np.random.randint(1000, 1500)))
    events.append(create_event(events[-1], {'sensor_end': 1}, 0, np.random.randint(50, 100)))
    events.append(create_event(events[-1], {'actuator_conveyor': 0}, 0, np.random.randint(200, 500)))
    events.append(create_event(events[-1], {'sensor_end': 0}, 0, np.random.randint(500, 1000)))
    return events            

<p>
Cette fonction simule un cycle de fonctionnement normal au début, puis une anomalie où le capteur de fin (<i>sensor_end</i>) reste bloqué à 1 et ne revient jamais à 0, ce qui correspond à une panne de type 1.
</p>



In [80]:
def generate_stuck_sensor_sequence(fault_class=1):
    """PANNE : sensor_end reste à 1 (Classe 1)."""
    events = []
    state = get_base_state()

    events.append(create_event(state, {}, fault_class, np.random.randint(1000, 2000)))
    events.append(create_event(events[-1], {'sensor_start': 1}, fault_class, np.random.randint(50, 100)))
    events.append(create_event(events[-1], {'actuator_conveyor': 1}, fault_class, np.random.randint(50, 100)))
    events.append(create_event(events[-1], {'sensor_start': 0}, fault_class, np.random.randint(1000, 1500)))
    events.append(create_event(events[-1], {'sensor_end': 1}, fault_class, np.random.randint(50, 100)))
    events.append(create_event(events[-1], {'actuator_conveyor': 0}, fault_class, np.random.randint(200, 500)))

    # La panne : sensor_end reste bloqué à 1 et ne se coupe jamais
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(500, 1000)))
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(500, 1000)))

    return events


<p>
Cette fonction simule une panne où le capteur de départ ne détecte jamais l’objet, donc sensor_start reste toujours à 0 pendant toute la séquence.
</p>


In [81]:

def generate_missed_sensor_sequence(fault_class=2):
    """PANNE : sensor_start reste toujours à 0 (Classe 2)."""
    events = []
    state = get_base_state()

    events.append(create_event(state, {}, fault_class, np.random.randint(1000, 2000)))

    # sensor_start reste à 0 pendant toute la séquence
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(1000, 2000)))
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(1000, 2000)))
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(1000, 2000)))

    return events


<p>
Cette fonction simule une panne où le convoyeur reste bloqué en marche, même lorsque le cycle devrait être terminé.
</p>

In [82]:
def generate_stuck_motor_sequence(fault_class=3):
    """PANNE : le moteur reste bloqué à 1 (Classe 3)."""
    events = []
    state = get_base_state()

    events.append(create_event(state, {}, fault_class, np.random.randint(1000, 2000)))
    events.append(create_event(events[-1], {'sensor_start': 1}, fault_class, np.random.randint(50, 100)))
    events.append(create_event(events[-1], {'actuator_conveyor': 1}, fault_class, np.random.randint(50, 100)))
    events.append(create_event(events[-1], {'sensor_start': 0}, fault_class, np.random.randint(1000, 1500)))
    events.append(create_event(events[-1], {'sensor_end': 1}, fault_class, np.random.randint(50, 100)))

    # Panne : moteur ne s’arrête jamais
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(200, 500)))

    # sensor_end repasse à 0 mais moteur reste à 1
    events.append(create_event(events[-1], {'sensor_end': 0}, fault_class, np.random.randint(500, 1000)))

    # Encore moteur bloqué
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(500, 1000)))

    return events


<p>
Cette fonction simule une panne dans laquelle le capteur de démarrage (sensor_start) reste bloqué à l’état actif (1)
</p>

In [83]:
def generate_stuck_start_sensor_sequence(fault_class=4):
    """PANNE : le capteur de départ reste bloqué à 1 (Classe 4)."""
    events = []
    state = get_base_state()

    events.append(create_event(state, {}, fault_class, np.random.randint(1000, 2000)))
    events.append(create_event(events[-1], {'sensor_start': 1}, fault_class, np.random.randint(50, 100)))

    # Le capteur reste bloqué à 1
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(500, 1000)))
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(500, 1000)))

    # Les autres capteurs peuvent varier
    events.append(create_event(events[-1], {'sensor_end': 1}, fault_class, np.random.randint(50, 100)))
    events.append(create_event(events[-1], {'actuator_conveyor': 0}, fault_class, np.random.randint(200, 500)))

    return events



<p>
Cette fonction simule une panne dans laquelle le capteur de fin (sensor_end) ne s’active jamais, même lorsque le système devrait normalement détecter la fin du cycle.</p>

In [84]:
def generate_missed_end_sensor_sequence(fault_class=5):
    """PANNE : le capteur de fin ne s’active jamais."""
    events = []
    state = get_base_state()

    events.append(create_event(state, {}, fault_class, np.random.randint(1000, 2000)))
    events.append(create_event(events[-1], {'sensor_start': 1}, fault_class, np.random.randint(50, 100)))
    events.append(create_event(events[-1], {'actuator_conveyor': 1}, fault_class, np.random.randint(50, 100)))

    # sensor_end n'est jamais activé
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(1000, 1500)))
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(1000, 1500)))

    return events



<p>
Cette fonction simule un scénario de panne dans lequel le moteur du système ne démarre jamais, même lorsque les conditions normales de fonctionnement sont réunies.
</p>


In [85]:
def generate_motor_never_starts_sequence(fault_class=6):
    """PANNE : le moteur ne démarre jamais."""
    events = []
    state = get_base_state()

    events.append(create_event(state, {}, fault_class, np.random.randint(1000, 2000)))
    events.append(create_event(events[-1], {'sensor_start': 1}, fault_class, np.random.randint(50, 100)))

    # moteur reste à 0
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(500, 1000)))
    events.append(create_event(events[-1], {}, fault_class, np.random.randint(500, 1000)))

    return events




<p>
Cette fonction crée une séquence de données chaotique, utilisée pour entraîner le modèle à reconnaître une panne imprévisible (classe 7).
</p>



In [86]:
def generate_other_fault_sequence(fault_class=7, steps=10):
    events = []
    state = get_base_state()

    for _ in range(steps):
        s_start = random.randint(0, 1)
        s_end   = random.randint(0, 1)
        motor   = random.randint(0, 1)

        # contraintes anti-"normal"
        # (on force une incohérence pour éviter de ressembler au scénario normal)
        if s_start == 1 and motor == 0:
            motor = 1
        if s_end == 1 and motor == 0:
            motor = 1

        changes = {
            'sensor_start': s_start,
            'sensor_end': s_end,
            'actuator_conveyor': motor
        }

        state = create_event(state, changes, fault_class, np.random.randint(100, 500))
        events.append(state)

    return events




<h3 style="color: green;">
 3. Programme principal</h3>

In [87]:

if __name__ == "__main__":                               # Point d'entrée principal du script
    print("Génération du jeu de données de simulation...")

    all_data = []                                        # Liste contenant tous les événements

    # Quantités d'exemples limités pour éviter trop de mémoire
    N_NORMAL = 70
    N_FAULT = 70

    print("Génération de", N_NORMAL, "cycles de la Classe 0")
    for i in range(N_NORMAL):
        all_data.extend(generate_normal_sequence())      # Ajoute une séquence complète

    print(f"Génération de {N_FAULT} cycles pour les pannes C1 à C6...")
    for _ in range(N_FAULT):
        all_data.extend(generate_stuck_sensor_sequence(fault_class=1))
        all_data.extend(generate_missed_sensor_sequence(fault_class=2))
        all_data.extend(generate_stuck_motor_sequence(fault_class=3))
        all_data.extend(generate_stuck_start_sensor_sequence(fault_class=4))
        all_data.extend(generate_missed_end_sensor_sequence(fault_class=5))
        all_data.extend(generate_motor_never_starts_sequence(fault_class=6))

    print("Génération de",N_FAULT,"cycles de la Classe 7 (Aléatoire)...")
    for i in range(N_FAULT):
        all_data.extend(generate_other_fault_sequence(fault_class=7))

    # Conversion de toute la liste en DataFrame (Transformer en tableau)
    df = pd.DataFrame(all_data)

    # Réorganisation des colonnes : cible en premier
    df = df[[TARGET_COLUMN] + ALL_FEATURES]

    print("Sauvegarde des données dans ",EXCEL_OUTPUT_PATH)
    df.to_excel(EXCEL_OUTPUT_PATH, index=False, sheet_name='SimulationData')   # Sauvegarde Excel

    print("Total d'événements générés : ",len(df))      #len(df) = nombre de lignes (événements)
    print("Répartition des classes (par événement) :")
    print(df[TARGET_COLUMN].value_counts(normalize=True).sort_index())         # Affiche distribution classes

    print("\nAperçu des données :")
    print(df.head())                                                           # Premières lignes


Génération du jeu de données de simulation...
Génération de 70 cycles de la Classe 0
Génération de 70 cycles pour les pannes C1 à C6...
Génération de 70 cycles de la Classe 7 (Aléatoire)...
Sauvegarde des données dans  data_lstm\donnees_lstm_panne.xlsx
Total d'événements générés :  3640
Répartition des classes (par événement) :
fault_class
0    0.134615
1    0.153846
2    0.076923
3    0.153846
4    0.115385
5    0.096154
6    0.076923
7    0.192308
Name: proportion, dtype: float64

Aperçu des données :
   fault_class  sensor_start  sensor_end  actuator_conveyor  duration_ms
0            0             0           0                  0         1011
1            0             1           0                  0           74
2            0             1           0                  1           68
3            0             0           0                  1         1242
4            0             0           1                  1           61
