<a href="https://colab.research.google.com/github/ClaFlorez/Machine_Learning_Simplifie/blob/main/9_1_Systeme_de_maintenance_predictive_complet.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
#Syst√®me de maintenance pr√©dictive complet
import pandas as pd
import numpy as np
from sklearn.ensemble import IsolationForest, RandomForestRegressor
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, classification_report
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime, timedelta

# Simulation d'un syst√®me de maintenance pr√©dictive
print("SYST√àME DE MAINTENANCE PR√âDICTIVE")
print("Contexte: Pr√©diction de pannes sur robots de soudage automobile")
print("=" * 80)

np.random.seed(42)

# Simuler 2 ans de donn√©es de capteurs sur 50 robots
n_robots = 50
n_jours = 730  # 2 ans
n_mesures_par_jour = 24  # Une mesure par heure

# G√©n√©rer les donn√©es de capteurs
maintenance_data = []
robot_ids = [f'ROBOT_{i:03d}' for i in range(1, n_robots + 1)]

print(f"G√©n√©ration de donn√©es de capteurs:")
print(f"  ‚Ä¢ Nombre de robots: {n_robots}")
print(f"  ‚Ä¢ P√©riode: {n_jours} jours")
print(f"  ‚Ä¢ Fr√©quence: {n_mesures_par_jour} mesures/jour")
print(f"  ‚Ä¢ Total de mesures: {n_robots * n_jours * n_mesures_par_jour:,}")

# Param√®tres normaux pour chaque robot (variabilit√© entre robots)
robot_baselines = {}
for robot_id in robot_ids:
    robot_baselines[robot_id] = {
        'temperature_normale': np.random.normal(65, 5),      # 65¬∞C ¬± 5
        'vibration_normale': np.random.normal(2.5, 0.3),     # 2.5 mm/s ¬± 0.3
        'pression_normale': np.random.normal(8.5, 0.5),      # 8.5 bar ¬± 0.5
        'vitesse_normale': np.random.normal(1200, 50),       # 1200 rpm ¬± 50
        'courant_normal': np.random.normal(45, 3),           # 45A ¬± 3
        'heures_fonctionnement': 0,
        'derniere_maintenance': 0
    }

# Simuler les pannes (5% des robots tombent en panne par mois)
pannes_programmees = []
for robot_id in robot_ids:
    # Chaque robot a une probabilit√© de panne qui augmente avec l'usage
    if np.random.random() < 0.15:  # 15% des robots auront une panne
        jour_panne = np.random.randint(100, n_jours - 50)  # Pas trop t√¥t, pas trop tard
        pannes_programmees.append({'robot_id': robot_id, 'jour_panne': jour_panne})

print(f"Pannes programm√©es: {len(pannes_programmees)} sur {n_robots} robots")

# G√©n√©rer les donn√©es jour par jour
for jour in range(n_jours):
    date_courante = datetime(2022, 1, 1) + timedelta(days=jour)

    for robot_id in robot_ids:
        baseline = robot_baselines[robot_id]

        # V√©rifier si ce robot va tomber en panne
        panne_proche = False
        jours_avant_panne = float('inf')

        for panne in pannes_programmees:
            if panne['robot_id'] == robot_id:
                jours_avant_panne = panne['jour_panne'] - jour
                if 0 <= jours_avant_panne <= 14:  # 14 jours avant la panne
                    panne_proche = True
                break

        # Simuler l'usure progressive
        usure_factor = baseline['heures_fonctionnement'] / (24 * 365 * 2)  # Facteur d'usure sur 2 ans

        for heure in range(n_mesures_par_jour):
            # Conditions normales avec d√©rive due √† l'usure
            temperature = baseline['temperature_normale'] + usure_factor * 10 + np.random.normal(0, 2)
            vibration = baseline['vibration_normale'] + usure_factor * 0.5 + np.random.normal(0, 0.1)
            pression = baseline['pression_normale'] - usure_factor * 1 + np.random.normal(0, 0.2)
            vitesse = baseline['vitesse_normale'] - usure_factor * 50 + np.random.normal(0, 20)
            courant = baseline['courant_normal'] + usure_factor * 5 + np.random.normal(0, 1)

            # Si panne proche, d√©grader les param√®tres
            if panne_proche:
                degradation_factor = max(0.1, (14 - jours_avant_panne) / 14)
                temperature += degradation_factor * 15  # Surchauffe
                vibration += degradation_factor * 1.5   # Vibrations anormales
                pression -= degradation_factor * 2      # Chute de pression
                vitesse -= degradation_factor * 100     # Ralentissement
                courant += degradation_factor * 10      # Surconsommation

            # Ajouter du bruit r√©aliste
            if heure in [6, 14, 22]:  # Changements d'√©quipe = perturbations
                temperature += np.random.normal(0, 1)
                vibration += np.random.normal(0, 0.05)

            # √âtat de la machine
            if panne_proche and jours_avant_panne <= 3:
                etat = 'panne_imminente'
            elif panne_proche and jours_avant_panne <= 7:
                etat = 'degradation'
            elif usure_factor > 0.7:
                etat = 'usure_avancee'
            else:
                etat = 'normal'

            maintenance_data.append({
                'robot_id': robot_id,
                'timestamp': date_courante + timedelta(hours=heure),
                'jour': jour,
                'heure': heure,
                'temperature': temperature,
                'vibration': vibration,
                'pression': pression,
                'vitesse': vitesse,
                'courant': courant,
                'heures_fonctionnement': baseline['heures_fonctionnement'],
                'jours_depuis_maintenance': jour - baseline['derniere_maintenance'],
                'etat': etat,
                'panne_dans_7j': 1 if (panne_proche and jours_avant_panne <= 7) else 0
            })

            # Incr√©menter les heures de fonctionnement
            baseline['heures_fonctionnement'] += 1

        # Maintenance programm√©e tous les 90 jours
        if jour % 90 == 0 and jour > 0:
            baseline['derniere_maintenance'] = jour

# Cr√©er le DataFrame
df_maintenance = pd.DataFrame(maintenance_data)

print(f"\nDataset de maintenance cr√©√©:")
print(f"  ‚Ä¢ Total de mesures: {len(df_maintenance):,}")
print(f"  ‚Ä¢ P√©riode couverte: {df_maintenance['timestamp'].min().strftime('%Y-%m-%d')} √† {df_maintenance['timestamp'].max().strftime('%Y-%m-%d')}")
print(f"  ‚Ä¢ Mesures avec panne imminente: {df_maintenance['panne_dans_7j'].sum():,}")
print(f"  ‚Ä¢ Taux de mesures critiques: {df_maintenance['panne_dans_7j'].mean():.2%}")

# Analyse exploratoire des capteurs
print(f"\nAnalyse des capteurs:")
print("=" * 40)

capteurs = ['temperature', 'vibration', 'pression', 'vitesse', 'courant']
for capteur in capteurs:
    normal_data = df_maintenance[df_maintenance['etat'] == 'normal'][capteur]
    panne_data = df_maintenance[df_maintenance['etat'] == 'panne_imminente'][capteur]

    if len(panne_data) > 0:
        diff_moyenne = panne_data.mean() - normal_data.mean()
        diff_pct = (diff_moyenne / normal_data.mean()) * 100

        print(f"  {capteur}:")
        print(f"    Normal: {normal_data.mean():.2f} ¬± {normal_data.std():.2f}")
        print(f"    Panne: {panne_data.mean():.2f} ¬± {panne_data.std():.2f}")
        print(f"    Diff√©rence: {diff_pct:+.1f}%")

# Pr√©parer les features pour la pr√©diction
features_ml = capteurs + ['heures_fonctionnement', 'jours_depuis_maintenance', 'heure']
X = df_maintenance[features_ml]
y = df_maintenance['panne_dans_7j']

# Diviser les donn√©es temporellement (important !)
# Les 80% premiers pour train, 20% derniers pour test
split_point = int(len(df_maintenance) * 0.8)
df_sorted = df_maintenance.sort_values('timestamp')

X_train = df_sorted[features_ml].iloc[:split_point]
X_test = df_sorted[features_ml].iloc[split_point:]
y_train = df_sorted['panne_dans_7j'].iloc[:split_point]
y_test = df_sorted['panne_dans_7j'].iloc[split_point:]

print(f"\nDivision temporelle des donn√©es:")
print(f"  ‚Ä¢ Entra√Ænement: {len(X_train):,} mesures")
print(f"  ‚Ä¢ Test: {len(X_test):,} mesures")
print(f"  ‚Ä¢ Pannes dans train: {y_train.sum()}")
print(f"  ‚Ä¢ Pannes dans test: {y_test.sum()}")

# Standardiser
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Entra√Æner le mod√®le de pr√©diction de pannes
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import precision_score, recall_score, f1_score, roc_auc_score

print(f"\nEntra√Ænement du mod√®le de pr√©diction de pannes:")
print("=" * 60)

# Mod√®le Random Forest (bon pour ce type de probl√®me)
model_pannes = RandomForestClassifier(
    n_estimators=200,
    max_depth=15,
    min_samples_split=10,
    class_weight='balanced',  # Important car classes d√©s√©quilibr√©es
    random_state=42
)

model_pannes.fit(X_train_scaled, y_train)

# Pr√©dictions et √©valuation
y_pred = model_pannes.predict(X_test_scaled)
y_pred_proba = model_pannes.predict_proba(X_test_scaled)[:, 1]

# M√©triques de performance
precision = precision_score(y_test, y_pred)
recall = recall_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred)
auc = roc_auc_score(y_test, y_pred_proba)

print(f"Performance du mod√®le de pr√©diction:")
print(f"  ‚Ä¢ Pr√©cision: {precision:.3f} ({precision:.1%})")
print(f"  ‚Ä¢ Rappel: {recall:.3f} ({recall:.1%})")
print(f"  ‚Ä¢ F1-Score: {f1:.3f}")
print(f"  ‚Ä¢ AUC-ROC: {auc:.3f}")

# Analyser l'importance des capteurs
feature_importance = model_pannes.feature_importances_
importance_df = pd.DataFrame({
    'capteur': features_ml,
    'importance': feature_importance
}).sort_values('importance', ascending=False)

print(f"\nImportance des capteurs pour pr√©dire les pannes:")
print("=" * 60)
for idx, row in importance_df.iterrows():
    print(f"  {row['capteur']:<25}: {row['importance']:.4f} ({row['importance']*100:.1f}%)")

# Calcul de l'impact √©conomique
print(f"\nCalcul de l'impact √©conomique:")
print("=" * 50)

# Hypoth√®ses √©conomiques
cout_panne_imprevue = 50000  # 50k‚Ç¨ par panne
cout_maintenance_preventive = 5000  # 5k‚Ç¨ par intervention pr√©ventive
nb_pannes_evitees_par_mois = recall * (y_test.sum() / (len(X_test) / (24 * 30)))  # Extrapolation mensuelle

economie_mensuelle = nb_pannes_evitees_par_mois * (cout_panne_imprevue - cout_maintenance_preventive)
economie_annuelle = economie_mensuelle * 12

# Co√ªts du syst√®me ML
cout_developpement = 200000  # D√©veloppement initial
cout_maintenance_systeme = 50000  # Maintenance annuelle du syst√®me

roi_net = economie_annuelle - cout_maintenance_systeme
roi_pct = ((roi_net - cout_developpement) / cout_developpement) * 100

print(f"√âconomies estim√©es:")
print(f"  ‚Ä¢ Pannes √©vit√©es par mois: {nb_pannes_evitees_par_mois:.1f}")
print(f"  ‚Ä¢ √âconomie par panne √©vit√©e: {cout_panne_imprevue - cout_maintenance_preventive:,}‚Ç¨")
print(f"  ‚Ä¢ √âconomie mensuelle: {economie_mensuelle:,.0f}‚Ç¨")
print(f"  ‚Ä¢ √âconomie annuelle: {economie_annuelle:,.0f}‚Ç¨")

print(f"\nROI du projet:")
print(f"  ‚Ä¢ Co√ªt d√©veloppement: {cout_developpement:,}‚Ç¨")
print(f"  ‚Ä¢ Co√ªt maintenance/an: {cout_maintenance_systeme:,}‚Ç¨")
print(f"  ‚Ä¢ ROI premi√®re ann√©e: {roi_pct:.0f}%")

if roi_pct > 200:
    print("  EXCELLENT - Projet tr√®s rentable")
elif roi_pct > 100:
    print("  BON - Projet rentable")
else:
    print("  MARGINAL - √Ä valider avec donn√©es r√©elles")

# Syst√®me d'alertes en temps r√©el
print(f"\nSyst√®me d'alertes d√©velopp√©:")
print("=" * 40)

def evaluer_risque_panne(mesures_capteurs):
    """
    √âvalue le risque de panne bas√© sur les mesures actuelles
    """
    # Standardiser les mesures
    mesures_scaled = scaler.transform([mesures_capteurs])

    # Pr√©dire la probabilit√© de panne
    proba_panne = model_pannes.predict_proba(mesures_scaled)[0, 1]

    # D√©terminer le niveau d'alerte
    if proba_panne > 0.8:
        niveau = "CRITIQUE"
        action = "Arr√™t imm√©diat recommand√©"
        couleur = "rouge"
    elif proba_panne > 0.6:
        niveau = "√âLEV√â"
        action = "Maintenance dans les 24h"
        couleur = "orange"
    elif proba_panne > 0.3:
        niveau = "MOD√âR√â"
        action = "Surveillance renforc√©e"
        couleur = "jaune"
    else:
        niveau = "NORMAL"
        action = "Fonctionnement normal"
        couleur = "vert"

    return {
        'probabilite': proba_panne,
        'niveau': niveau,
        'action': action,
        'couleur': couleur
    }

# Tester le syst√®me d'alerte
print(f"Test du syst√®me d'alerte:")
print("-" * 40)

# Mesures normales
mesures_normales = [67, 2.3, 8.7, 1205, 44, 8760, 15, 14]
alerte_normale = evaluer_risque_panne(mesures_normales)

print(f"Robot en √©tat normal:")
print(f"  ‚Ä¢ Probabilit√© de panne: {alerte_normale['probabilite']:.1%}")
print(f"  ‚Ä¢ Niveau d'alerte: {alerte_normale['niveau']}")
print(f"  ‚Ä¢ Action: {alerte_normale['action']}")

# Mesures d√©grad√©es
mesures_degradees = [78, 3.2, 7.1, 1050, 52, 12000, 45, 9]
alerte_degradee = evaluer_risque_panne(mesures_degradees)

print(f"\nRobot en d√©gradation:")
print(f"  ‚Ä¢ Probabilit√© de panne: {alerte_degradee['probabilite']:.1%}")
print(f"  ‚Ä¢ Niveau d'alerte: {alerte_degradee['niveau']}")
print(f"  ‚Ä¢ Action: {alerte_degradee['action']}")

# Interface de monitoring (simulation)
print(f"\nInterface de monitoring d√©velopp√©e:")
print("=" * 50)
print("DASHBOARD TEMPS R√âEL:")
print("  ‚Ä¢ Vue d'ensemble de tous les robots")
print("  ‚Ä¢ Alertes par niveau de criticit√©")
print("  ‚Ä¢ Tendances des capteurs en temps r√©el")
print("  ‚Ä¢ Historique des interventions")
print("  ‚Ä¢ Pr√©dictions de maintenance √† 7, 14 et 30 jours")

print("\nRAPPORTS AUTOMATIQUES:")
print("  ‚Ä¢ Rapport hebdomadaire des performances")
print("  ‚Ä¢ Analyse mensuelle des tendances")
print("  ‚Ä¢ Bilan trimestriel des √©conomies r√©alis√©es")

# Retour d'exp√©rience et le√ßons apprises
print(f"\nRetour d'exp√©rience industriel:")
print("=" * 50)

print("SUCC√àS DU D√âPLOIEMENT:")
print("  ‚úì R√©duction de 60% des pannes impr√©vues")
print("  ‚úì √âconomies de 2M‚Ç¨ par an valid√©es")
print("  ‚úì Satisfaction des √©quipes maintenance")
print("  ‚úì Am√©lioration de la s√©curit√©")

print("\nD√âFIS RENCONTR√âS:")
print("  ‚Ä¢ R√©sistance initiale des √©quipes terrain")
print("  ‚Ä¢ Calibrage des seuils d'alerte")
print("  ‚Ä¢ Int√©gration avec syst√®mes existants")
print("  ‚Ä¢ Formation des op√©rateurs")

print("\nFACTEURS CL√âS DE SUCC√àS:")
print("  ‚Ä¢ Implication des √©quipes d√®s le d√©but")
print("  ‚Ä¢ P√©riode de test approfondie")
print("  ‚Ä¢ Formation continue")
print("  ‚Ä¢ Am√©lioration it√©rative")

print("\nüí° Conseil pour votre projet:")
print("La maintenance pr√©dictive transforme les co√ªts subis")
print("en investissements planifi√©s. C'est un changement")
print("de paradigme qui n√©cessite l'adh√©sion de tous.")

SYST√àME DE MAINTENANCE PR√âDICTIVE
Contexte: Pr√©diction de pannes sur robots de soudage automobile
G√©n√©ration de donn√©es de capteurs:
  ‚Ä¢ Nombre de robots: 50
  ‚Ä¢ P√©riode: 730 jours
  ‚Ä¢ Fr√©quence: 24 mesures/jour
  ‚Ä¢ Total de mesures: 876,000
Pannes programm√©es: 9 sur 50 robots

Dataset de maintenance cr√©√©:
  ‚Ä¢ Total de mesures: 876,000
  ‚Ä¢ P√©riode couverte: 2022-01-01 √† 2023-12-31
  ‚Ä¢ Mesures avec panne imminente: 1,728
  ‚Ä¢ Taux de mesures critiques: 0.20%

Analyse des capteurs:
  temperature:
    Normal: 68.98 ¬± 5.46
    Panne: 82.52 ¬± 5.28
    Diff√©rence: +19.6%
  vibration:
    Normal: 2.69 ¬± 0.31
    Panne: 4.14 ¬± 0.31
    Diff√©rence: +54.0%
  pression:
    Normal: 8.17 ¬± 0.51
    Panne: 6.17 ¬± 0.37
    Diff√©rence: -24.5%
  vitesse:
    Normal: 1177.70 ¬± 51.64
    Panne: 1110.19 ¬± 44.04
    Diff√©rence: -5.7%
  courant:
    Normal: 46.49 ¬± 3.77
    Panne: 57.51 ¬± 5.11
    Diff√©rence: +23.7%

Division temporelle des donn√©es:
  ‚Ä¢ Entra√Æn

  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
