<h3 style="text-align: center; font-family: Arial, sans-serif; color: #4CAF50;">TSS - Temporal Similarity Search : POC SMALL DATASET WITH API</h3>
<ul style="font-family: Arial, sans-serif; font-size: 12pt; color: #333;">
</ul>


In [1]:
import pandas as pd
import numpy as np
from tqdm import tqdm

# Charger les données
df = pd.read_csv("../Datasources/MetroPT3_imputed_final.csv", delimiter=",", decimal=".", index_col=0)
df.reset_index(drop=True, inplace=True)

# Convertir la colonne timestamp
df['timestamp'] = pd.to_datetime(df['timestamp'], errors='coerce')

# Sélection des colonnes continues et catégoriques
continuous_features = ["TP2", "DV_pressure", "Oil_temperature", "Motor_current", "Reservoirs"]
categorical_features = ["COMP", "DV_eletric", "Towers", "LPS", "Pressure_switch", "Oil_level", "Caudal_impulses"]
columns_to_keep = ["timestamp", "panne"] + continuous_features + categorical_features

# Filtrer les colonnes utiles
df = df[columns_to_keep]


In [None]:
display(df.head(3))

In [2]:
###################################################################################################
################ Train : Panne1   (1J ET DEMI)                                              #######
################ Test  : Panne4  (15mn + 15mn + 15mn)     #########################################
###################################################################################################

# Classe 0 : Pas de panne détectée
# Classe 1 : En pleine panne
# Classe 2 : Panne prévue dans moins de 30 minutes

pannes = [
    {'start': '2020-04-18 00:00', 'end': '2020-04-18 23:59'},
    {'start': '2020-05-29 23:30', 'end': '2020-05-30 06:00'},
    {'start': '2020-06-05 10:00', 'end': '2020-06-07 14:30'},
    {'start': '2020-07-15 14:30', 'end': '2020-07-15 19:00'},
         ]


# Définir les périodes d'entraînement et de test
train_periods = [{'start': '2020-04-17 21:30:00', 'end': '2020-04-19 00:15:00'}]
test_periods  = [{'start': '2020-07-15 12:00:00', 'end': '2020-07-15 20:00:00'}]

# Séparer les données pour l'entraînement
train_df = pd.concat([
    df[(df['timestamp'] >= pd.Timestamp(period['start'])) & 
       (df['timestamp'] <= pd.Timestamp(period['end']))]
    for period in train_periods
])

# Séparer les données pour le test
test_df = pd.concat([
    df[(df['timestamp'] >= pd.Timestamp(period['start'])) & 
       (df['timestamp'] <= pd.Timestamp(period['end']))]
    for period in test_periods
])

print(f"Entrainement : {len(train_df)} lignes")
print(f"Test : {len(test_df)} lignes")

Entrainement : 9631 lignes
Test : 2881 lignes


In [3]:
# Distribution des modalités de la variable 'panne' dans l'ensemble d'entraînement
print("Modalités de 'panne' dans l'ensemble d'entraînement :")
print(train_df["panne"].value_counts())

# Distribution des modalités de la variable 'panne' dans l'ensemble de test
print("\nModalités de 'panne' dans l'ensemble de test :")
print(test_df["panne"].value_counts())


Modalités de 'panne' dans l'ensemble d'entraînement :
1    8635
0     816
2     180
Name: panne, dtype: int64

Modalités de 'panne' dans l'ensemble de test :
1    1621
0    1080
2     180
Name: panne, dtype: int64


In [4]:
# Paramètres des fenêtres
window_size = 100  # Taille de la fenêtre
step_size = 1     # Pas de glissement
numeric_columns = continuous_features

# Générer les fenêtres pour l'entraînement
train_windows = []
for i in tqdm(range(0, len(train_df) - window_size + 1, step_size)):
    window_data = train_df.iloc[i:i + window_size][numeric_columns].values.flatten()
    #panne_value = train_df.iloc[i + window_size - 1]["panne"]          # Dernière valeur de panne dans la fenêtre
    panne_value  = train_df.iloc[i:i + window_size]["panne"].mode()[0]  # Classe majoritaire
    train_windows.append({
        "index": i,
        "timestamp": train_df.iloc[i]["timestamp"],
        "sensor_data": window_data.tolist(),
        "panne": panne_value
    })

# Générer les fenêtres pour le test
test_windows = []
for i in tqdm(range(0, len(test_df) - window_size + 1, step_size)):
    window_data = test_df.iloc[i:i + window_size][numeric_columns].values.flatten()
    #panne_value  = test_df.iloc[i + window_size - 1]["panne"]           # Dernière valeur de panne dans la fenêtre
    panne_value   = test_df.iloc[i:i + window_size]["panne"].mode()[0]  # Classe majoritaire
    test_windows.append({
        "index": i,
        "timestamp": test_df.iloc[i]["timestamp"],
        "sensor_data": window_data.tolist(),
        "panne": panne_value
    })

print(f"Fenêtres d'entraînement : {len(train_windows)}")
print(f"Fenêtres de test : {len(test_windows)}")


100%|█████████████████████████████████████████████████████████████████████████████| 9532/9532 [00:12<00:00, 744.62it/s]
100%|█████████████████████████████████████████████████████████████████████████████| 2782/2782 [00:03<00:00, 758.24it/s]

Fenêtres d'entraînement : 9532
Fenêtres de test : 2782





In [6]:
import kdbai_client as kdbai

# Connexion à KDB.AI
session = kdbai.Session(endpoint="https://cloud.kdb.ai/instance/atr0v2owym", api_key="a5b897a7b4-Av/lT//S3W++g8K11vVKfJo5rIj5gK492sbpts/1f+cr/5m5n5JluPcqcQR2gGiiQQ7SrCFAc7ma2RhT")
db = session.database('default')



In [7]:
##################################
###### SUPPRIMER LA TABLE ######
##################################
# Accéder aux tables existantes
train_table = db.table("train_sensors")

try:
    train_table.drop()
    print("Table 'train_sensors' supprimée avec succès.")
except Exception as e:
    print(f"Erreur lors de la suppression de 'train_sensors' : {e}")

Table 'train_sensors' supprimée avec succès.


In [8]:

# Schéma de la table
schema = [
    {"name": "index", "type": "int64"},
    {"name": "timestamp", "type": "datetime64[ns]"},
    {"name": "sensor_data", "type": "float64s"},
    {"name": "panne", "type": "int64"}
]
indexes = [
    {"name": "flat_index", "type": "flat", "column": "sensor_data", "params": {"metric": "L2","dims": 500}}
]

# Création de la table
train_table = db.create_table("train_sensors", schema=schema, indexes=indexes)

# Insertion des données d'entraînement
batch_size = 100
for i in tqdm(range(0, len(train_windows), batch_size)):
    batch = train_windows[i:i + batch_size]
    train_table.insert(batch)

100%|██████████████████████████████████████████████████████████████████████████████████| 96/96 [00:45<00:00,  2.10it/s]


In [9]:
################################################################
#### Prédiction pour les 100 premières fenêtres             ####
################################################################

# Limiter les tests aux 100 premières fenêtres
test_subset = test_windows[:100]
results = []

for i, test_window in tqdm(enumerate(test_subset), total=len(test_subset)):
    query_vector = test_window["sensor_data"]

    try:
        # Vérifier le vecteur de requête
        if not query_vector or not isinstance(query_vector, list):
            raise ValueError(f"Vecteur de test invalide pour la fenêtre {i}: {query_vector}")

        # Recherche vectorielle
        results_vector = train_table.search(
            vectors={"flat_index": [query_vector]},
            n=5  # Trouver les 5 motifs les plus similaires
        )

        # Afficher la réponse brute pour diagnostic
        print(f"Réponse brute pour la fenêtre {i}: {results_vector}")

        # Vérifier si des résultats sont retournés
        if results_vector and isinstance(results_vector[0], list):
            similar_pannes = [result.get("panne", None) for result in results_vector[0]]
            similar_pannes = [p for p in similar_pannes if p is not None]

            if similar_pannes:
                predicted_panne = max(set(similar_pannes), key=similar_pannes.count)
            else:
                predicted_panne = -1  # Valeur par défaut si aucune panne valide
        else:
            raise ValueError(f"Aucun résultat valide pour la fenêtre {i}: {results_vector}")

        # Stocker les résultats
        results.append({
            "fenêtre": i,
            "prédiction": predicted_panne,
            "réelle": test_window["panne"]
        })

    except Exception as e:
        print(f"Erreur lors de la prédiction pour la fenêtre {i}: {e}")
        results.append({
            "fenêtre": i,
            "prédiction": -1,  # Valeur par défaut en cas d'erreur
            "réelle": test_window["panne"]
        })

# Créer un DataFrame avec les résultats
results_df = pd.DataFrame(results)

# Calculer la précision globale
accuracy = (results_df["prédiction"] == results_df["réelle"]).mean()

# Compter les fenêtres par classe prédite
class_counts = results_df["prédiction"].value_counts()

# Afficher les résultats
print(f"Précision globale pour les 100 premières fenêtres : {accuracy:.2%}")
print(f"Nombre total de fenêtres testées : {len(results_df)}")
print("\nPrédictions par classe :")
print(class_counts)

# Afficher les premiers résultats pour analyse
print(results_df.head(10))


  2%|█▋                                                                                | 2/100 [00:00<00:19,  5.04it/s]

Réponse brute pour la fenêtre 0: [   __nn_distance  index           timestamp  \
0    5033.519043   4092 2020-04-18 08:52:00   
1    5064.088867   4086 2020-04-18 08:51:00   
2    5083.428711   4098 2020-04-18 08:53:00   
3    5101.472656   1438 2020-04-18 01:29:40   
4    5106.284668   1177 2020-04-18 00:46:10   

                                         sensor_data  panne  
0  [7.154, 1.5579999999999998, 74.62500000000001,...      1  
1  [8.976, 2.004, 73.95, 5.7925, 8.836, 8.18, 1.7...      1  
2  [6.316000000000001, 1.25, 74.62500000000001, 5...      1  
3  [7.859999999999999, 1.6920000000000002, 74.25,...      1  
4  [8.542, 1.9400000000000013, 73.475, 5.6525, 8....      1  ]
Erreur lors de la prédiction pour la fenêtre 0: Aucun résultat valide pour la fenêtre 0: [   __nn_distance  index           timestamp  \
0    5033.519043   4092 2020-04-18 08:52:00   
1    5064.088867   4086 2020-04-18 08:51:00   
2    5083.428711   4098 2020-04-18 08:53:00   
3    5101.472656   1438 2020-04-

  4%|███▎                                                                              | 4/100 [00:00<00:17,  5.54it/s]

Réponse brute pour la fenêtre 2: [   __nn_distance  index           timestamp  \
0    5041.966797   4094 2020-04-18 08:52:20   
1    5084.498047   4088 2020-04-18 08:51:20   
2    5092.463379   4100 2020-04-18 08:53:20   
3    5110.592773   4093 2020-04-18 08:52:10   
4    5123.676758   1440 2020-04-18 01:30:00   

                                         sensor_data  panne  
0  [8.828, 1.9559999999999995, 74.925, 5.70000000...      1  
1  [8.934, 1.9879999999999995, 74.2, 5.7600000000...      1  
2  [8.948, 1.99, 74.62500000000001, 5.77250000000...      1  
3  [7.818, 1.661999999999999, 74.62500000000001, ...      1  
4  [8.906, 2.004, 74.64999999999999, 5.7525000000...      1  ]
Erreur lors de la prédiction pour la fenêtre 2: Aucun résultat valide pour la fenêtre 2: [   __nn_distance  index           timestamp  \
0    5041.966797   4094 2020-04-18 08:52:20   
1    5084.498047   4088 2020-04-18 08:51:20   
2    5092.463379   4100 2020-04-18 08:53:20   
3    5110.592773   4093 2020-04-

  6%|████▉                                                                             | 6/100 [00:01<00:16,  5.77it/s]

Réponse brute pour la fenêtre 4: [   __nn_distance  index           timestamp  \
0    5052.827637   4096 2020-04-18 08:52:40   
1    5089.838867   4090 2020-04-18 08:51:40   
2    5097.909668   4102 2020-04-18 08:53:40   
3    5122.583008   4095 2020-04-18 08:52:30   
4    5136.399414   1442 2020-04-18 01:30:20   

                                         sensor_data  panne  
0  [8.914, 1.9819999999999995, 74.62500000000001,...      1  
1  [8.952, 1.994, 74.4, 5.772500000000001, 8.756,...      1  
2  [8.966, 2.001999999999999, 74.22500000000001, ...      1  
3  [8.91, 1.9800000000000004, 74.825, 5.802499999...      1  
4  [8.914, 2.007999999999999, 74.325, 5.6775, 8.7...      1  ]
Erreur lors de la prédiction pour la fenêtre 4: Aucun résultat valide pour la fenêtre 4: [   __nn_distance  index           timestamp  \
0    5052.827637   4096 2020-04-18 08:52:40   
1    5089.838867   4090 2020-04-18 08:51:40   
2    5097.909668   4102 2020-04-18 08:53:40   
3    5122.583008   4095 2020-04-

  8%|██████▌                                                                           | 8/100 [00:01<00:16,  5.62it/s]

Réponse brute pour la fenêtre 6: [   __nn_distance  index           timestamp  \
0    5061.803711   4098 2020-04-18 08:53:00   
1    5091.424316   4092 2020-04-18 08:52:00   
2    5096.759766   4104 2020-04-18 08:54:00   
3    5130.079102   4097 2020-04-18 08:52:50   
4    5139.963867   6593 2020-04-18 15:48:50   

                                         sensor_data  panne  
0  [6.316000000000001, 1.25, 74.62500000000001, 5...      1  
1  [7.154, 1.5579999999999998, 74.62500000000001,...      1  
2  [5.92, 1.1080000000000003, 74.25, 5.0324999999...      1  
3  [8.918, 1.9860000000000009, 74.725, 5.76249999...      1  
4  [6.406000000000001, 1.314, 74.6, 5.31500000000...      1  ]
Erreur lors de la prédiction pour la fenêtre 6: Aucun résultat valide pour la fenêtre 6: [   __nn_distance  index           timestamp  \
0    5061.803711   4098 2020-04-18 08:53:00   
1    5091.424316   4092 2020-04-18 08:52:00   
2    5096.759766   4104 2020-04-18 08:54:00   
3    5130.079102   4097 2020-04-

 10%|████████                                                                         | 10/100 [00:01<00:15,  5.71it/s]

Réponse brute pour la fenêtre 8: [   __nn_distance  index           timestamp  \
0    4969.467773   4100 2020-04-18 08:53:20   
1    4987.444336   4094 2020-04-18 08:52:20   
2    5008.586426   4088 2020-04-18 08:51:20   
3    5009.752930   4104 2020-04-18 08:54:00   
4    5010.641113   4106 2020-04-18 08:54:20   

                                         sensor_data  panne  
0  [8.948, 1.99, 74.62500000000001, 5.77250000000...      1  
1  [8.828, 1.9559999999999995, 74.925, 5.70000000...      1  
2  [8.934, 1.9879999999999995, 74.2, 5.7600000000...      1  
3  [5.92, 1.1080000000000003, 74.25, 5.0324999999...      1  
4  [8.834, 1.958, 74.70000000000002, 5.625, 8.746...      1  ]
Erreur lors de la prédiction pour la fenêtre 8: Aucun résultat valide pour la fenêtre 8: [   __nn_distance  index           timestamp  \
0    4969.467773   4100 2020-04-18 08:53:20   
1    4987.444336   4094 2020-04-18 08:52:20   
2    5008.586426   4088 2020-04-18 08:51:20   
3    5009.752930   4104 2020-04-

 12%|█████████▋                                                                       | 12/100 [00:02<00:15,  5.78it/s]

Réponse brute pour la fenêtre 10: [   __nn_distance  index           timestamp  \
0    4959.585449   4102 2020-04-18 08:53:40   
1    4989.024902   4101 2020-04-18 08:53:30   
2    4994.754883   4096 2020-04-18 08:52:40   
3    4997.372070   4090 2020-04-18 08:51:40   
4    5003.057617   6591 2020-04-18 15:48:30   

                                         sensor_data  panne  
0  [8.966, 2.001999999999999, 74.22500000000001, ...      1  
1  [8.962, 1.9960000000000004, 74.325, 5.65749999...      1  
2  [8.914, 1.9819999999999995, 74.62500000000001,...      1  
3  [8.952, 1.994, 74.4, 5.772500000000001, 8.756,...      1  
4  [8.97, 2.007999999999999, 75.025, 5.785, 8.78,...      1  ]
Erreur lors de la prédiction pour la fenêtre 10: Aucun résultat valide pour la fenêtre 10: [   __nn_distance  index           timestamp  \
0    4959.585449   4102 2020-04-18 08:53:40   
1    4989.024902   4101 2020-04-18 08:53:30   
2    4994.754883   4096 2020-04-18 08:52:40   
3    4997.372070   4090 2020-

 14%|███████████▎                                                                     | 14/100 [00:02<00:15,  5.62it/s]

Réponse brute pour la fenêtre 12: [   __nn_distance  index           timestamp  \
0    4957.199707   4104 2020-04-18 08:54:00   
1    4989.114746   4103 2020-04-18 08:53:50   
2    5000.396484   4092 2020-04-18 08:52:00   
3    5004.374512   6593 2020-04-18 15:48:50   
4    5008.125000   4098 2020-04-18 08:53:00   

                                         sensor_data  panne  
0  [5.92, 1.1080000000000003, 74.25, 5.0324999999...      1  
1  [8.974, 2.001999999999999, 74.2, 5.6325, 8.796...      1  
2  [7.154, 1.5579999999999998, 74.62500000000001,...      1  
3  [6.406000000000001, 1.314, 74.6, 5.31500000000...      1  
4  [6.316000000000001, 1.25, 74.62500000000001, 5...      1  ]
Erreur lors de la prédiction pour la fenêtre 12: Aucun résultat valide pour la fenêtre 12: [   __nn_distance  index           timestamp  \
0    4957.199707   4104 2020-04-18 08:54:00   
1    4989.114746   4103 2020-04-18 08:53:50   
2    5000.396484   4092 2020-04-18 08:52:00   
3    5004.374512   6593 2020-

 16%|████████████▉                                                                    | 16/100 [00:02<00:14,  5.64it/s]

Réponse brute pour la fenêtre 14: [   __nn_distance  index           timestamp  \
0    4993.159668   4106 2020-04-18 08:54:20   
1    5022.937988   4094 2020-04-18 08:52:20   
2    5027.385742   6601 2020-04-18 15:50:10   
3    5034.746094   4105 2020-04-18 08:54:10   
4    5035.610352   6595 2020-04-18 15:49:10   

                                         sensor_data  panne  
0  [8.834, 1.958, 74.70000000000002, 5.625, 8.746...      1  
1  [8.828, 1.9559999999999995, 74.925, 5.70000000...      1  
2  [8.976, 2.007999999999999, 74.47500000000001, ...      1  
3  [7.942, 1.6980000000000004, 74.44999999999999,...      1  
4  [8.788, 1.952, 75.0, 5.620000000000001, 8.776,...      1  ]
Erreur lors de la prédiction pour la fenêtre 14: Aucun résultat valide pour la fenêtre 14: [   __nn_distance  index           timestamp  \
0    4993.159668   4106 2020-04-18 08:54:20   
1    5022.937988   4094 2020-04-18 08:52:20   
2    5027.385742   6601 2020-04-18 15:50:10   
3    5034.746094   4105 2020-

 18%|██████████████▌                                                                  | 18/100 [00:03<00:15,  5.41it/s]

Réponse brute pour la fenêtre 16: [   __nn_distance  index           timestamp  \
0    4990.921387   4108 2020-04-18 08:54:40   
1    5012.813477   6603 2020-04-18 15:50:30   
2    5017.954102   4107 2020-04-18 08:54:30   
3    5019.560547   4096 2020-04-18 08:52:40   
4    5025.327148   4102 2020-04-18 08:53:40   

                                         sensor_data  panne  
0  [8.832, 1.958, 74.62500000000001, 5.7325, 8.68...      1  
1  [9.002, 2.0180000000000007, 74.22500000000001,...      1  
2  [8.892, 1.978, 74.62500000000001, 5.7425, 8.72...      1  
3  [8.914, 1.9819999999999995, 74.62500000000001,...      1  
4  [8.966, 2.001999999999999, 74.22500000000001, ...      1  ]
Erreur lors de la prédiction pour la fenêtre 16: Aucun résultat valide pour la fenêtre 16: [   __nn_distance  index           timestamp  \
0    4990.921387   4108 2020-04-18 08:54:40   
1    5012.813477   6603 2020-04-18 15:50:30   
2    5017.954102   4107 2020-04-18 08:54:30   
3    5019.560547   4096 2020-

 20%|████████████████▏                                                                | 20/100 [00:03<00:14,  5.61it/s]

Réponse brute pour la fenêtre 18: [   __nn_distance  index           timestamp  \
0    4994.938477   4110 2020-04-18 08:55:00   
1    5012.168945   6605 2020-04-18 15:50:50   
2    5020.064453   4109 2020-04-18 08:54:50   
3    5023.384766   4104 2020-04-18 08:54:00   
4    5023.507812   4098 2020-04-18 08:53:00   

                                         sensor_data  panne  
0  [6.2940000000000005, 1.2420000000000009, 74.47...      1  
1  [6.486000000000001, 1.3440000000000012, 74.4, ...      1  
2  [8.834, 1.958, 74.57499999999999, 5.6850000000...      1  
3  [5.92, 1.1080000000000003, 74.25, 5.0324999999...      1  
4  [6.316000000000001, 1.25, 74.62500000000001, 5...      1  ]
Erreur lors de la prédiction pour la fenêtre 18: Aucun résultat valide pour la fenêtre 18: [   __nn_distance  index           timestamp  \
0    4994.938477   4110 2020-04-18 08:55:00   
1    5012.168945   6605 2020-04-18 15:50:50   
2    5020.064453   4109 2020-04-18 08:54:50   
3    5023.384766   4104 2020-

 22%|█████████████████▊                                                               | 22/100 [00:03<00:13,  5.71it/s]

Réponse brute pour la fenêtre 20: [   __nn_distance  index           timestamp  \
0    5013.826172   6601 2020-04-18 15:50:10   
1    5016.675781   4112 2020-04-18 08:55:20   
2    5044.450195   6607 2020-04-18 15:51:10   
3    5048.393066   4100 2020-04-18 08:53:20   
4    5056.581055   4106 2020-04-18 08:54:20   

                                         sensor_data  panne  
0  [8.976, 2.007999999999999, 74.47500000000001, ...      1  
1  [8.878, 1.9699999999999989, 74.15, 5.782499999...      1  
2  [8.844, 1.9720000000000013, 74.62500000000001,...      1  
3  [8.948, 1.99, 74.62500000000001, 5.77250000000...      1  
4  [8.834, 1.958, 74.70000000000002, 5.625, 8.746...      1  ]
Erreur lors de la prédiction pour la fenêtre 20: Aucun résultat valide pour la fenêtre 20: [   __nn_distance  index           timestamp  \
0    5013.826172   6601 2020-04-18 15:50:10   
1    5016.675781   4112 2020-04-18 08:55:20   
2    5044.450195   6607 2020-04-18 15:51:10   
3    5048.393066   4100 2020-

 24%|███████████████████▍                                                             | 24/100 [00:04<00:13,  5.49it/s]

Réponse brute pour la fenêtre 22: [   __nn_distance  index           timestamp  \
0    5002.889648   6603 2020-04-18 15:50:30   
1    5007.490234   4114 2020-04-18 08:55:40   
2    5032.491699   4113 2020-04-18 08:55:30   
3    5035.305664   6602 2020-04-18 15:50:20   
4    5037.363770   4102 2020-04-18 08:53:40   

                                         sensor_data  panne  
0  [9.002, 2.0180000000000007, 74.22500000000001,...      1  
1  [8.898, 1.975999999999999, 73.725, 5.745000000...      1  
2  [8.892, 1.974, 73.9, 5.6175, 8.694, 8.898, 1.9...      1  
3  [8.994, 2.0120000000000005, 74.47500000000001,...      1  
4  [8.966, 2.001999999999999, 74.22500000000001, ...      1  ]
Erreur lors de la prédiction pour la fenêtre 22: Aucun résultat valide pour la fenêtre 22: [   __nn_distance  index           timestamp  \
0    5002.889648   6603 2020-04-18 15:50:30   
1    5007.490234   4114 2020-04-18 08:55:40   
2    5032.491699   4113 2020-04-18 08:55:30   
3    5035.305664   6602 2020-

 26%|█████████████████████                                                            | 26/100 [00:04<00:13,  5.52it/s]

Réponse brute pour la fenêtre 24: [   __nn_distance  index           timestamp  \
0    5003.368164   6605 2020-04-18 15:50:50   
1    5007.872559   4116 2020-04-18 08:56:00   
2    5034.099609   4115 2020-04-18 08:55:50   
3    5035.433594   4104 2020-04-18 08:54:00   
4    5035.604492   6604 2020-04-18 15:50:40   

                                         sensor_data  panne  
0  [6.486000000000001, 1.3440000000000012, 74.4, ...      1  
1  [5.882, 1.1039999999999992, 74.15, 5.135000000...      1  
2  [8.914, 1.984, 73.875, 5.700000000000001, 8.72...      1  
3  [5.92, 1.1080000000000003, 74.25, 5.0324999999...      1  
4  [9.012, 2.024000000000001, 74.2, 5.68249999999...      1  ]
Erreur lors de la prédiction pour la fenêtre 24: Aucun résultat valide pour la fenêtre 24: [   __nn_distance  index           timestamp  \
0    5003.368164   6605 2020-04-18 15:50:50   
1    5007.872559   4116 2020-04-18 08:56:00   
2    5034.099609   4115 2020-04-18 08:55:50   
3    5035.433594   4104 2020-

 28%|██████████████████████▋                                                          | 28/100 [00:05<00:13,  5.39it/s]

Réponse brute pour la fenêtre 26: [   __nn_distance  index           timestamp  \
0    5035.212891   6607 2020-04-18 15:51:10   
1    5046.646484   4118 2020-04-18 08:56:20   
2    5064.403320   1914 2020-04-18 02:49:00   
3    5065.752930   4106 2020-04-18 08:54:20   
4    5069.477539   4112 2020-04-18 08:55:20   

                                         sensor_data  panne  
0  [8.844, 1.9720000000000013, 74.62500000000001,...      1  
1  [8.86, 1.9640000000000004, 74.35000000000001, ...      1  
2  [8.898, 1.998000000000001, 74.44999999999999, ...      1  
3  [8.834, 1.958, 74.70000000000002, 5.625, 8.746...      1  
4  [8.878, 1.9699999999999989, 74.15, 5.782499999...      1  ]
Erreur lors de la prédiction pour la fenêtre 26: Aucun résultat valide pour la fenêtre 26: [   __nn_distance  index           timestamp  \
0    5035.212891   6607 2020-04-18 15:51:10   
1    5046.646484   4118 2020-04-18 08:56:20   
2    5064.403320   1914 2020-04-18 02:49:00   
3    5065.752930   4106 2020-

 30%|████████████████████████▎                                                        | 30/100 [00:05<00:13,  5.38it/s]

Réponse brute pour la fenêtre 28: [   __nn_distance  index           timestamp  \
0    5033.113281   6609 2020-04-18 15:51:30   
1    5043.743164   4120 2020-04-18 08:56:40   
2    5055.210449   4108 2020-04-18 08:54:40   
3    5059.901855   4114 2020-04-18 08:55:40   
4    5061.307617   1916 2020-04-18 02:49:20   

                                         sensor_data  panne  
0  [8.958, 2.0, 74.75, 5.68, 8.818, 8.962, 2.006,...      1  
1  [8.876, 1.9699999999999989, 74.25, 5.629999999...      1  
2  [8.832, 1.958, 74.62500000000001, 5.7325, 8.68...      1  
3  [8.898, 1.975999999999999, 73.725, 5.745000000...      1  
4  [8.906, 2.001999999999999, 74.175, 5.762499999...      1  ]
Erreur lors de la prédiction pour la fenêtre 28: Aucun résultat valide pour la fenêtre 28: [   __nn_distance  index           timestamp  \
0    5033.113281   6609 2020-04-18 15:51:30   
1    5043.743164   4120 2020-04-18 08:56:40   
2    5055.210449   4108 2020-04-18 08:54:40   
3    5059.901855   4114 2020-

 32%|█████████████████████████▉                                                       | 32/100 [00:05<00:12,  5.36it/s]

Réponse brute pour la fenêtre 30: [   __nn_distance  index           timestamp  \
0    5038.868164   6611 2020-04-18 15:51:50   
1    5048.400391   4122 2020-04-18 08:57:00   
2    5052.234863   4110 2020-04-18 08:55:00   
3    5060.747070   4109 2020-04-18 08:54:50   
4    5062.098145   4116 2020-04-18 08:56:00   

                                         sensor_data  panne  
0  [6.348000000000001, 1.2599999999999998, 74.524...      1  
1  [6.476000000000001, 1.251999999999999, 74.175,...      1  
2  [6.2940000000000005, 1.2420000000000009, 74.47...      1  
3  [8.834, 1.958, 74.57499999999999, 5.6850000000...      1  
4  [5.882, 1.1039999999999992, 74.15, 5.135000000...      1  ]
Erreur lors de la prédiction pour la fenêtre 30: Aucun résultat valide pour la fenêtre 30: [   __nn_distance  index           timestamp  \
0    5038.868164   6611 2020-04-18 15:51:50   
1    5048.400391   4122 2020-04-18 08:57:00   
2    5052.234863   4110 2020-04-18 08:55:00   
3    5060.747070   4109 2020-

 34%|███████████████████████████▌                                                     | 34/100 [00:06<00:11,  5.52it/s]

Réponse brute pour la fenêtre 32: [   __nn_distance  index           timestamp  \
0    4964.879395   4077 2020-04-18 08:49:30   
1    4969.038574   1434 2020-04-18 01:29:00   
2    4986.416504   1446 2020-04-18 01:31:00   
3    5000.714355   1920 2020-04-18 02:50:00   
4    5001.824219   4634 2020-04-18 10:22:20   

                                         sensor_data  panne  
0  [9.022, 2.0180000000000007, 75.1, 5.8000000000...      1  
1  [8.944, 2.014, 74.275, 5.7225, 8.752, 8.952, 2...      1  
2  [8.946, 2.016, 74.47500000000001, 5.805, 8.754...      1  
3  [8.938, 2.007999999999999, 74.4, 5.785, 8.744,...      1  
4  [8.946, 2.004, 75.22500000000001, 5.805, 8.75,...      1  ]
Erreur lors de la prédiction pour la fenêtre 32: Aucun résultat valide pour la fenêtre 32: [   __nn_distance  index           timestamp  \
0    4964.879395   4077 2020-04-18 08:49:30   
1    4969.038574   1434 2020-04-18 01:29:00   
2    4986.416504   1446 2020-04-18 01:31:00   
3    5000.714355   1920 2020-

 36%|█████████████████████████████▏                                                   | 36/100 [00:06<00:11,  5.36it/s]

Réponse brute pour la fenêtre 34: [   __nn_distance  index           timestamp  \
0    4785.652832   4079 2020-04-18 08:49:50   
1    4798.818359   1436 2020-04-18 01:29:20   
2    4814.783203   1448 2020-04-18 01:31:20   
3    4828.059570   4636 2020-04-18 10:22:40   
4    4831.457031   1922 2020-04-18 02:50:20   

                                         sensor_data  panne  
0  [9.032, 2.016, 74.70000000000002, 5.83, 8.856,...      1  
1  [8.96, 2.026, 74.15, 5.827500000000001, 8.776,...      1  
2  [8.96, 2.022, 74.175, 5.75, 8.776, 5.800000000...      1  
3  [8.962, 2.01, 75.52499999999999, 5.815, 8.78, ...      1  
4  [8.95, 2.0180000000000007, 74.25, 5.8099999999...      1  ]
Erreur lors de la prédiction pour la fenêtre 34: Aucun résultat valide pour la fenêtre 34: [   __nn_distance  index           timestamp  \
0    4785.652832   4079 2020-04-18 08:49:50   
1    4798.818359   1436 2020-04-18 01:29:20   
2    4814.783203   1448 2020-04-18 01:31:20   
3    4828.059570   4636 2020-

 38%|██████████████████████████████▊                                                  | 38/100 [00:06<00:11,  5.62it/s]

Réponse brute pour la fenêtre 36: [   __nn_distance  index           timestamp  \
0    4626.517578   4081 2020-04-18 08:50:10   
1    4651.672363   4075 2020-04-18 08:49:10   
2    4664.617188   1437 2020-04-18 01:29:30   
3    4673.750977   4638 2020-04-18 10:23:00   
4    4673.904297   1438 2020-04-18 01:29:40   

                                         sensor_data  panne  
0  [7.83, 1.6660000000000004, 74.55000000000001, ...      1  
1  [8.066, 1.731999999999999, 75.2, 5.43, 8.836, ...      1  
2  [6.0, 1.193999999999999, 74.15, 5.162500000000...      1  
3  [7.818, 1.67, 75.8, 5.515000000000001, 8.776, ...      1  
4  [7.859999999999999, 1.6920000000000002, 74.25,...      1  ]
Erreur lors de la prédiction pour la fenêtre 36: Aucun résultat valide pour la fenêtre 36: [   __nn_distance  index           timestamp  \
0    4626.517578   4081 2020-04-18 08:50:10   
1    4651.672363   4075 2020-04-18 08:49:10   
2    4664.617188   1437 2020-04-18 01:29:30   
3    4673.750977   4638 2020-

 40%|████████████████████████████████▍                                                | 40/100 [00:07<00:10,  5.80it/s]

Réponse brute pour la fenêtre 38: [   __nn_distance  index           timestamp  \
0    4474.348633   4083 2020-04-18 08:50:30   
1    4483.157715   4077 2020-04-18 08:49:30   
2    4508.137695   4640 2020-04-18 10:23:20   
3    4515.881836   4634 2020-04-18 10:22:20   
4    4518.310547   4081 2020-04-18 08:50:10   

                                         sensor_data  panne  
0  [8.976, 2.001999999999999, 74.55000000000001, ...      1  
1  [9.022, 2.0180000000000007, 75.1, 5.8000000000...      1  
2  [8.916, 1.9920000000000009, 75.8, 5.8099999999...      1  
3  [8.946, 2.004, 75.22500000000001, 5.805, 8.75,...      1  
4  [7.83, 1.6660000000000004, 74.55000000000001, ...      1  ]
Erreur lors de la prédiction pour la fenêtre 38: Aucun résultat valide pour la fenêtre 38: [   __nn_distance  index           timestamp  \
0    4474.348633   4083 2020-04-18 08:50:30   
1    4483.157715   4077 2020-04-18 08:49:30   
2    4508.137695   4640 2020-04-18 10:23:20   
3    4515.881836   4634 2020-

 42%|██████████████████████████████████                                               | 42/100 [00:07<00:10,  5.76it/s]

Réponse brute pour la fenêtre 40: [   __nn_distance  index           timestamp  \
0    4449.166992   4085 2020-04-18 08:50:50   
1    4450.238281   4079 2020-04-18 08:49:50   
2    4466.869141   4642 2020-04-18 10:23:40   
3    4482.451172   4636 2020-04-18 10:22:40   
4    4486.051758   4073 2020-04-18 08:48:50   

                                         sensor_data  panne  
0  [8.976, 2.004, 74.15, 5.789999999999999, 8.836...      1  
1  [9.032, 2.016, 74.70000000000002, 5.83, 8.856,...      1  
2  [8.924, 1.9960000000000004, 75.42500000000001,...      1  
3  [8.962, 2.01, 75.52499999999999, 5.815, 8.78, ...      1  
4  [8.986, 2.006, 75.64999999999999, 5.8125, 8.84...      1  ]
Erreur lors de la prédiction pour la fenêtre 40: Aucun résultat valide pour la fenêtre 40: [   __nn_distance  index           timestamp  \
0    4449.166992   4085 2020-04-18 08:50:50   
1    4450.238281   4079 2020-04-18 08:49:50   
2    4466.869141   4642 2020-04-18 10:23:40   
3    4482.451172   4636 2020-

 44%|███████████████████████████████████▋                                             | 44/100 [00:07<00:09,  5.85it/s]

Réponse brute pour la fenêtre 42: [   __nn_distance  index           timestamp  \
0    4431.658203   4081 2020-04-18 08:50:10   
1    4431.961914   4087 2020-04-18 08:51:10   
2    4438.370117   4644 2020-04-18 10:24:00   
3    4450.637207   4075 2020-04-18 08:49:10   
4    4451.455078   4638 2020-04-18 10:23:00   

                                         sensor_data  panne  
0  [7.83, 1.6660000000000004, 74.55000000000001, ...      1  
1  [8.18, 1.768000000000001, 73.95, 5.55749999999...      1  
2  [8.194, 1.782, 75.69999999999999, 5.6325, 8.77...      1  
3  [8.066, 1.731999999999999, 75.2, 5.43, 8.836, ...      1  
4  [7.818, 1.67, 75.8, 5.515000000000001, 8.776, ...      1  ]
Erreur lors de la prédiction pour la fenêtre 42: Aucun résultat valide pour la fenêtre 42: [   __nn_distance  index           timestamp  \
0    4431.658203   4081 2020-04-18 08:50:10   
1    4431.961914   4087 2020-04-18 08:51:10   
2    4438.370117   4644 2020-04-18 10:24:00   
3    4450.637207   4075 2020-

 46%|█████████████████████████████████████▎                                           | 46/100 [00:08<00:09,  5.85it/s]

Réponse brute pour la fenêtre 44: [   __nn_distance  index           timestamp  \
0    4424.673340   4646 2020-04-18 10:24:20   
1    4431.085938   4083 2020-04-18 08:50:30   
2    4433.347656   4640 2020-04-18 10:23:20   
3    4436.601074   4089 2020-04-18 08:51:30   
4    4446.716309   4077 2020-04-18 08:49:30   

                                         sensor_data  panne  
0  [8.974, 2.0120000000000005, 75.825, 5.70999999...      1  
1  [8.976, 2.001999999999999, 74.55000000000001, ...      1  
2  [8.916, 1.9920000000000009, 75.8, 5.8099999999...      1  
3  [8.948, 1.994, 74.4, 5.7475000000000005, 8.754...      1  
4  [9.022, 2.0180000000000007, 75.1, 5.8000000000...      1  ]
Erreur lors de la prédiction pour la fenêtre 44: Aucun résultat valide pour la fenêtre 44: [   __nn_distance  index           timestamp  \
0    4424.673340   4646 2020-04-18 10:24:20   
1    4431.085938   4083 2020-04-18 08:50:30   
2    4433.347656   4640 2020-04-18 10:23:20   
3    4436.601074   4089 2020-

 48%|██████████████████████████████████████▉                                          | 48/100 [00:08<00:09,  5.74it/s]

Réponse brute pour la fenêtre 46: [   __nn_distance  index           timestamp  \
0    4418.964844   4648 2020-04-18 10:24:40   
1    4428.480469   4642 2020-04-18 10:23:40   
2    4438.134766   4085 2020-04-18 08:50:50   
3    4439.406738   4091 2020-04-18 08:51:50   
4    4449.846191   4079 2020-04-18 08:49:50   

                                         sensor_data  panne  
0  [8.986, 2.016, 75.05, 5.794999999999998, 8.808...      1  
1  [8.924, 1.9960000000000004, 75.42500000000001,...      1  
2  [8.976, 2.004, 74.15, 5.789999999999999, 8.836...      1  
3  [8.948, 1.998000000000001, 74.52499999999999, ...      1  
4  [9.032, 2.016, 74.70000000000002, 5.83, 8.856,...      1  ]
Erreur lors de la prédiction pour la fenêtre 46: Aucun résultat valide pour la fenêtre 46: [   __nn_distance  index           timestamp  \
0    4418.964844   4648 2020-04-18 10:24:40   
1    4428.480469   4642 2020-04-18 10:23:40   
2    4438.134766   4085 2020-04-18 08:50:50   
3    4439.406738   4091 2020-

 50%|████████████████████████████████████████▌                                        | 50/100 [00:08<00:08,  5.68it/s]

Réponse brute pour la fenêtre 48: [   __nn_distance  index           timestamp  \
0    4430.375977   4650 2020-04-18 10:25:00   
1    4437.117188   4644 2020-04-18 10:24:00   
2    4450.199219   4093 2020-04-18 08:52:10   
3    4452.649414   4087 2020-04-18 08:51:10   
4    4465.081055   4081 2020-04-18 08:50:10   

                                         sensor_data  panne  
0  [7.946, 1.7100000000000009, 74.77499999999999,...      1  
1  [8.194, 1.782, 75.69999999999999, 5.6325, 8.77...      1  
2  [7.818, 1.661999999999999, 74.62500000000001, ...      1  
3  [8.18, 1.768000000000001, 73.95, 5.55749999999...      1  
4  [7.83, 1.6660000000000004, 74.55000000000001, ...      1  ]
Erreur lors de la prédiction pour la fenêtre 48: Aucun résultat valide pour la fenêtre 48: [   __nn_distance  index           timestamp  \
0    4430.375977   4650 2020-04-18 10:25:00   
1    4437.117188   4644 2020-04-18 10:24:00   
2    4450.199219   4093 2020-04-18 08:52:10   
3    4452.649414   4087 2020-

 52%|██████████████████████████████████████████                                       | 52/100 [00:09<00:08,  5.74it/s]

Réponse brute pour la fenêtre 50: [   __nn_distance  index           timestamp  \
0    4450.683105   4652 2020-04-18 10:25:20   
1    4461.067383   4646 2020-04-18 10:24:20   
2    4471.821289   4095 2020-04-18 08:52:30   
3    4476.384277   4089 2020-04-18 08:51:30   
4    4489.562988   4083 2020-04-18 08:50:30   

                                         sensor_data  panne  
0  [8.936, 2.0, 75.4, 5.797499999999999, 8.786, 8...      1  
1  [8.974, 2.0120000000000005, 75.825, 5.70999999...      1  
2  [8.91, 1.9800000000000004, 74.825, 5.802499999...      1  
3  [8.948, 1.994, 74.4, 5.7475000000000005, 8.754...      1  
4  [8.976, 2.001999999999999, 74.55000000000001, ...      1  ]
Erreur lors de la prédiction pour la fenêtre 50: Aucun résultat valide pour la fenêtre 50: [   __nn_distance  index           timestamp  \
0    4450.683105   4652 2020-04-18 10:25:20   
1    4461.067383   4646 2020-04-18 10:24:20   
2    4471.821289   4095 2020-04-18 08:52:30   
3    4476.384277   4089 2020-

 54%|███████████████████████████████████████████▋                                     | 54/100 [00:09<00:08,  5.67it/s]

Réponse brute pour la fenêtre 52: [   __nn_distance  index           timestamp  \
0    4466.671387   4654 2020-04-18 10:25:40   
1    4476.710449   4648 2020-04-18 10:24:40   
2    4487.392578   4091 2020-04-18 08:51:50   
3    4489.885254   4097 2020-04-18 08:52:50   
4    4508.775391   4085 2020-04-18 08:50:50   

                                         sensor_data  panne  
0  [8.94, 2.001999999999999, 75.95, 5.78249999999...      1  
1  [8.986, 2.016, 75.05, 5.794999999999998, 8.808...      1  
2  [8.948, 1.998000000000001, 74.52499999999999, ...      1  
3  [8.918, 1.9860000000000009, 74.725, 5.76249999...      1  
4  [8.976, 2.004, 74.15, 5.789999999999999, 8.836...      1  ]
Erreur lors de la prédiction pour la fenêtre 52: Aucun résultat valide pour la fenêtre 52: [   __nn_distance  index           timestamp  \
0    4466.671387   4654 2020-04-18 10:25:40   
1    4476.710449   4648 2020-04-18 10:24:40   
2    4487.392578   4091 2020-04-18 08:51:50   
3    4489.885254   4097 2020-

 56%|█████████████████████████████████████████████▎                                   | 56/100 [00:10<00:07,  5.55it/s]

Réponse brute pour la fenêtre 54: [   __nn_distance  index           timestamp  \
0    4494.218262   4656 2020-04-18 10:26:00   
1    4498.253906   4650 2020-04-18 10:25:00   
2    4503.763184   4093 2020-04-18 08:52:10   
3    4514.168945   4099 2020-04-18 08:53:10   
4    4526.169922   4087 2020-04-18 08:51:10   

                                         sensor_data  panne  
0  [8.26, 1.8000000000000007, 76.1, 5.49500000000...      1  
1  [7.946, 1.7100000000000009, 74.77499999999999,...      1  
2  [7.818, 1.661999999999999, 74.62500000000001, ...      1  
3  [8.152, 1.7639999999999991, 74.47500000000001,...      1  
4  [8.18, 1.768000000000001, 73.95, 5.55749999999...      1  ]
Erreur lors de la prédiction pour la fenêtre 54: Aucun résultat valide pour la fenêtre 54: [   __nn_distance  index           timestamp  \
0    4494.218262   4656 2020-04-18 10:26:00   
1    4498.253906   4650 2020-04-18 10:25:00   
2    4503.763184   4093 2020-04-18 08:52:10   
3    4514.168945   4099 2020-

 58%|██████████████████████████████████████████████▉                                  | 58/100 [00:10<00:07,  5.43it/s]

Réponse brute pour la fenêtre 56: [   __nn_distance  index           timestamp  \
0    4634.766602   4652 2020-04-18 10:25:20   
1    4639.918945   4658 2020-04-18 10:26:20   
2    4640.126953   4101 2020-04-18 08:53:30   
3    4640.212891   4095 2020-04-18 08:52:30   
4    4645.031250   4089 2020-04-18 08:51:30   

                                         sensor_data  panne  
0  [8.936, 2.0, 75.4, 5.797499999999999, 8.786, 8...      1  
1  [8.98, 2.016, 75.89999999999999, 5.76750000000...      1  
2  [8.962, 1.9960000000000004, 74.325, 5.65749999...      1  
3  [8.91, 1.9800000000000004, 74.825, 5.802499999...      1  
4  [8.948, 1.994, 74.4, 5.7475000000000005, 8.754...      1  ]
Erreur lors de la prédiction pour la fenêtre 56: Aucun résultat valide pour la fenêtre 56: [   __nn_distance  index           timestamp  \
0    4634.766602   4652 2020-04-18 10:25:20   
1    4639.918945   4658 2020-04-18 10:26:20   
2    4640.126953   4101 2020-04-18 08:53:30   
3    4640.212891   4095 2020-

 60%|████████████████████████████████████████████████▌                                | 60/100 [00:10<00:07,  5.47it/s]

Réponse brute pour la fenêtre 58: [   __nn_distance  index           timestamp  \
0    4803.308105   4103 2020-04-18 08:53:50   
1    4812.323730   4091 2020-04-18 08:51:50   
2    4814.857422   4654 2020-04-18 10:25:40   
3    4819.929688   4097 2020-04-18 08:52:50   
4    4825.842773   4660 2020-04-18 10:26:40   

                                         sensor_data  panne  
0  [8.974, 2.001999999999999, 74.2, 5.6325, 8.796...      1  
1  [8.948, 1.998000000000001, 74.52499999999999, ...      1  
2  [8.94, 2.001999999999999, 75.95, 5.78249999999...      1  
3  [8.918, 1.9860000000000009, 74.725, 5.76249999...      1  
4  [9.002, 2.022, 75.22500000000001, 5.6824999999...      1  ]
Erreur lors de la prédiction pour la fenêtre 58: Aucun résultat valide pour la fenêtre 58: [   __nn_distance  index           timestamp  \
0    4803.308105   4103 2020-04-18 08:53:50   
1    4812.323730   4091 2020-04-18 08:51:50   
2    4814.857422   4654 2020-04-18 10:25:40   
3    4819.929688   4097 2020-

 62%|██████████████████████████████████████████████████▏                              | 62/100 [00:11<00:06,  5.70it/s]

Réponse brute pour la fenêtre 60: [   __nn_distance  index           timestamp  \
0    4913.725586   4103 2020-04-18 08:53:50   
1    4916.279785   4093 2020-04-18 08:52:10   
2    4916.762695   4105 2020-04-18 08:54:10   
3    4918.475098   4104 2020-04-18 08:54:00   
4    4918.751953   6604 2020-04-18 15:50:40   

                                         sensor_data  panne  
0  [8.974, 2.001999999999999, 74.2, 5.6325, 8.796...      1  
1  [7.818, 1.661999999999999, 74.62500000000001, ...      1  
2  [7.942, 1.6980000000000004, 74.44999999999999,...      1  
3  [5.92, 1.1080000000000003, 74.25, 5.0324999999...      1  
4  [9.012, 2.024000000000001, 74.2, 5.68249999999...      1  ]
Erreur lors de la prédiction pour la fenêtre 60: Aucun résultat valide pour la fenêtre 60: [   __nn_distance  index           timestamp  \
0    4913.725586   4103 2020-04-18 08:53:50   
1    4916.279785   4093 2020-04-18 08:52:10   
2    4916.762695   4105 2020-04-18 08:54:10   
3    4918.475098   4104 2020-

 64%|███████████████████████████████████████████████████▊                             | 64/100 [00:11<00:06,  5.75it/s]

Réponse brute pour la fenêtre 62: [   __nn_distance  index           timestamp  \
0    4878.390625   4107 2020-04-18 08:54:30   
1    4880.797852   4095 2020-04-18 08:52:30   
2    4889.744141   6602 2020-04-18 15:50:20   
3    4891.796875   4101 2020-04-18 08:53:30   
4    4898.784668   4104 2020-04-18 08:54:00   

                                         sensor_data  panne  
0  [8.892, 1.978, 74.62500000000001, 5.7425, 8.72...      1  
1  [8.91, 1.9800000000000004, 74.825, 5.802499999...      1  
2  [8.994, 2.0120000000000005, 74.47500000000001,...      1  
3  [8.962, 1.9960000000000004, 74.325, 5.65749999...      1  
4  [5.92, 1.1080000000000003, 74.25, 5.0324999999...      1  ]
Erreur lors de la prédiction pour la fenêtre 62: Aucun résultat valide pour la fenêtre 62: [   __nn_distance  index           timestamp  \
0    4878.390625   4107 2020-04-18 08:54:30   
1    4880.797852   4095 2020-04-18 08:52:30   
2    4889.744141   6602 2020-04-18 15:50:20   
3    4891.796875   4101 2020-

 66%|█████████████████████████████████████████████████████▍                           | 66/100 [00:11<00:05,  5.79it/s]

Réponse brute pour la fenêtre 64: [   __nn_distance  index           timestamp  \
0    4861.259766   6604 2020-04-18 15:50:40   
1    4862.284180   4109 2020-04-18 08:54:50   
2    4866.053223   4103 2020-04-18 08:53:50   
3    4866.270508   4097 2020-04-18 08:52:50   
4    4871.300781   6602 2020-04-18 15:50:20   

                                         sensor_data  panne  
0  [9.012, 2.024000000000001, 74.2, 5.68249999999...      1  
1  [8.834, 1.958, 74.57499999999999, 5.6850000000...      1  
2  [8.974, 2.001999999999999, 74.2, 5.6325, 8.796...      1  
3  [8.918, 1.9860000000000009, 74.725, 5.76249999...      1  
4  [8.994, 2.0120000000000005, 74.47500000000001,...      1  ]
Erreur lors de la prédiction pour la fenêtre 64: Aucun résultat valide pour la fenêtre 64: [   __nn_distance  index           timestamp  \
0    4861.259766   6604 2020-04-18 15:50:40   
1    4862.284180   4109 2020-04-18 08:54:50   
2    4866.053223   4103 2020-04-18 08:53:50   
3    4866.270508   4097 2020-

 68%|███████████████████████████████████████████████████████                          | 68/100 [00:12<00:05,  5.88it/s]

Réponse brute pour la fenêtre 66: [   __nn_distance  index           timestamp  \
0    4857.302734   6604 2020-04-18 15:50:40   
1    4862.540527   6605 2020-04-18 15:50:50   
2    4879.557617   4115 2020-04-18 08:55:50   
3    4885.757812   6610 2020-04-18 15:51:40   
4    4886.574707   4109 2020-04-18 08:54:50   

                                         sensor_data  panne  
0  [9.012, 2.024000000000001, 74.2, 5.68249999999...      1  
1  [6.486000000000001, 1.3440000000000012, 74.4, ...      1  
2  [8.914, 1.984, 73.875, 5.700000000000001, 8.72...      1  
3  [8.962, 2.006, 74.64999999999999, 5.7325, 8.82...      1  
4  [8.834, 1.958, 74.57499999999999, 5.6850000000...      1  ]
Erreur lors de la prédiction pour la fenêtre 66: Aucun résultat valide pour la fenêtre 66: [   __nn_distance  index           timestamp  \
0    4857.302734   6604 2020-04-18 15:50:40   
1    4862.540527   6605 2020-04-18 15:50:50   
2    4879.557617   4115 2020-04-18 08:55:50   
3    4885.757812   6610 2020-

 70%|████████████████████████████████████████████████████████▋                        | 70/100 [00:12<00:05,  5.87it/s]

Réponse brute pour la fenêtre 68: [   __nn_distance  index           timestamp  \
0    4859.114746   6602 2020-04-18 15:50:20   
1    4860.938965   4113 2020-04-18 08:55:30   
2    4870.311523   4101 2020-04-18 08:53:30   
3    4872.442871   6608 2020-04-18 15:51:20   
4    4875.599609   4107 2020-04-18 08:54:30   

                                         sensor_data  panne  
0  [8.994, 2.0120000000000005, 74.47500000000001,...      1  
1  [8.892, 1.974, 73.9, 5.6175, 8.694, 8.898, 1.9...      1  
2  [8.962, 1.9960000000000004, 74.325, 5.65749999...      1  
3  [8.962, 2.004, 74.675, 5.82, 8.81, 8.958, 2.0,...      1  
4  [8.892, 1.978, 74.62500000000001, 5.7425, 8.72...      1  ]
Erreur lors de la prédiction pour la fenêtre 68: Aucun résultat valide pour la fenêtre 68: [   __nn_distance  index           timestamp  \
0    4859.114746   6602 2020-04-18 15:50:20   
1    4860.938965   4113 2020-04-18 08:55:30   
2    4870.311523   4101 2020-04-18 08:53:30   
3    4872.442871   6608 2020-

 72%|██████████████████████████████████████████████████████████▎                      | 72/100 [00:12<00:04,  5.84it/s]

Réponse brute pour la fenêtre 70: [   __nn_distance  index           timestamp  \
0    4860.495605   4115 2020-04-18 08:55:50   
1    4861.196777   6604 2020-04-18 15:50:40   
2    4872.991211   4103 2020-04-18 08:53:50   
3    4877.305664   4109 2020-04-18 08:54:50   
4    4879.361328   6610 2020-04-18 15:51:40   

                                         sensor_data  panne  
0  [8.914, 1.984, 73.875, 5.700000000000001, 8.72...      1  
1  [9.012, 2.024000000000001, 74.2, 5.68249999999...      1  
2  [8.974, 2.001999999999999, 74.2, 5.6325, 8.796...      1  
3  [8.834, 1.958, 74.57499999999999, 5.6850000000...      1  
4  [8.962, 2.006, 74.64999999999999, 5.7325, 8.82...      1  ]
Erreur lors de la prédiction pour la fenêtre 70: Aucun résultat valide pour la fenêtre 70: [   __nn_distance  index           timestamp  \
0    4860.495605   4115 2020-04-18 08:55:50   
1    4861.196777   6604 2020-04-18 15:50:40   
2    4872.991211   4103 2020-04-18 08:53:50   
3    4877.305664   4109 2020-

 74%|███████████████████████████████████████████████████████████▉                     | 74/100 [00:13<00:04,  5.81it/s]

Réponse brute pour la fenêtre 72: [   __nn_distance  index           timestamp  \
0    4892.843750   6610 2020-04-18 15:51:40   
1    4899.581055   4115 2020-04-18 08:55:50   
2    4900.732422   4887 2020-04-18 11:04:30   
3    4901.647949   6611 2020-04-18 15:51:50   
4    4907.777832   6604 2020-04-18 15:50:40   

                                         sensor_data  panne  
0  [8.962, 2.006, 74.64999999999999, 5.7325, 8.82...      1  
1  [8.914, 1.984, 73.875, 5.700000000000001, 8.72...      1  
2  [7.689999999999999, 1.6359999999999992, 75.025...      1  
3  [6.348000000000001, 1.2599999999999998, 74.524...      1  
4  [9.012, 2.024000000000001, 74.2, 5.68249999999...      1  ]
Erreur lors de la prédiction pour la fenêtre 72: Aucun résultat valide pour la fenêtre 72: [   __nn_distance  index           timestamp  \
0    4892.843750   6610 2020-04-18 15:51:40   
1    4899.581055   4115 2020-04-18 08:55:50   
2    4900.732422   4887 2020-04-18 11:04:30   
3    4901.647949   6611 2020-

 76%|█████████████████████████████████████████████████████████████▌                   | 76/100 [00:13<00:04,  5.87it/s]

Réponse brute pour la fenêtre 74: [   __nn_distance  index           timestamp  \
0    4886.400391   4889 2020-04-18 11:04:50   
1    4888.722168   6827 2020-04-18 16:27:50   
2    4894.380859   4113 2020-04-18 08:55:30   
3    4901.593750   6608 2020-04-18 15:51:20   
4    4902.353027   4119 2020-04-18 08:56:30   

                                         sensor_data  panne  
0  [9.014, 2.02, 75.35000000000001, 5.67499999999...      1  
1  [8.888, 1.9800000000000004, 75.275, 5.74500000...      1  
2  [8.892, 1.974, 73.9, 5.6175, 8.694, 8.898, 1.9...      1  
3  [8.962, 2.004, 74.675, 5.82, 8.81, 8.958, 2.0,...      1  
4  [8.87, 1.9640000000000004, 74.35000000000001, ...      1  ]
Erreur lors de la prédiction pour la fenêtre 74: Aucun résultat valide pour la fenêtre 74: [   __nn_distance  index           timestamp  \
0    4886.400391   4889 2020-04-18 11:04:50   
1    4888.722168   6827 2020-04-18 16:27:50   
2    4894.380859   4113 2020-04-18 08:55:30   
3    4901.593750   6608 2020-

 78%|███████████████████████████████████████████████████████████████▏                 | 78/100 [00:13<00:03,  5.83it/s]

Réponse brute pour la fenêtre 76: [   __nn_distance  index           timestamp  \
0    4890.716797   6829 2020-04-18 16:28:10   
1    4892.084961   4891 2020-04-18 11:05:10   
2    4902.434082   4115 2020-04-18 08:55:50   
3    4905.055664   4623 2020-04-18 10:20:30   
4    4906.715820   4109 2020-04-18 08:54:50   

                                         sensor_data  panne  
0  [8.9, 1.9860000000000009, 75.2, 5.789999999999...      1  
1  [9.012, 2.022, 75.125, 5.805, 8.882, 9.02, 2.0...      1  
2  [8.914, 1.984, 73.875, 5.700000000000001, 8.72...      1  
3  [8.96, 2.006, 75.25, 5.77, 8.774, 8.97, 2.01, ...      1  
4  [8.834, 1.958, 74.57499999999999, 5.6850000000...      1  ]
Erreur lors de la prédiction pour la fenêtre 76: Aucun résultat valide pour la fenêtre 76: [   __nn_distance  index           timestamp  \
0    4890.716797   6829 2020-04-18 16:28:10   
1    4892.084961   4891 2020-04-18 11:05:10   
2    4902.434082   4115 2020-04-18 08:55:50   
3    4905.055664   4623 2020-

 80%|████████████████████████████████████████████████████████████████▊                | 80/100 [00:14<00:03,  5.85it/s]

Réponse brute pour la fenêtre 78: [   __nn_distance  index           timestamp  \
0    4744.786133   6831 2020-04-18 16:28:30   
1    4750.111328   4893 2020-04-18 11:05:30   
2    4755.842773   4625 2020-04-18 10:20:50   
3    4759.287109   4637 2020-04-18 10:22:50   
4    4762.041016   4080 2020-04-18 08:50:00   

                                         sensor_data  panne  
0  [7.651999999999999, 1.6260000000000012, 75.175...      1  
1  [8.028, 1.7300000000000004, 75.025, 5.57500000...      1  
2  [8.956, 2.0120000000000005, 75.325, 5.7575, 8....      1  
3  [7.332000000000001, 1.6180000000000003, 75.699...      1  
4  [7.936, 1.7779999999999987, 74.47500000000001,...      1  ]
Erreur lors de la prédiction pour la fenêtre 78: Aucun résultat valide pour la fenêtre 78: [   __nn_distance  index           timestamp  \
0    4744.786133   6831 2020-04-18 16:28:30   
1    4750.111328   4893 2020-04-18 11:05:30   
2    4755.842773   4625 2020-04-18 10:20:50   
3    4759.287109   4637 2020-

 82%|██████████████████████████████████████████████████████████████████▍              | 82/100 [00:14<00:03,  5.93it/s]

Réponse brute pour la fenêtre 80: [   __nn_distance  index           timestamp  \
0    4599.010254   4626 2020-04-18 10:21:00   
1    4606.761230   6833 2020-04-18 16:28:50   
2    4609.236816   4627 2020-04-18 10:21:10   
3    4609.255859   4895 2020-04-18 11:05:50   
4    4612.496094   4899 2020-04-18 11:06:30   

                                         sensor_data  panne  
0  [7.85, 1.6760000000000002, 75.6, 5.42249999999...      1  
1  [8.704, 1.924, 75.1, 5.745000000000001, 8.56, ...      1  
2  [8.778, 1.9480000000000004, 75.8, 5.7125, 8.71...      1  
3  [9.056, 2.033999999999999, 75.2, 5.785, 8.87, ...      1  
4  [7.754, 1.6500000000000004, 75.2, 5.35, 8.892,...      1  ]
Erreur lors de la prédiction pour la fenêtre 80: Aucun résultat valide pour la fenêtre 80: [   __nn_distance  index           timestamp  \
0    4599.010254   4626 2020-04-18 10:21:00   
1    4606.761230   6833 2020-04-18 16:28:50   
2    4609.236816   4627 2020-04-18 10:21:10   
3    4609.255859   4895 2020-

 84%|████████████████████████████████████████████████████████████████████             | 84/100 [00:14<00:02,  5.95it/s]

Réponse brute pour la fenêtre 82: [   __nn_distance  index           timestamp  \
0    4434.352051   4629 2020-04-18 10:21:30   
1    4437.506836   4897 2020-04-18 11:06:10   
2    4440.666992   4078 2020-04-18 08:49:40   
3    4441.857422   6835 2020-04-18 16:29:10   
4    4448.097656   4628 2020-04-18 10:21:20   

                                         sensor_data  panne  
0  [8.882, 1.9819999999999995, 75.8, 5.6075000000...      1  
1  [9.07, 2.0380000000000003, 75.1, 5.80999999999...      1  
2  [9.024, 2.0120000000000005, 74.85, 5.824999999...      1  
3  [8.73, 1.936, 75.29999999999998, 5.64249999999...      1  
4  [8.88, 1.9819999999999995, 75.925, 5.765000000...      1  ]
Erreur lors de la prédiction pour la fenêtre 82: Aucun résultat valide pour la fenêtre 82: [   __nn_distance  index           timestamp  \
0    4434.352051   4629 2020-04-18 10:21:30   
1    4437.506836   4897 2020-04-18 11:06:10   
2    4440.666992   4078 2020-04-18 08:49:40   
3    4441.857422   6835 2020-

 86%|█████████████████████████████████████████████████████████████████████▋           | 86/100 [00:15<00:02,  5.87it/s]

Réponse brute pour la fenêtre 84: [   __nn_distance  index           timestamp  \
0    4253.195312   4631 2020-04-18 10:21:50   
1    4257.050781   4899 2020-04-18 11:06:30   
2    4259.665527   4080 2020-04-18 08:50:00   
3    4266.089844   4630 2020-04-18 10:21:40   
4    4269.797363   6837 2020-04-18 16:29:30   

                                         sensor_data  panne  
0  [8.9, 1.994, 75.42500000000001, 5.824999999999...      1  
1  [7.754, 1.6500000000000004, 75.2, 5.35, 8.892,...      1  
2  [7.936, 1.7779999999999987, 74.47500000000001,...      1  
3  [8.892, 1.9920000000000009, 75.69999999999999,...      1  
4  [7.944000000000001, 1.6999999999999993, 75.475...      1  ]
Erreur lors de la prédiction pour la fenêtre 84: Aucun résultat valide pour la fenêtre 84: [   __nn_distance  index           timestamp  \
0    4253.195312   4631 2020-04-18 10:21:50   
1    4257.050781   4899 2020-04-18 11:06:30   
2    4259.665527   4080 2020-04-18 08:50:00   
3    4266.089844   4630 2020-

 88%|███████████████████████████████████████████████████████████████████████▎         | 88/100 [00:15<00:02,  5.87it/s]

Réponse brute pour la fenêtre 86: [   __nn_distance  index           timestamp  \
0    4226.150391   4633 2020-04-18 10:22:10   
1    4229.467773   4632 2020-04-18 10:22:00   
2    4238.250000   4901 2020-04-18 11:06:50   
3    4245.291504   4631 2020-04-18 10:21:50   
4    4246.896484   4082 2020-04-18 08:50:20   

                                         sensor_data  panne  
0  [8.926, 1.9960000000000004, 75.0, 5.7525000000...      1  
1  [8.082, 1.75, 75.15, 5.577500000000001, 8.742,...      1  
2  [9.018, 2.026, 75.64999999999999, 5.7624999999...      1  
3  [8.9, 1.994, 75.42500000000001, 5.824999999999...      1  
4  [8.766, 1.9379999999999988, 74.42500000000001,...      1  ]
Erreur lors de la prédiction pour la fenêtre 86: Aucun résultat valide pour la fenêtre 86: [   __nn_distance  index           timestamp  \
0    4226.150391   4633 2020-04-18 10:22:10   
1    4229.467773   4632 2020-04-18 10:22:00   
2    4238.250000   4901 2020-04-18 11:06:50   
3    4245.291504   4631 2020-

 90%|████████████████████████████████████████████████████████████████████████▉        | 90/100 [00:15<00:01,  5.91it/s]

Réponse brute pour la fenêtre 88: [   __nn_distance  index           timestamp  \
0    4220.130859   4635 2020-04-18 10:22:30   
1    4224.701172   4903 2020-04-18 11:07:10   
2    4230.512695   4634 2020-04-18 10:22:20   
3    4235.020020   4641 2020-04-18 10:23:30   
4    4240.298340   4902 2020-04-18 11:07:00   

                                         sensor_data  panne  
0  [8.95, 2.006, 75.325, 5.785, 8.766, 8.962, 2.0...      1  
1  [9.018, 2.026, 75.4, 5.809999999999999, 8.888,...      1  
2  [8.946, 2.004, 75.22500000000001, 5.805, 8.75,...      1  
3  [8.92, 1.9960000000000004, 75.6, 5.78750000000...      1  
4  [9.016, 2.02, 75.47500000000001, 5.7925, 8.88,...      1  ]
Erreur lors de la prédiction pour la fenêtre 88: Aucun résultat valide pour la fenêtre 88: [   __nn_distance  index           timestamp  \
0    4220.130859   4635 2020-04-18 10:22:30   
1    4224.701172   4903 2020-04-18 11:07:10   
2    4230.512695   4634 2020-04-18 10:22:20   
3    4235.020020   4641 2020-

 92%|██████████████████████████████████████████████████████████████████████████▌      | 92/100 [00:16<00:01,  5.85it/s]

Réponse brute pour la fenêtre 90: [   __nn_distance  index           timestamp  \
0    4228.454102   4637 2020-04-18 10:22:50   
1    4232.166992   4905 2020-04-18 11:07:30   
2    4240.622070   4636 2020-04-18 10:22:40   
3    4242.029297   4911 2020-04-18 11:08:30   
4    4244.451660   4909 2020-04-18 11:08:10   

                                         sensor_data  panne  
0  [7.332000000000001, 1.6180000000000003, 75.699...      1  
1  [8.086, 1.751999999999999, 75.29999999999998, ...      1  
2  [8.962, 2.01, 75.52499999999999, 5.815, 8.78, ...      1  
3  [8.74, 1.942, 75.925, 5.717499999999999, 8.882...      1  
4  [9.07, 2.042, 75.47500000000001, 5.84500000000...      1  ]
Erreur lors de la prédiction pour la fenêtre 90: Aucun résultat valide pour la fenêtre 90: [   __nn_distance  index           timestamp  \
0    4228.454102   4637 2020-04-18 10:22:50   
1    4232.166992   4905 2020-04-18 11:07:30   
2    4240.622070   4636 2020-04-18 10:22:40   
3    4242.029297   4911 2020-

 94%|████████████████████████████████████████████████████████████████████████████▏    | 94/100 [00:16<00:01,  5.52it/s]

Réponse brute pour la fenêtre 92: [   __nn_distance  index           timestamp  \
0    4253.208984   4639 2020-04-18 10:23:10   
1    4256.635742   4913 2020-04-18 11:08:50   
2    4256.957031   4911 2020-04-18 11:08:30   
3    4258.951172   4638 2020-04-18 10:23:00   
4    4260.464844   4907 2020-04-18 11:07:50   

                                         sensor_data  panne  
0  [8.764, 1.946, 75.825, 5.780000000000001, 8.76...      1  
1  [9.012, 2.022, 76.42500000000001, 5.7749999999...      1  
2  [8.74, 1.942, 75.925, 5.717499999999999, 8.882...      1  
3  [7.818, 1.67, 75.8, 5.515000000000001, 8.776, ...      1  
4  [9.058, 2.033999999999999, 75.52499999999999, ...      1  ]
Erreur lors de la prédiction pour la fenêtre 92: Aucun résultat valide pour la fenêtre 92: [   __nn_distance  index           timestamp  \
0    4253.208984   4639 2020-04-18 10:23:10   
1    4256.635742   4913 2020-04-18 11:08:50   
2    4256.957031   4911 2020-04-18 11:08:30   
3    4258.951172   4638 2020-

 96%|█████████████████████████████████████████████████████████████████████████████▊   | 96/100 [00:16<00:00,  5.60it/s]

Réponse brute pour la fenêtre 94: [   __nn_distance  index           timestamp  \
0    4270.296387   4915 2020-04-18 11:09:10   
1    4276.761719   4914 2020-04-18 11:09:00   
2    4277.276367   4909 2020-04-18 11:08:10   
3    4279.369629   4641 2020-04-18 10:23:30   
4    4279.651855   4913 2020-04-18 11:08:50   

                                         sensor_data  panne  
0  [9.018, 2.0279999999999987, 76.29999999999998,...      1  
1  [9.016, 2.026, 76.375, 5.674999999999999, 8.88...      1  
2  [9.07, 2.042, 75.47500000000001, 5.84500000000...      1  
3  [8.92, 1.9960000000000004, 75.6, 5.78750000000...      1  
4  [9.012, 2.022, 76.42500000000001, 5.7749999999...      1  ]
Erreur lors de la prédiction pour la fenêtre 94: Aucun résultat valide pour la fenêtre 94: [   __nn_distance  index           timestamp  \
0    4270.296387   4915 2020-04-18 11:09:10   
1    4276.761719   4914 2020-04-18 11:09:00   
2    4277.276367   4909 2020-04-18 11:08:10   
3    4279.369629   4641 2020-

 98%|███████████████████████████████████████████████████████████████████████████████▍ | 98/100 [00:17<00:00,  5.72it/s]

Réponse brute pour la fenêtre 96: [   __nn_distance  index           timestamp  \
0    4292.637695   4917 2020-04-18 11:09:30   
1    4296.742188   4911 2020-04-18 11:08:30   
2    4297.574707   4916 2020-04-18 11:09:20   
3    4297.848633   4915 2020-04-18 11:09:10   
4    4306.133789   4914 2020-04-18 11:09:00   

                                         sensor_data  panne  
0  [8.988, 2.014, 76.025, 5.815, 8.86, 9.05, 2.03...      1  
1  [8.74, 1.942, 75.925, 5.717499999999999, 8.882...      1  
2  [8.082, 1.751999999999999, 76.125, 5.600000000...      1  
3  [9.018, 2.0279999999999987, 76.29999999999998,...      1  
4  [9.016, 2.026, 76.375, 5.674999999999999, 8.88...      1  ]
Erreur lors de la prédiction pour la fenêtre 96: Aucun résultat valide pour la fenêtre 96: [   __nn_distance  index           timestamp  \
0    4292.637695   4917 2020-04-18 11:09:30   
1    4296.742188   4911 2020-04-18 11:08:30   
2    4297.574707   4916 2020-04-18 11:09:20   
3    4297.848633   4915 2020-

100%|████████████████████████████████████████████████████████████████████████████████| 100/100 [00:17<00:00,  5.67it/s]

Réponse brute pour la fenêtre 98: [   __nn_distance  index           timestamp  \
0    4332.252441   4917 2020-04-18 11:09:30   
1    4333.320312   4913 2020-04-18 11:08:50   
2    4339.135254   4919 2020-04-18 11:09:50   
3    4339.236816   4916 2020-04-18 11:09:20   
4    4343.713379   4918 2020-04-18 11:09:40   

                                         sensor_data  panne  
0  [8.988, 2.014, 76.025, 5.815, 8.86, 9.05, 2.03...      1  
1  [9.012, 2.022, 76.42500000000001, 5.7749999999...      1  
2  [9.056, 2.0380000000000003, 75.825, 5.82750000...      1  
3  [8.082, 1.751999999999999, 76.125, 5.600000000...      1  
4  [9.05, 2.033999999999999, 75.975, 5.8174999999...      1  ]
Erreur lors de la prédiction pour la fenêtre 98: Aucun résultat valide pour la fenêtre 98: [   __nn_distance  index           timestamp  \
0    4332.252441   4917 2020-04-18 11:09:30   
1    4333.320312   4913 2020-04-18 11:08:50   
2    4339.135254   4919 2020-04-18 11:09:50   
3    4339.236816   4916 2020-




In [None]:
################################################################
#### Prédiction pour les 100 premières fenêtres             ####
################################################################

# Limiter les tests aux 100 premières fenêtres
test_subset = test_windows[:100]
results = []

for i, test_window in tqdm(enumerate(test_subset), total=len(test_subset)):
    query_vector = test_window["sensor_data"]

    try:
        # Recherche vectorielle
        results_vector = train_table.search(
            vectors={"flat_index": [query_vector]},
            n=5  # Trouver les 5 motifs les plus similaires
        )

        # Vérifier les résultats
        if results_vector and isinstance(results_vector[0], list):
            similar_pannes = [result.get("panne", None) for result in results_vector[0]]
            similar_pannes = [p for p in similar_pannes if p is not None]

            if similar_pannes:
                predicted_panne = max(set(similar_pannes), key=similar_pannes.count)
            else:
                predicted_panne = -1  # Valeur par défaut
        else:
            predicted_panne = -1  # Valeur par défaut

        # Stocker les résultats
        results.append({
            "fenêtre": i,
            "prédiction": predicted_panne,
            "réelle": test_window["panne"]
        })

    except Exception as e:
        print(f"Erreur lors de la prédiction pour la fenêtre {i}: {e}")
        results.append({
            "fenêtre": i,
            "prédiction": -1,  # Valeur par défaut en cas d'erreur
            "réelle": test_window["panne"]
        })

# Créer un DataFrame avec les résultats
results_df = pd.DataFrame(results)

# Calculer la précision globale
accuracy = (results_df["prédiction"] == results_df["réelle"]).mean()

# Compter les fenêtres par classe prédite
class_counts = results_df["prédiction"].value_counts()

# Afficher les résultats
print(f"Précision globale pour les 100 premières fenêtres : {accuracy:.2%}")
print(f"Nombre total de fenêtres testées : {len(results_df)}")
print("\nPrédictions par classe :")
print(class_counts)

# Afficher le DataFrame des résultats pour l'analyse
import ace_tools as tools
tools.display_dataframe_to_user(name="Résultats des 100 Premières Fenêtres", dataframe=results_df)


In [None]:
################################################################
#### Prédiction pour les 100 premières fenêtres             ####
################################################################

# Limiter les tests aux 100 premières fenêtres
test_subset = test_windows[:10]
results = []

for i, test_window in tqdm(enumerate(test_subset), total=len(test_subset)):
    query_vector = test_window["sensor_data"]

    try:
        # Recherche vectorielle
        results_vector = train_table.search(
            vectors={"flat_index": [query_vector]},
            n=5  # Trouver les 5 motifs les plus similaires
        )

        # Vérifier si des résultats sont retournés
        if results_vector and isinstance(results_vector[0], list):
            similar_pannes = [result.get("panne", None) for result in results_vector[0]]
            similar_pannes = [p for p in similar_pannes if p is not None]

            if similar_pannes:
                predicted_panne = max(set(similar_pannes), key=similar_pannes.count)
            else:
                predicted_panne = -1  # Valeur par défaut si aucune panne valide
        else:
            predicted_panne = -1  # Valeur par défaut si aucun résultat

        # Stocker les résultats
        results.append({
            "fenêtre": i,
            "prédiction": predicted_panne,
            "réelle": test_window["panne"]
        })

    except Exception as e:
        print(f"Erreur lors de la prédiction pour la fenêtre {i}: {e}")
        results.append({
            "fenêtre": i,
            "prédiction": -1,  # Valeur par défaut en cas d'erreur
            "réelle": test_window["panne"]
        })

# Créer un DataFrame avec les résultats
results_df = pd.DataFrame(results)

# Calculer la précision globale
accuracy = (results_df["prédiction"] == results_df["réelle"]).mean()

# Compter les fenêtres par classe prédite
class_counts = results_df["prédiction"].value_counts()

# Afficher les résultats
print(f"Précision globale pour les 100 premières fenêtres : {accuracy:.2%}")
print(f"Nombre total de fenêtres testées : {len(results_df)}")
print("\nPrédictions par classe :")
print(class_counts)

# Afficher le DataFrame avec pandas
print("\nAperçu des résultats :")
print(results_df.head(10))  # Affiche les 10 premières lignes pour validation


In [None]:
################################################################
#### Prédiction des Pannes pour l'Ensemble de Test Basée    ####
#### Sur le Vote Majoritaire dans l'Ensemble d'Entrainement ####
#### Avec la Classe Définie par la Dernière Valeur dans la  ####
#### Fenêtre                                                ####
################################################################

# Initialiser une liste pour stocker les résultats
results = []

# Parcourir toutes les fenêtres de test
for i, test_window in tqdm(enumerate(test_windows), total=len(test_windows)):
    # Récupérer le vecteur de test
    query_vector = test_window["sensor_data"]

    try:
        # Recherche vectorielle
        results_vector = train_table.search(
            vectors={"flat_index": [query_vector]},
            n=5  # Trouver les 5 motifs les plus similaires
        )

        # Vérifier si des résultats sont retournés
        if results_vector and isinstance(results_vector[0], list):
            # Extraire les valeurs de panne des motifs similaires
            similar_pannes = [result.get("panne", None) for result in results_vector[0]]

            # Filtrer les valeurs valides (évitant les None ou valeurs non numériques)
            similar_pannes = [p for p in similar_pannes if p is not None]

            if similar_pannes:
                # Prédiction par vote majoritaire
                predicted_panne = max(set(similar_pannes), key=similar_pannes.count)
            else:
                # Valeur par défaut si aucune panne similaire valide n'est trouvée
                predicted_panne = -1
        else:
            # Valeur par défaut si aucun résultat n'est retourné
            predicted_panne = -1

        # Ajouter les résultats à la liste
        results.append({
            "fenêtre": i,
            "prédiction": predicted_panne,
            "réelle": test_window['panne']  # Correspond à la dernière valeur dans la fenêtre de test
        })

    except Exception as e:
        print(f"Erreur lors de la prédiction pour la fenêtre {i}: {e}")

# Créer un DataFrame avec les résultats
results_df = pd.DataFrame(results)

# Calculer la précision globale
accuracy = (results_df["prédiction"] == results_df["réelle"]).mean()

# Compter les fenêtres par classe prédite
class_counts = results_df["prédiction"].value_counts()

# Afficher les résultats
print(f"Précision globale sur l'ensemble de test : {accuracy:.2%}")
print(f"Nombre total de fenêtres testées : {len(results_df)}")
print("\nPrédictions par classe :")
print(class_counts)

# Afficher le DataFrame des résultats pour l'analyse
import ace_tools as tools
tools.display_dataframe_to_user(name="Résultats de Prédictions des Fenêtres", dataframe=results_df)


In [10]:
# Parcourir toutes les fenêtres de test
for i, test_window in enumerate(test_windows):
    # Récupérer le vecteur de test
    query_vector = test_window["sensor_data"]

    # Recherche vectorielle
    results = train_table.search(
        vectors={"flat_index": [query_vector]},
        n=5  # Trouver les 5 motifs les plus similaires
    )

    # Extraire les valeurs de panne des motifs similaires
    similar_pannes = results[0]["panne"].tolist()

    # Prédiction par majorité
    predicted_panne = max(set(similar_pannes), key=similar_pannes.count)

    # Affichage simple
    print(f"Fenêtre {i + 1} - Prédiction : {predicted_panne} - Valeur de Test : {test_window['panne']}")


Fenêtre 1 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 2 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 3 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 4 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 5 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 6 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 7 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 8 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 9 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 10 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 11 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 12 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 13 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 14 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 15 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 16 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 17 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 18 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 19 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 20 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 21 - Prédiction : 1 -

Fenêtre 168 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 169 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 170 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 171 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 172 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 173 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 174 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 175 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 176 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 177 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 178 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 179 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 180 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 181 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 182 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 183 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 184 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 185 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 186 - Prédiction : 1 - Valeur de Test : 0
Fenêtre 187 - Prédiction : 1 - Valeur de Test : 0


KeyboardInterrupt: 

In [None]:
# Parcourir les fenêtres de test à partir de la fenêtre 1130
start_index = 1129  # Correspond à la Fenêtre 1130
for i, test_window in enumerate(test_windows[start_index:], start=start_index + 1):
    # Récupérer le vecteur de test
    query_vector = test_window["sensor_data"]

    # Recherche vectorielle
    results = train_table.search(
        vectors={"flat_index": [query_vector]},
        n=5  # Trouver les 5 motifs les plus similaires
    )

    # Extraire les valeurs de panne des motifs similaires
    similar_pannes = results[0]["panne"].tolist()

    # Prédiction par majorité
    predicted_panne = max(set(similar_pannes), key=similar_pannes.count)

    # Affichage simple
    print(f"Fenêtre {i} - Prédiction : {predicted_panne} - Valeur de Test : {test_window['panne']}")


In [None]:
# Compter les fenêtres dans l'ensemble d'entraînement
num_train_windows = len(train_windows)

# Compter les fenêtres dans l'ensemble de test
num_test_windows = len(test_windows)

# Affichage
print(f"Nombre de fenêtres dans l'ensemble d'entraînement : {num_train_windows}")
print(f"Nombre de fenêtres dans l'ensemble de test : {num_test_windows}")


In [None]:
# Indice de la fenêtre 622 (les indices Python commencent à 0)
window_index = 623  # Fenêtre 622 correspond à l'index 621

# Récupérer les informations de la fenêtre
window_622 = test_windows[window_index]

# Affichage des détails
print(f"Fenêtre 622 : {window_622}")


In [None]:
# Filtrer le DataFrame pour le timestamp spécifique
timestamp_to_find = '2020-07-15 13:43:50'
filtered_row = df[df['timestamp'] == pd.Timestamp(timestamp_to_find)]

# Affichage du résultat
if not filtered_row.empty:
    print("Ligne correspondant au timestamp :")
    display(filtered_row)
else:
    print(f"Aucune ligne trouvée pour le timestamp {timestamp_to_find}")


In [None]:
# Filtrer le DataFrame pour le timestamp spécifique

filtered_row = df[df['panne'] == 2]

# Affichage du résultat
if not filtered_row.empty:
    print("Ligne correspondant au timestamp :")
    display(filtered_row)
else:
    print(f"Aucune ligne trouvée pour le timestamp {timestamp_to_find}")


In [None]:
pip install kdbai-client

In [None]:
import pandas as pd
import numpy as np
# Charger les données
df = pd.read_csv("../Datasources/MetroPT3_imputed_final.csv", delimiter=",", decimal=".", index_col=0)
df.reset_index(drop=True, inplace=True)

<h3 style="text-align: center; font-family: Arial, sans-serif; color: RED;">################# DÉCLARATION / INITIALISATION #################</h3>
<ul style="font-family: Arial, sans-serif; font-size: 12pt; color: #333;">
</ul>

In [None]:
# Convertir timestamp
df['timestamp'] = pd.to_datetime(df['timestamp'], errors='coerce')
#display(df.dtypes)

continuous_features = ["TP2", "DV_pressure", "Oil_temperature", "Motor_current", "Reservoirs"]
categorical_features = ["COMP", "DV_eletric", "Towers", "LPS", "Pressure_switch", "Oil_level", "Caudal_impulses"]

# Conserver uniquement les colonnes continues, catégorielles et 'timestamp'
columns_to_keep = ["timestamp", "panne"] + continuous_features + categorical_features
df = df[columns_to_keep]

display(df.head(2))

<h3 style="text-align: center; font-family: Arial, sans-serif; color: RED;">#################### FIN DÉCLARATION #################</h3>
<ul style="font-family: Arial, sans-serif; font-size: 12pt; color: #333;">
</ul>

In [None]:
import kdbai_client as kdbai
session = kdbai.Session(endpoint="https://cloud.kdb.ai/instance/atr0v2owym", api_key="a5b897a7b4-Av/lT//S3W++g8K11vVKfJo5rIj5gK492sbpts/1f+cr/5m5n5JluPcqcQR2gGiiQQ7SrCFAc7ma2RhT")

# create reference to default database
db = session.database('default')

In [None]:
print(db.tables)
# Return: an empty array if no tables have been created []

In [None]:
##################################
###### SUPPRIMER LES TABLES ######
##################################
# Accéder aux tables existantes
train_table = db.table("train_sensors")
test_table = db.table("test_sensors")

# Supprimer mes 2 tables
try:
    train_table.drop()
    test_table.drop()
    print("Table 'train_sensors' supprimée avec succès.")
    print("Table 'test_sensors' supprimée avec succès.")
except Exception as e:
    print(f"Erreur lors de la suppression de 'train_sensors' : {e}")

In [None]:
###################################################################
################ Train : Panne2 & Panne3 & Panne4   ################
################ Test  : Panne1           #########################
###################################################################


train_periods = [{'start': '2020-04-18 23:59:10', 'end': '2020-09-01 03:59:50'}]
test_periods  = [{'start': '2020-02-01 00:00:00', 'end': '2020-04-18 23:59:00'}]

train_df = pd.concat([
    df[(df['timestamp'] >= pd.Timestamp(period['start'])) & 
       (df['timestamp'] <= pd.Timestamp(period['end']))]
    for period in train_periods
])

# Filtrer les périodes pour le test
test_df = pd.concat([
    df[(df['timestamp'] >= pd.Timestamp(period['start'])) & 
       (df['timestamp'] <= pd.Timestamp(period['end']))]
    for period in test_periods
])

print(f"Entraînement : {len(train_df)} lignes")
print(f"Test : {len(test_df)} lignes")


In [None]:
###################################################################################################
################ Train : Panne1   (1J ET DEMI)                                              #######
################ Test  : Panne4  (15mn + 15mn + 15mn)     #########################################
###################################################################################################


train_periods = [{'start': '2020-04-17 21:30:00', 'end': '2020-04-19 00:15:00'}]
test_periods  = [{'start': '2020-07-15 14:00:00', 'end': '2020-07-15 14:45:00'}]

train_df = pd.concat([
    df[(df['timestamp'] >= pd.Timestamp(period['start'])) & 
       (df['timestamp'] <= pd.Timestamp(period['end']))]
    for period in train_periods
])

# Filtrer les périodes pour le test
test_df = pd.concat([
    df[(df['timestamp'] >= pd.Timestamp(period['start'])) & 
       (df['timestamp'] <= pd.Timestamp(period['end']))]
    for period in test_periods
])

print(f"Entrainement : {len(train_df)} lignes")
print("Données d'entraînement (plage de temps) :")
print(train_df['timestamp'].min(), train_df['timestamp'].max())
print("---------------------------")
print(f"Test : {len(test_df)} lignes")
print("Données de test (plage de temps) :")
print(test_df['timestamp'].min(), test_df['timestamp'].max())


In [None]:
from tqdm import tqdm

# Paramètres des fenêtres temporelles
window_size = 100  # Taille de la fenêtre
step_size = 1      # Pas de glissement
numeric_columns = ["TP2", "DV_pressure", "Oil_temperature", "Motor_current", "Reservoirs"]

# Initialiser les compteurs pour les fenêtres invalides
invalid_train_count = 0
invalid_test_count = 0

# Générer les fenêtres pour l'entraînement avec suivi de la progression
train_windows = []
print("Génération des fenêtres pour l'entraînement...")
for i in tqdm(range(0, len(train_df) - window_size + 1, step_size)):
    # Extraire les données de la fenêtre
    window_data = train_df.iloc[i:i + window_size][numeric_columns].values.flatten()
    if len(window_data) == window_size * len(numeric_columns):  # Validation de la longueur
        train_windows.append({
            "index": i,
            "timestamp": train_df.iloc[i]["timestamp"],
            "sensor_data": window_data.tolist()
        })
    else:
        invalid_train_count += 1  # Compter les fenêtres invalides

# Générer les fenêtres pour le test avec suivi de la progression
test_windows = []
print("\nGénération des fenêtres pour le test...")
for i in tqdm(range(0, len(test_df) - window_size + 1, step_size)):
    # Extraire les données de la fenêtre
    window_data = test_df.iloc[i:i + window_size][numeric_columns].values.flatten()
    if len(window_data) == window_size * len(numeric_columns):  # Validation de la longueur
        test_windows.append({
            "index": i,
            "timestamp": test_df.iloc[i]["timestamp"],
            "sensor_data": window_data.tolist()
        })
    else:
        invalid_test_count += 1  # Compter les fenêtres invalides

# Afficher le nombre de fenêtres générées et invalides
print(f"\nFenêtres d'entraînement : {len(train_windows)}")
print(f"Fenêtres invalides d'entraînement : {invalid_train_count}")
print(f"Fenêtres de test : {len(test_windows)}")
print(f"Fenêtres invalides de test : {invalid_test_count}")


In [None]:
# Sauvegarder les fenetres localement sur le C

import json

# Convertir les fenêtres pour rendre les Timestamps sérialisables
def convert_windows(windows):
    for window in windows:
        window['timestamp'] = window['timestamp'].isoformat()  # Convertir en chaîne
    return windows

# Convertir et sauvegarder les fenêtres d'entraînement
train_windows_serializable = convert_windows(train_windows)

# Sauvegarder les fenêtres d'entraînement
with open("train_windows.json", "w") as train_file:
    json.dump(train_windows, train_file)
print("TSS_Fenêtres d'entraînement sauvegardées dans train_windows.json.")

# Convertir et sauvegarder les fenêtres de test
test_windows_serializable = convert_windows(test_windows)
# Sauvegarder les fenêtres de test
with open("test_windows.json", "w") as test_file:
    json.dump(test_windows, test_file)
print("TSS_Fenetres de test sauvegardées dans test_windows.json.")


In [None]:
##################################
###### SUPPRIMER LES TABLES ######
##################################
# Accéder aux tables existantes
train_table = db.table("train_sensors")
test_table = db.table("test_sensors")

# Supprimer mes 2 tables
try:
    train_table.drop()
    test_table.drop()
    print("Table 'train_sensors' supprimée avec succès.")
    print("Table 'test_sensors' supprimée avec succès.")
except Exception as e:
    print(f"Erreur lors de la suppression de 'train_sensors' : {e}")

In [None]:
# Schéma pour les tables
sensor_schema = [
    {"name": "index", "type": "int64"},               # Identifiant unique
    {"name": "timestamp", "type": "datetime64[ns]"}, # Timestamp
    {"name": "sensor_data", "type": "float64s"}      # Données vectorielles
                ]

# Index pour la recherche vectorielle
indexes = [
    {
        "name": "flat_index",
        "type": "flat",
        "column": "sensor_data",
        "params": {"metric": "L2","dims": 500}
    }
         ]

# Créer les tables
train_table = db.create_table("train_sensors", schema=sensor_schema, indexes=indexes)
test_table = db.create_table("test_sensors", schema=sensor_schema, indexes=indexes)
print("Table 'train_sensors' créée avec succès.")
print("Table 'test_sensors' créée avec succès.")

In [None]:
from tqdm import tqdm
from kdbai_client import KDBAIException

# Fonction d'insertion des données
def insert_data(table, data_windows, batch_size=100):
    """
    Insère les données dans une table KDB.AI par lots avec une barre de progression.
    """
    total_batches = -(-len(data_windows) // batch_size)  # Calculer le nombre total de batches
    print(f"Insertion dans la table {table.name}... Total de batches : {total_batches}")
    
    with tqdm(total=total_batches, desc=f"Insertion dans {table.name}") as pbar:
        for batch_index, i in enumerate(range(0, len(data_windows), batch_size), start=1):
            batch = data_windows[i:i + batch_size]
            try:
                table.insert(batch)
                pbar.update(1)
            except KDBAIException as e:
                pbar.set_postfix({"Erreur": "Oui"})
                print(f"Erreur lors de l'insertion du batch {batch_index}/{total_batches}: {e}")
                for record in batch:
                    try:
                        table.insert([record])  # Tentative d'insertion individuelle pour débogage
                    except KDBAIException as single_error:
                        print(f"Erreur sur l'enregistrement {record['index']}: {single_error}")

# Insertion des données d'entraînement
insert_data(train_table, train_windows)

# Insertion des données de test
insert_data(test_table, test_windows)

print("Insertion des données terminée.")


In [None]:
# Compte le nombre de lignes en utilisant la colonne 'index'
print(f"Entrainement : {len(train_df)} lignes")

aggs = {
    "row_count": ["count", "index"],
    "min_timestamp": ["min", "timestamp"],
    "max_timestamp": ["max", "timestamp"],
}

query_result = train_table.query(aggs=aggs)
print(f"Nombre de lignes : {query_result['row_count']}")
print(f"Timestamp minimum : {query_result['min_timestamp']}")
print(f"Timestamp maximum : {query_result['max_timestamp']}")
print("----------------------------")
print(f"Test : {len(test_df)} lignes")
query_result = test_table.query(aggs=aggs)
print(f"Nombre de lignes : {query_result['row_count']}")
print(f"Timestamp minimum : {query_result['min_timestamp']}")
print(f"Timestamp maximum : {query_result['max_timestamp']}")


In [None]:
# Exemple de prédiction avec une fenêtre de test
from tqdm import tqdm
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore", category=UserWarning, module="numpy")


# Sélectionner un vecteur de requête (par exemple, la première fenêtre de test)
query_vector = test_windows[0]["sensor_data"]

# Effectuer une recherche vectorielle dans la table d'entraînement
results = train_table.search(
    vectors={"flat_index": [query_vector]},
    n=5,  # Trouver les 5 motifs les plus similaires
)

# Afficher les résultats de la recherche
print("\nRésultats de recherche vectorielle :")
for i, row in results[0].iterrows():
    print(f"Index d'entraînement : {row['index']}, Distance : {row['__nn_distance']}")
    print(f"Timestamp correspondant : {row['timestamp']}")
    print(f"Motif similaire (extrait des données capteurs) : {row['sensor_data'][:5]} ...")

# Extraire les indices similaires pour les visualiser
similar_indices = results[0]['index']

# Visualiser le motif de test et les motifs similaires
plt.figure(figsize=(10, 6))

# Tracer le vecteur de test
plt.plot(query_vector, marker="o", linestyle="-", label="Motif de Test", color="blue")

# Parcourir les indices similaires
for idx in similar_indices:
    # Requête pour récupérer les vecteurs similaires
    result_row = results[0][results[0]['index'] == idx]
    similar_vector = result_row['sensor_data'].iloc[0]
    
    # Tracer les vecteurs similaires
    plt.plot(similar_vector, marker="o", linestyle="--", alpha=0.7, label=f"Similaire {idx}")

# Ajouter des étiquettes et une légende
plt.xlabel("Timestamp")
plt.ylabel("Valeurs des Capteurs")
plt.title("Comparaison des Motifs : Test vs Similaires")
plt.legend()
plt.grid(True)
plt.show()



In [None]:
total_batches = len(train_windows) // batch_size + (len(train_windows) % batch_size > 0)
print(f"Nombre de batches attendu : {total_batches}")


In [None]:
duplicate_rows = train_df[train_df.duplicated()]
print(f"Lignes dupliquées dans train_df : {len(duplicate_rows)}")


In [None]:
query_result = train_table.query(select=["timestamp"])
db_min_timestamp = query_result["timestamp"].min()
db_max_timestamp = query_result["timestamp"].max()
print(f"Plage temporelle dans la base : {db_min_timestamp} à {db_max_timestamp}")
print(f"Plage temporelle locale : {train_df['timestamp'].min()} à {train_df['timestamp'].max()}")


<h3 style="text-align: center; font-family: Arial, sans-serif; color: BLUE;">################# QUELQUES VALIDATIONS #################</h3>
<ul style="font-family: Arial, sans-serif; font-size: 12pt; color: #333;">
</ul>

In [None]:
print(f"Premiere fenetre train:\n{train_windows[0]}")

In [None]:
aggs = {
    "row_count": ["count", "index"],
    "min_timestamp": ["min", "timestamp"],
    "max_timestamp": ["max", "timestamp"],
}

query_result = train_table.query(aggs=aggs)
print(f"Nombre de lignes : {query_result['row_count']}")
print(f"Timestamp minimum : {query_result['min_timestamp']}")
print(f"Timestamp maximum : {query_result['max_timestamp']}")

In [None]:
# Comparer les timestamps entre train_df et KDB.ai
db_timestamps = pd.date_range(start="2020-04-17 21:30:00", end="2020-04-18 23:58:30", freq="10s")
missing_timestamps = train_df[~train_df["timestamp"].isin(db_timestamps)]

print(f"Lignes manquantes dans la base : {len(missing_timestamps)}")
print(missing_timestamps)


In [None]:
# Préparer les lignes manquantes pour l'insertion
missing_rows = []
for row in missing_timestamps.itertuples(index=True, name="Row"):
    missing_rows.append({
        "index": row.Index,  # Utiliser l'index fourni par itertuples
        "timestamp": row.timestamp,
        "sensor_data": list(row[2:])  # Inclure les colonnes numériques sous forme de liste
    })

# Insérer les données manquantes dans la table train_sensors
batch_size = 10  # Taille du batch pour l'insertion
print(f"Réinsertion des {len(missing_rows)} lignes manquantes...")

for i in range(0, len(missing_rows), batch_size):
    batch = missing_rows[i:i + batch_size]
    try:
        train_table.insert(batch)
        print(f"Batch {i // batch_size + 1}/{-(-len(missing_rows) // batch_size)} inséré avec succès.")
    except Exception as e:
        print(f"Erreur lors de l'insertion du batch {i // batch_size + 1} : {e}")

print("Réinsertion des données manquantes terminée.")


In [None]:
# Vérifiez les colonnes utilisées pour la création de sensor_data
numeric_columns = ["TP2", "DV_pressure", "Oil_temperature", "Motor_current", "Reservoirs"]  # Exemple
print("Colonnes utilisées pour sensor_data :", numeric_columns)

# Préparer les lignes manquantes pour l'insertion
missing_rows = []
for row in missing_timestamps.itertuples(index=True, name="Row"):
    # Vérifiez les données avant de les ajouter
    try:
        sensor_data = [getattr(row, col) for col in numeric_columns]  # Extraire les colonnes nécessaires
        missing_rows.append({
            "index": row.Index,  # Utiliser l'index fourni par itertuples
            "timestamp": row.timestamp,
            "sensor_data": sensor_data  # Liste de données numériques
        })
    except AttributeError as e:
        print(f"Erreur lors de la préparation des données pour l'index {row.Index} : {e}")

# Réinsertion dans la base
batch_size = 10
print(f"Réinsertion des {len(missing_rows)} lignes manquantes...")

for i in range(0, len(missing_rows), batch_size):
    batch = missing_rows[i:i + batch_size]
    try:
        train_table.insert(batch)
        print(f"Batch {i // batch_size + 1}/{-(-len(missing_rows) // batch_size)} inséré avec succès.")
    except Exception as e:
        print(f"Erreur lors de l'insertion du batch {i // batch_size + 1} : {e}")

print("Réinsertion des données manquantes terminée.")


In [None]:
# Vérification des dimensions de chaque vecteur avant l'insertion
expected_length = 500  # Longueur attendue des vecteurs

invalid_vectors = []
for row in missing_rows:
    if len(row["sensor_data"]) != expected_length:
        invalid_vectors.append(row)

# Si des vecteurs invalides sont trouvés, les afficher
if invalid_vectors:
    print(f"Vecteurs invalides détectés : {len(invalid_vectors)}")
    for idx, invalid_row in enumerate(invalid_vectors[:5]):  # Afficher les 5 premiers vecteurs invalides
        print(f"Index : {invalid_row['index']}, Longueur : {len(invalid_row['sensor_data'])}")
else:
    print("Tous les vecteurs ont la bonne dimension.")

# Réinsertion uniquement des vecteurs valides
valid_rows = [row for row in missing_rows if len(row["sensor_data"]) == expected_length]

print(f"Réinsertion des {len(valid_rows)} lignes valides...")
for i in range(0, len(valid_rows), batch_size):
    batch = valid_rows[i:i + batch_size]
    try:
        train_table.insert(batch)
        print(f"Batch {i // batch_size + 1}/{-(-len(valid_rows) // batch_size)} inséré avec succès.")
    except Exception as e:
        print(f"Erreur lors de l'insertion du batch {i // batch_size + 1} : {e}")

print("Réinsertion des données valides terminée.")


In [None]:
# Taille réelle de la première fenêtre
print(f"Taille des données dans la première fenêtre d'entraînement : {len(train_windows[0]['sensor_data'])}")
print(f"Taille des données dans la première fenêtre de test : {len(test_windows[0]['sensor_data'])}")

# Cela correspond à window_size (100) × nombre de colonnes (numeric_columns, soit 5).

print('--------------------------------')
# Vérifier la taille des fenêtres générées
for i in range(5):  # Tester sur les 5 premières fenêtres
    actual_window = train_df.iloc[i:i + window_size][numeric_columns]
    print(f"Fenêtre {i} - Taille réelle : {len(actual_window)}")
    

In [None]:
# Initialiser des compteurs pour détecter les erreurs
invalid_index_count = 0
invalid_timestamp_count = 0
invalid_sensor_data_count = 0

# Parcourir toutes les fenêtres pour vérifier les types et formats
for i, window in enumerate(train_windows):
    # Vérifier l'index
    if not isinstance(window['index'], int):
        print(f"Fenêtre {i} : 'index' non valide ({type(window['index'])})")
        invalid_index_count += 1
    
    # Vérifier le timestamp
    try:
        pd.Timestamp(window['timestamp'])  # Vérifie si le timestamp est convertible
    except Exception as e:
        print(f"Fenêtre {i} : 'timestamp' non valide ({window['timestamp']})")
        invalid_timestamp_count += 1
    
    # Vérifier sensor_data
    if not isinstance(window['sensor_data'], list) or len(window['sensor_data']) != 500:
        print(f"Fenêtre {i} : 'sensor_data' non valide (Longueur : {len(window['sensor_data'])})")
        invalid_sensor_data_count += 1
    elif not all(isinstance(value, float) for value in window['sensor_data']):
        print(f"Fenêtre {i} : 'sensor_data' contient des valeurs non flottantes.")
        invalid_sensor_data_count += 1

# Résumé des erreurs détectées
print(f"Erreurs dans 'index' : {invalid_index_count}")
print(f"Erreurs dans 'timestamp' : {invalid_timestamp_count}")
print(f"Erreurs dans 'sensor_data' : {invalid_sensor_data_count}")

In [None]:
# Tester l'insertion avec un petit lot

# Schéma pour les tables
sensor_schema = [
    {"name": "index", "type": "int64"},               # Identifiant unique
    {"name": "timestamp", "type": "datetime64[ns]"}, # Timestamp
    {"name": "sensor_data", "type": "float64s"}      # Données vectorielles
]

# Index pour la recherche vectorielle
indexes = [
    {
        "name": "flat_index",
        "type": "flat",
        "column": "sensor_data",
        "params": {"metric": "L2","dims": 500}
    }
]

# Créer les tables
train_table = db.create_table("train_sensors", schema=sensor_schema, indexes=indexes)
test_table = db.create_table("test_sensors", schema=sensor_schema, indexes=indexes)


single_window = [train_windows[0]]  # Utiliser uniquement la première fenêtre
try:
    train_table.insert(single_window)
    print("Insertion réussie pour une seule fenêtre.")
except Exception as e:
    print(f"Erreur lors de l'insertion d'une seule fenêtre : {e}")

In [None]:
from datetime import datetime

try:
    datetime.fromisoformat(single_window[0]['timestamp'])
    print("Le format du timestamp est correct.")
except ValueError as e:
    print(f"Problème avec le format du timestamp : {e}")


In [None]:
for value in single_window[0]['sensor_data']:
    if not isinstance(value, float):
        print(f"Problème détecté : {value} de type {type(value)}")


In [None]:
if len(single_window[0]['sensor_data']) != 500:
    print("La longueur de sensor_data n'est pas correcte.")


In [None]:
print("Schéma de la table :")
print(train_table.schema)


In [None]:
from datetime import datetime

for window in train_windows:
    window['timestamp'] = datetime.fromisoformat(window['timestamp'])


In [None]:
train_table.query(limit=5)  # Affiche les 5 premières lignes


In [None]:
test_row_count = test_table.query(aggs=aggs)
print(f"Lignes stockées dans la table de test : {test_row_count}")


In [None]:
# Afficher le contenu du lot envoyé pour inspection
print("Contenu du lot de test :")
for i, window in enumerate(test_batch):
    print(f"Fenêtre {i}: {window}")


In [None]:
# Vérification approfondie des valeurs
for i, window in enumerate(test_batch):
    if not all(isinstance(v, float) and not (np.isnan(v) or np.isinf(v)) for v in window['sensor_data']):
        print(f"Fenêtre {i} contient des valeurs invalides.")


In [None]:
# Remplacer les valeurs invalides par une valeur par défaut (ex. : 0.0)
for window in train_windows:
    window['sensor_data'] = [
        0.0 if (np.isnan(v) or np.isinf(v)) else v
        for v in window['sensor_data']
    ]


In [None]:
# Vérifier la structure des 5 premières fenêtres
for window in train_windows[:5]:
    print(f"Index : {window['index']}")
    print(f"Timestamp : {window['timestamp']}")
    print(f"Longueur de sensor_data : {len(window['sensor_data'])}")
    print(f"Exemple de données : {window['sensor_data'][:5]}")


In [None]:
# Vérification des longueurs des fenêtres
for i, window in enumerate(train_windows):
    if len(window['sensor_data']) != window_size * len(numeric_columns):
        print(f"Fenêtre {i} a une taille incorrecte : {len(window['sensor_data'])}")
print("Validation de la longueur des fenêtres terminée.")

In [None]:
# Vérification de la continuité temporelle
for i, window in enumerate(train_windows):
    timestamps = train_df.iloc[window['index']:window['index'] + window_size]['timestamp']
    time_diffs = timestamps.diff().dt.total_seconds().dropna()
    if not all(time_diffs == 10):  # Vérifie si tous les gaps sont de 10 secondes
        print(f"Fenêtre {i} a des timestamps non consécutifs.")
print("Validation de la continuité temporelle terminée.")

In [None]:
# Exemple : Vérifier la réponse brute
response = train_table.insert(train_windows[:5])
print("Réponse brute :", response)

In [None]:
print(db.tables)

In [None]:
# Requête pour compter les lignes dans une table
train_row_count = db.query("SELECT COUNT(*) AS row_count FROM train_sensors").iloc[0]['row_count']
print(f"Lignes stockées dans la table d'entraînement : {train_row_count}")

test_row_count = db.query("SELECT COUNT(*) AS row_count FROM test_sensors").iloc[0]['row_count']
print(f"Lignes stockées dans la table de test : {test_row_count}")


In [None]:
# Afficher toutes les méthodes et attributs de l'objet db
print(dir(db.tables))

In [None]:
# Afficher toutes les méthodes et attributs de l'objet train_table
print(dir(train_table))

In [None]:
# Obtenir les détails sur la méthode query
help(train_table.query)

In [None]:
# Définir l'agrégation pour compter les lignes
aggs = {'row_count': ['count', 'index']}  # Compte le nombre de lignes en utilisant la colonne 'index'

# Effectuer la requête pour compter les lignes
train_row_count = train_table.query(aggs=aggs)
print(f"Lignes stockées dans la table d'entraînement : {train_row_count}")


In [None]:
# Parametres des fenetres temporelles
window_size = 100  # Taille de la fenetre
step_size = 1      # Pas de glissement
numeric_columns = ["TP2", "DV_pressure", "Oil_temperature", "Motor_current", "Reservoirs"]

# Générer les fenetres pour l'entrainement
train_windows = [
    {
        "index": i,
        "timestamp": train_df.iloc[i]["timestamp"],
        "sensor_data": train_df.iloc[i:i + window_size][numeric_columns].values.flatten().tolist()
    }
    for i in range(0, len(train_df) - window_size + 1, step_size)
]

# Générer les fenetres pour le test
test_windows = [
    {
        "index": i,
        "timestamp": test_df.iloc[i]["timestamp"],
        "sensor_data": test_df.iloc[i:i + window_size][numeric_columns].values.flatten().tolist()
    }
    for i in range(0, len(test_df) - window_size + 1, step_size)
]

print(f"Fenêtres d'entraînement : {len(train_windows)}")
print(f"Fenêtres de test : {len(test_windows)}")


In [None]:
from sklearn.decomposition import PCA

numeric_columns = ["TP2", "DV_pressure", "Oil_temperature", "Motor_current", "Reservoirs"]

# Construire les vecteurs pour chaque fenetre (numeric_columns)
window_vectors = np.array([
    window[numeric_columns].values.flatten() for window in windows
])

# Appliquer PCA pour réduire la dimensionnalité
pca = PCA(n_components=8)  # Réduire a 8 dimensions
compressed_vectors = pca.fit_transform(window_vectors)

print(f"Dimensions des vecteurs compressés : {compressed_vectors.shape}")
print(f"Vecteur compressé pour la première fenêtre : {compressed_vectors[0]}")