In [None]:
import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler, LabelEncoder
from sklearn.metrics import confusion_matrix
import joblib
import os

# Charger le modèle, le scaler, et le label encoder
model = joblib.load('best_model.pkl')
scaler = joblib.load('scaler.pkl')
label_encoder = joblib.load('label_encoder.pkl')

# Fichier pour enregistrer les prédictions et les données reçues
historique_fichier = "historique_predictions.csv"

# Vérifier si le fichier existe, sinon créer avec les colonnes appropriées
if not os.path.isfile(historique_fichier):
    # Créer le fichier avec des colonnes adaptées
    colonnes = ["Delivery_usb", "Delivery_Web", "Delivery_email", "fileType_docx",
                "fileType_xlsx", "fileType_pdf", "fileType_exe", "fileType_zip", 
                "fileType_rar", "FileEncryptionMethod_AES", "FileEncryptionMethod_DES", 
                "FileEncryptionMethod_RSA", "Deleting Backup", "Communication C&C status", 
                "Payment Information", "Target Audience", "Normal", "Prediction"]
    pd.DataFrame(columns=colonnes).to_csv(historique_fichier, index=False)

# Fonction de prédiction et de sauvegarde
def predire_et_enregistrer(data_simulation):
    # Extraire les caractéristiques et encoder la variable 'Target Audience'
    target_audience = data_simulation.pop("Target Audience")
    data_simulation["Target Audience"] = label_encoder.transform([target_audience])[0]

    # Convertir en DataFrame pour normaliser et appliquer le modèle
    df_simulation = pd.DataFrame([data_simulation])
    features = df_simulation.values
    features_scaled = scaler.transform(features)

    # Prédiction
    prediction = model.predict(features_scaled)[0]
    data_simulation["Prediction"] = "Hacker" if prediction == 1 else "Non-Hacker"

    # Enregistrer la ligne avec le résultat dans l'historique
    historique = pd.read_csv(historique_fichier)
    historique = historique.append(data_simulation, ignore_index=True)
    historique.to_csv(historique_fichier, index=False)

    return data_simulation["Prediction"]

# Fonction pour générer la matrice de confusion
def generer_matrice_confusion():
    # Charger l'historique des prédictions
    historique = pd.read_csv(historique_fichier)

    # Créer les vraies étiquettes et les prédictions
    y_true = historique["Hacker"].map(lambda x: 1 if x == "Hacker" else 0).values
    y_pred = historique["Prediction"].map(lambda x: 1 if x == "Hacker" else 0).values

    # Calculer et afficher la matrice de confusion
    matrice_confusion = confusion_matrix(y_true, y_pred)
    return matrice_confusion

# Exemple de réception de données de simulation
data_simulation = {
    "Delivery_usb": 1, "Delivery_Web": 0, "Delivery_email": 0,
    "fileType_docx": 0, "fileType_xlsx": 0, "fileType_pdf": 1, "fileType_exe": 0,
    "fileType_zip": 0, "fileType_rar": 0, "FileEncryptionMethod_AES": 1, 
    "FileEncryptionMethod_DES": 0, "FileEncryptionMethod_RSA": 0, 
    "Deleting Backup": 0, "Communication C&C status": 0, "Payment Information": 1,
    "Target Audience": "Particuliers", "Normal": 1
}

# Utiliser le modèle pour prédire et sauvegarder le résultat
resultat = predire_et_enregistrer(data_simulation)
print(f"Prédiction : {resultat}")

# Générer la matrice de confusion mise à jour
matrice_confusion = generer_matrice_confusion()
print("Matrice de confusion :\n", matrice_confusion)
