# Initialisation

In [1]:
import sys
import notebook
import requests
import json
import re
import subprocess
import os
import time
import random
import subprocess
import numpy as np
import pandas as pd
import mlflow
import pickle

In [2]:
os.environ["JOBLIB_TEMP_FOLDER"] = "D:/Pro/OpenClassrooms/Projet_7/tmp"

In [3]:
packages = {
    "Python": sys,
    "Jupyter Notebook": "notebook",
    "NumPy": "numpy",
    "Pandas": "pandas",
    "MLFlow": "mlflow"
}

In [4]:
errorMsg = (
    "non disponible - vérifiez que le package existe, qu'il est correctement installé, importé "
    "et qu'il dispose d'un attribut '__version__'."
)
for name, module in packages.items():
    if isinstance(module, str):
        version = getattr(sys.modules.get(module, None), '__version__', errorMsg)
    else:
        if module is sys:
            version = sys.version
        else:
            version = getattr(module, '__version__', errorMsg)

    print(f"Version de {name} : {version}")

Version de Python : 3.12.8 (tags/v3.12.8:2dc476b, Dec  3 2024, 19:30:04) [MSC v.1942 64 bit (AMD64)]
Version de Jupyter Notebook : 7.3.2
Version de NumPy : 2.0.2
Version de Pandas : 2.2.3
Version de MLFlow : 2.19.0


In [5]:
# Chemins
pro_repo = "D://Pro//OpenClassrooms//Projet_7//"
data_path = f"{pro_repo}data//"

In [6]:
# 📌 Chemin vers le fichier pickle
base_dir = os.path.dirname(os.getcwd())
file_path = os.path.join(base_dir, "models", "lgbm_final_model.pkl")

# ✅ Vérification de l'existence du fichier
if not os.path.exists(file_path):
    print(f"❌ Erreur : Le fichier '{file_path}' n'existe pas.")
else:
    # 🚀 Chargement du fichier pickle
    with open(file_path, "rb") as f:
        model_data = pickle.load(f)

    print("✅ Fichier Pickle chargé avec succès !")

    # 🔍 Afficher les clés du dictionnaire stocké
    print("\n📂 Contenu du fichier Pickle :")
    for key in model_data.keys():
        print(f"🔹 {key} -> Type: {type(model_data[key])}")

    # 📊 Vérifier le modèle
    if "model" in model_data:
        model = model_data["model"]
        print("\n✅ Modèle chargé avec succès :", type(model))

        # 🔬 Vérification si le modèle est bien entraîné
        if hasattr(model, "predict_proba"):
            print("🔍 Le modèle supporte bien `predict_proba`.")

            # ⚡ Test rapide de prédiction avec des données factices
            fake_input = np.random.rand(1, model.n_features_in_)
            try:
                fake_prediction = model.predict_proba(fake_input)
                print(f"✅ Prédiction test réussi : {fake_prediction}")
            except Exception as e:
                print(f"❌ Erreur lors du test de prédiction : {e}")

    # 📊 Vérifier le seuil optimal stocké
    if "optimal_threshold" in model_data:
        print(f"\n📌 Seuil optimal stocké : {model_data['optimal_threshold']:.3f}")
    else:
        print("\n⚠️ Avertissement : Aucun seuil optimal trouvé dans le fichier Pickle.")

✅ Fichier Pickle chargé avec succès !

📂 Contenu du fichier Pickle :
🔹 model -> Type: <class 'lightgbm.sklearn.LGBMClassifier'>
🔹 optimal_threshold -> Type: <class 'numpy.float64'>
🔹 features -> Type: <class 'list'>

✅ Modèle chargé avec succès : <class 'lightgbm.sklearn.LGBMClassifier'>
🔍 Le modèle supporte bien `predict_proba`.
✅ Prédiction test réussi : [[0.97559615 0.02440385]]

📌 Seuil optimal stocké : 0.150




In [7]:
# # Test rapide de l'API

# # 📌 Définition de l'URL de l'API Flask
# api_url = "http://127.0.0.1:5000/predict"
# # 📌 Création d'un échantillon de test avec des valeurs arbitraires
# test_features = {
#     "feature1": 0.5,
#     "feature2": 1.2,
#     "feature3": -0.8
# }

# # 📌 Envoi de la requête POST à l'API
# response = requests.post(api_url, json=test_features)

# # 📌 Affichage du résultat
# if response.status_code == 200:
#     print("✅ Réponse de l'API :", response.json())
# else:
#     print(f"❌ Erreur {response.status_code} : {response.text}")

In [8]:
# ✅ Extraction des features uniquement
if "features" in model_data:
    features_list = model_data["features"]

    # 📌 Générer un DataFrame avec les bonnes colonnes
    app_test_features = pd.DataFrame(columns=features_list)

    # 📌 Ajouter une ligne aléatoire avec des valeurs simulées
    app_test_features.loc[0] = np.random.rand(len(features_list))

    # 📌 Sélection d'une ligne aléatoire sous forme de dictionnaire
    random_sample = app_test_features.iloc[0].to_dict()

    # 📌 Affichage des données envoyées sous forme de tableau
    print(f"📌 Données envoyées à l'API ({len(features_list)} features) :")
    df_sample = pd.DataFrame(random_sample.items(), columns=["Feature", "Valeur"])
    display(df_sample)

# 📌 Envoi de la requête à l'API locale
api_url = "http://127.0.0.1:5000/predict"

try:
    response = requests.post(api_url, json=random_sample)

    # 📌 Affichage du résultat détaillé
    if response.status_code == 200:
        response_data = response.json()

        print("\n✅ Résultat de l'API :")
        print(f"🔹 Probabilité d'appartenir à la classe 0 (fiable) : {response_data['probability_class_0']:.3f}")
        print(f"🔹 Probabilité d'appartenir à la classe 1 (risqué) : {response_data['probability_class_1']:.3f}")
        print(f"🔹 Seuil optimal : {response_data['optimal_threshold']:.3f}")
        print(f"🔹 Marge appliquée : {response_data['margin']:.3f}%")
        print(f"🔹 Limites de la zone grise : [{response_data['lower_bound']:.3f}, {response_data['upper_bound']:.3f}]")
        print(f"🔹 Résultat final : {response_data['prediction']}")

    else:
        print(f"❌ Erreur lors de l'appel API : {response.status_code}, {response.text}")

except requests.exceptions.RequestException as e:
    print(f"❌ Erreur de connexion à l'API : {e}")

📌 Données envoyées à l'API (17 features) :


Unnamed: 0,Feature,Valeur
0,AMT_ANNUITY,0.05319
1,AMT_CREDIT,0.250653
2,AMT_GOODS_PRICE,0.308885
3,ANNUITY_INCOME_PERCENT,0.998638
4,CREDIT_GOODS_RATIO,0.478476
5,CREDIT_TERM,0.553094
6,DAYS_BIRTH,0.862391
7,DAYS_ID_PUBLISH,0.409848
8,DAYS_REGISTRATION,0.822506
9,DEBT_CREDIT_RATIO,0.212148


❌ Erreur lors de l'appel API : 404, <!doctype html>
<html lang=en>
<title>404 Not Found</title>
<h1>Not Found</h1>
<p>The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.</p>



In [None]:
# api_url = "http://127.0.0.1:5000/predict"
# response = requests.post(api_url, json={})

# print(f"🔍 Code HTTP : {response.status_code}")
# print(f"📝 Réponse : {response.text}")

🔍 Code HTTP : 404
📝 Réponse : <!doctype html>
<html lang=en>
<title>404 Not Found</title>
<h1>Not Found</h1>
<p>The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.</p>



: 

In [9]:
# print("📌 Features du modèle :", features_list)
# print(type(features_list))
# print("📌 Données envoyées à l'API :", random_sample)

# Commandes