# Explicabilité des modèles (XAI) avec LIME
Ce notebook présente une approche professionnelle pour expliquer les prédictions d'un modèle de recommandation de cultures à l'aide de l'algorithme LIME (Local Interpretable Model-agnostic Explanations). L'objectif est de rendre le modèle plus transparent et d'interpréter l'importance des variables pour chaque prédiction.

## 1. Importation des librairies nécessaires
Nous allons importer les librairies essentielles pour la manipulation des données, l'entraînement du modèle et l'explication des prédictions avec LIME.

In [1]:
# Importation des librairies
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report
from lime.lime_tabular import LimeTabularExplainer

## 2. Chargement et préparation des données
Nous allons charger le jeu de données Crop Recommendation, vérifier les valeurs manquantes, et préparer les variables pour l'entraînement du modèle.

In [2]:
# Chargement des données
DATA_PATH = 'data/Crop_recommendation.csv'
df = pd.read_csv(DATA_PATH)
df.info()
df.head()

In [3]:
# Préparation des variables
X = df.drop('label', axis=1)
y = df['label']

# Encodage des labels
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
y_encoded = le.fit_transform(y)

# Séparation des données
X_train, X_test, y_train, y_test = train_test_split(X, y_encoded, test_size=0.2, random_state=42)

## 3. Entraînement du modèle de classification
Nous allons entraîner le modèle sur les données préparées et évaluer ses performances.

In [4]:
# Chargement du modèle Naive Bayes déjà entraîné
import joblib
clf = joblib.load('models/tuned/naive_bayes_best.pkl')

# Prédictions et rapport de classification
y_pred = clf.predict(X_test)
print(classification_report(y_test, y_pred, target_names=le.classes_))

## 4. Application de LIME pour l'explication des prédictions
Nous allons utiliser LIME pour expliquer les prédictions du modèle sur des exemples du jeu de test.

In [5]:
# Initialisation de LIME
explainer = LimeTabularExplainer(
    training_data=np.array(X_train),
    feature_names=X.columns,
    class_names=le.classes_,
    mode='classification',
    discretize_continuous=True
)

# Sélection d'un échantillon à expliquer
idx = 0  # Vous pouvez changer l'index pour d'autres exemples
sample = X_test.iloc[idx]

# Explication de la prédiction
exp = explainer.explain_instance(
    data_row=sample,
    predict_fn=clf.predict_proba,
    num_features=10
)
exp.show_in_notebook()

## 5. Visualisation et interprétation des explications LIME
Nous allons visualiser les contributions des variables pour la prédiction sélectionnée et interpréter les résultats.

In [6]:
# Visualisation des explications LIME
fig = exp.as_pyplot_figure()
plt.show()

## Conclusion
Ce notebook a démontré comment utiliser LIME pour interpréter les prédictions d'un modèle de recommandation de cultures. LIME permet d'identifier les variables les plus influentes pour chaque prédiction, renforçant la confiance dans le modèle et facilitant la prise de décision pour les utilisateurs finaux.

<a style='text-decoration:none;line-height:16px;display:flex;color:#5B5B62;padding:10px;justify-content:end;' href='https://deepnote.com?utm_source=created-in-deepnote-cell&projectId=37cd5642-eb00-4cb1-969e-a9bc85cf5e83' target="_blank">
 </img>
Created in <span style='font-weight:600;margin-left:4px;'>Deepnote</span></a>