In [None]:
import mlflow
import mlflow.sklearn
from time import time
from sklearn.metrics import (accuracy_score, precision_score, recall_score, f1_score,
                             hamming_loss, jaccard_score, confusion_matrix, roc_curve, auc)
import matplotlib.pyplot as plt
import numpy as np


Elements du tracking : 

**1. Métriques de Performance** (Scores) :
   
<u>Accuracy</u> : Précision moyenne des tags prédits.  

<u>Precision</u> (micro, macro, weighted) : Précision des prédictions, évaluée de plusieurs manières.  

<u>Recall</u> (micro, macro, weighted) : Taux de rappel des prédictions.  

<u>F1 Score</u> (micro, macro, weighted) : Moyenne harmonique de la précision et du rappel.  

<u>Hamming Loss</u> : Nombre moyen d'étiquettes incorrectes par instance.  

<u>Subset Accuracy</u> : Proportion d'instances pour lesquelles toutes les étiquettes prédictes sont correctes.  

<u>Jaccard Similarity</u> : Mesure de la similarité entre les ensembles de tags prédits et réels.  
  
**2. Hyperparamètres**
   
<u>Paramètres du Modèle</u> :  
Pour un Random Forest : n_estimators, max_depth, min_samples_split, min_samples_leaf, etc.  
Pour un SVM : C, kernel, gamma, etc.  
Pour un modèle de deep learning : learning_rate, batch_size, num_epochs, dropout_rate, etc.  

<u>Prétraitement</u> : 
Taille du vocabulaire.  
Méthodes de vectorisation (TF-IDF, embeddings).  
Paramètres de tokenisation (n-grams, stop words).  


**3. Artifacts**

<u>Modèles Entraînés</u> : Modèles sauvegardés pour chaque run.    

<u>Vecteurs de Features</u> : Vecteurs résultant de la vectorisation des questions. 

<u>Fichiers de Logs</u> : Logs de l'entraînement et de la validation.    

<u>Matrice de Confusion</u> : Pour visualiser les prédictions correctes et incorrectes.  

<u>Courbes ROC/AUC</u> : Pour les modèles supportant predict_proba.    

<u>Courbes d'apprentissage</u> : Visualisation de la progression des métriques de performance pendant l'entraînement.    

**4. Graphiques Intéressants à Visualiser**  

<u>Courbes d'Apprentissage</u> : Visualiser l'évolution de la perte et des métriques (précision, rappel, F1) pendant l'entraînement.  

<u>Matrice de Confusion</u> : Affichage de la matrice de confusion pour comprendre les erreurs de classification.  

<u>Courbe ROC</u> : Affichage de la courbe ROC pour les modèles de classification probabilistes.  

<u>Importance des Features</u> : Graphique montrant l'importance des différentes features pour les modèles comme les Random Forests.  

<u>Distribution des Tags Prédits vs Réels</u> : Comparaison de la distribution des tags prédits par le modèle par rapport aux tags réels.  

<u>Histogrammes des Temps de Traitement</u> : Visualisation des temps de traitement pour l'entraînement et la prédiction.

## Fonctions de tracking MLFlow

In [None]:
def plot_confusion_matrix(cm, classes, normalize=False, title='Confusion matrix', cmap=plt.cm.Blues):
    if normalize:
        cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]

    plt.imshow(cm, interpolation='nearest', cmap=cmap)
    plt.title(title)
    plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=45)
    plt.yticks(tick_marks, classes)

    fmt = '.2f' if normalize else 'd'
    thresh = cm.max() / 2.
    for i, j in np.ndindex(cm.shape):
        plt.text(j, i, format(cm[i, j], fmt),
                 horizontalalignment="center",
                 color="white" if cm[i, j] > thresh else "black")

    plt.ylabel('True label')
    plt.xlabel('Predicted label')
    plt.tight_layout()

def track_classification_experiment(model, X_train, y_train, X_test, y_test, params, class_labels=None):
    with mlflow.start_run():
        # Enregistrement des hyperparamètres
        mlflow.log_params(params)

        # Entraînement du modèle
        start_time = time()
        model.fit(X_train, y_train)
        training_time = time() - start_time
        mlflow.log_metric("training_time", training_time)

        # Prédictions et calcul des scores
        start_time = time()
        predictions = model.predict(X_test)
        prediction_time = time() - start_time
        mlflow.log_metric("prediction_time", prediction_time)
        
        # Calcul des scores
        acc = accuracy_score(y_test, predictions)
        prec_micro = precision_score(y_test, predictions, average='micro')
        rec_micro = recall_score(y_test, predictions, average='micro')
        f1_micro = f1_score(y_test, predictions, average='micro')
        ham_loss = hamming_loss(y_test, predictions)
        subset_acc = np.mean([set(pred) == set(real) for pred, real in zip(predictions, y_test)])
        jaccard = jaccard_score(y_test, predictions, average='samples')

        # Enregistrement des scores
        mlflow.log_metric("accuracy", acc)
        mlflow.log_metric("precision_micro", prec_micro)
        mlflow.log_metric("recall_micro", rec_micro)
        mlflow.log_metric("f1_score_micro", f1_micro)
        mlflow.log_metric("hamming_loss", ham_loss)
        mlflow.log_metric("subset_accuracy", subset_acc)
        mlflow.log_metric("jaccard_similarity", jaccard)

        # Enregistrement de la matrice de confusion
        if class_labels is not None:
            cm = confusion_matrix(y_test.argmax(axis=1), predictions.argmax(axis=1))
            plt.figure()
            plot_confusion_matrix(cm, classes=class_labels, title='Confusion matrix')
            plt.savefig('confusion_matrix.png')
            mlflow.log_artifact('confusion_matrix.png')

        # Enregistrement des courbes ROC (exemple pour les modèles supportant predict_proba)
        if hasattr(model, 'predict_proba'):
            probas = model.predict_proba(X_test)
            for i, class_label in enumerate(class_labels):
                fpr, tpr, thresholds = roc_curve(y_test[:, i], probas[:, i])
                roc_auc = auc(fpr, tpr)
                plt.figure()
                plt.plot(fpr, tpr, color='darkorange', lw=2, label='ROC curve (area = %0.2f)' % roc_auc)
                plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
                plt.xlim([0.0, 1.0])
                plt.ylim([0.0, 1.05])
                plt.xlabel('False Positive Rate')
                plt.ylabel('True Positive Rate')
                plt.title(f'ROC Curve for {class_label}')
                plt.legend(loc="lower right")
                plt.savefig(f'roc_curve_{class_label}.png')
                mlflow.log_artifact(f'roc_curve_{class_label}.png')

        # Enregistrement du modèle
        mlflow.sklearn.log_model(model, "model")

        # Enregistrement de l'environnement
        mlflow.set_tag("mlflow_version", mlflow.__version__)
        mlflow.set_tag("model_type", type(model).__name__)
        # Log des versions des packages utilisés (sklearn, numpy, etc.)

### Exemple d'utilisation des fonctions de tracking

In [None]:
# # Exemple d'utilisation
# from sklearn.multioutput import MultiOutputClassifier
# from sklearn.ensemble import RandomForestClassifier
# from sklearn.preprocessing import MultiLabelBinarizer

# # Exemple d'initialisation des données
# X_train = ...  # Vos données d'entraînement
# X_test = ...   # Vos données de test
# y_train = ...  # Vos étiquettes d'entraînement
# y_test = ...   # Vos étiquettes de test

# model = MultiOutputClassifier(RandomForestClassifier(n_estimators=100, max_depth=10))
# params = {"n_estimators": 100, "max_depth": 10}
# mlb = MultiLabelBinarizer()
# y_train_bin = mlb.fit_transform(y_train)
# y_test_bin = mlb.transform(y_test)

# class_labels = mlb.classes_
# track_classification_experiment(model, X_train, y_train_bin, X_test, y_test_bin, params, class_labels)