In [2]:
import mlflow
import mlflow.sklearn 
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from sklearn.datasets import fetch_openml
import numpy as np
from sklearn.model_selection import train_test_split

# Charger le jeu de données
data = fetch_openml('Fashion-MNIST', version=1)
X = np.array(data.data)
y = np.array(data.target)

# Diviser les données en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Démarrer une expérience MLflow
mlflow.set_experiment("Classification Fashion-MNIST") 

with mlflow.start_run():
    # Enregistrer les paramètres du modèle
    mlflow.log_param("kernel", 'linear') 
    mlflow.log_param("C", 1.0) 

    # Entraîner le modèle (exemple avec SVM)
    model = SVC(kernel='linear', C=1.0)
    model.fit(X_train, y_train)

    # Prédictions et évaluation
    y_pred = model.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)

    # Enregistrer la métrique (accuracy)
    mlflow.log_metric("accuracy", accuracy)

    # Enregistrer le modèle en tant qu'artefact
    mlflow.sklearn.log_model(model, "model") 