# 🧪 Laboratorio Extra: Análisis Completo con MLflow

## 🎯 Objetivo

Realizar un análisis exhaustivo de experimentos de machine learning registrados con MLflow, incluyendo comparación de métricas, visualización de resultados, y selección del mejor modelo.

## ℹ️ Introducción

MLflow permite realizar experimentación reproducible y trazable en proyectos de machine learning.
Este laboratorio te guía paso a paso en el uso del tracking server para analizar múltiples ejecuciones de modelos, visualizar métricas, y seleccionar la mejor versión basada en resultados objetivos.

## 🧠 Conceptos Clave

**Experimentos MLflow**
Una colección de ejecuciones (runs) relacionadas. Cada ejecución tiene parámetros, métricas, artefactos y modelos.

**Run**
Instancia única de entrenamiento registrada con MLflow. Puede incluir código, métricas, modelos y otros artefactos.

**Comparación de Runs**
MLflow permite comparar ejecuciones dentro de un experimento mediante métricas registradas, visualizaciones y filtros.
[📘 Ver documentación](https://mlflow.org/docs/latest/tracking.html#viewing-the-tracking-ui)

## 🧾 ¿Por qué es importante analizar experimentos en MLflow?

El análisis de múltiples ejecuciones de modelos permite identificar qué combinaciones de parámetros producen los mejores resultados. Sin este análisis sistemático, es fácil perder de vista qué cambios impactan en el rendimiento del modelo.

MLflow ofrece una interfaz que facilita este análisis con:
- Visualizaciones automáticas de métricas.
- Filtros por parámetros o etiquetas.
- Comparación visual de runs.
- Capacidad de registrar modelos y promoverlos.

Este laboratorio refleja un flujo profesional de trabajo en experimentación de modelos y es aplicable tanto en entornos académicos como productivos.

## 🛠️ Pasos del laboratorio

### 1. Entrenar varios modelos con distintos parámetros y registrarlos en MLflow

In [None]:
import mlflow
import mlflow.sklearn
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.datasets import load_iris

X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

mlflow.set_experiment("Iris_RF_Analysis")

for n_estimators in [10, 50, 100, 200]:
    with mlflow.start_run():
        clf = RandomForestClassifier(n_estimators=n_estimators)
        clf.fit(X_train, y_train)
        preds = clf.predict(X_test)
        acc = accuracy_score(y_test, preds)
        mlflow.log_param("n_estimators", n_estimators)
        mlflow.log_metric("accuracy", acc)
        mlflow.sklearn.log_model(clf, "model")

### 💡 Buenas prácticas para el análisis con MLflow

- **Consistencia**: Asegúrate de registrar los mismos tipos de métricas y parámetros para todas las ejecuciones.
- **Etiquetado**: Usa `mlflow.set_tags()` o el UI para clasificar ejecuciones por tipo de experimento o autor.
- **Versionamiento**: Usa `Model Registry` para tener control sobre qué modelos están listos para producción.
- **Trazabilidad**: Guarda scripts, visualizaciones o métricas adicionales como artefactos adjuntos a cada run.

Estas prácticas permiten colaborar mejor en equipos de ciencia de datos y escalar tus soluciones de ML con gobernanza y seguridad.

### 2. Usar MLflow UI para explorar el experimento
- Ve a la interfaz web de MLflow en Databricks.
- Navega a la sección de experimentos.
- Aplica filtros por parámetros (por ejemplo, `n_estimators > 50`).
- Ordena las ejecuciones por métrica de `accuracy`.

### 3. Comparar ejecuciones con gráficas en MLflow
- Usa el botón **Compare**.
- Selecciona hasta 10 ejecuciones.
- Visualiza la métrica `accuracy` para comparar desempeño.
- Examina el código fuente, parámetros y modelos registrados.

### 4. Seleccionar y promover el mejor modelo
- Desde la UI de MLflow, selecciona el run con mejor `accuracy`.
- Regístralo en el **Model Registry** como nueva versión.
- Promuévelo a etapa `Staging` o `Production` para su uso.


## ✅ Validación
- Asegúrate de tener múltiples ejecuciones visibles en el experimento.
- Confirma que las métricas estén graficadas correctamente.
- Verifica que el mejor modelo esté registrado en el Model Registry.
