# 🧪 Laboratorio 5: Creación de un Pipeline de MLOps en Databricks

## 🎯 Objetivo

Crear un pipeline de MLOps que incluya entrenamiento, registro y despliegue automatizado de un modelo usando MLflow, Databricks Repos y Azure DevOps.

## ℹ️ Introducción

MLOps combina Machine Learning con prácticas de DevOps para asegurar versionado, trazabilidad y automatización en modelos de ML.
En este laboratorio usaremos MLflow para manejar el ciclo de vida del modelo y una integración básica con DevOps para automatizar el despliegue.

## 🧠 Conceptos Clave

**MLflow**
Plataforma open-source integrada en Databricks para gestión de experimentos, modelos y despliegue.
[📘 Ver documentación](https://mlflow.org/docs/latest/index.html)

**Databricks Repos**
Funcionalidad para conectar repositorios Git a Databricks y sincronizar notebooks o scripts.
[📘 Ver documentación](https://learn.microsoft.com/en-us/azure/databricks/repos/)

**Azure DevOps**
Plataforma de CI/CD y control de versiones. En este laboratorio simularemos una pipeline de despliegue desde el lado de Databricks.
[📘 Ver documentación](https://learn.microsoft.com/en-us/azure/devops/?view=azure-devops)

## 🛠️ Pasos del laboratorio

### 1. Preparar datos de entrenamiento (dataset Iris)

In [None]:
from sklearn.datasets import load_iris
import pandas as pd

iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target

### 2. Entrenar modelo con MLflow tracking

In [None]:
import mlflow
import mlflow.sklearn
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

X_train, X_test, y_train, y_test = train_test_split(df.iloc[:, :-1], df['target'], test_size=0.2)

with mlflow.start_run():
    clf = RandomForestClassifier()
    clf.fit(X_train, y_train)
    preds = clf.predict(X_test)
    acc = accuracy_score(y_test, preds)
    mlflow.log_metric("accuracy", acc)
    mlflow.sklearn.log_model(clf, "model")

### 3. Registrar el modelo entrenado en MLflow Registry

In [None]:
model_uri = "runs:/" + mlflow.active_run().info.run_id + "/model"
mlflow.register_model(model_uri, "IrisClassifier")

### 4. Desplegar modelo como endpoint (Model Serving en Databricks)
- En la UI de MLflow, selecciona el modelo registrado y habilita el endpoint de inferencia en tiempo real.

## ✅ Validación
- Verifica que el modelo esté disponible en la sección *Models* de MLflow.
- Asegúrate de que el accuracy esté logueado correctamente.
- Confirma que puedes consumir el endpoint del modelo (si está habilitado).