# Identify the best practices of an MLOps strategy

## 🧠 Conceptos clave que debes dominar

| Categoría                      | Buenas prácticas                                                         | En Databricks…                                                            |
| ------------------------------ | ------------------------------------------------------------------------ | ------------------------------------------------------------------------- |
| **Ciclo de vida reproducible** | Usar pipelines reproducibles para entrenamiento, validación y despliegue | Usa MLflow (tracking y proyectos) y notebooks versionados                 |
| **Tracking de experimentos**   | Registrar automáticamente métricas, parámetros y artefactos              | `mlflow.start_run()`, `mlflow.log_metric()`, etc.                         |
| **Gestión de modelos**         | Registrar modelos con versión, etapa (`Staging`, `Production`) y alias   | Usa MLflow Model Registry (de Unity Catalog si es posible)                |
| **Feature consistency**        | Reutilizar y centralizar features a través del **Feature Store**         | Usa `FeatureStoreClient`, tablas offline y online                         |
| **Despliegue automatizado**    | Automatizar el paso de entrenamiento a producción mediante CI/CD         | Integra con repositorios Git + Jobs + REST APIs                           |
| **Validación de modelos**      | Validación automática (unit tests, benchmarks) antes de promover         | Implementar validadores dentro de pipelines o con notebooks de validación |
| **Gobernanza y auditoría**     | Control de accesos, trazabilidad de runs, versionado de código/modelos   | Usa Unity Catalog y MLflow para registrar todo                            |
| **Monitoreo post-despliegue**  | Monitorear performance de modelos en producción (drift, errores)         | Logs personalizados, uso de dashboards (ej. Databricks SQL)               |
| **Promoción controlada**       | Promover modelos con alias (`Champion`, `Challenger`) y rollback         | Usa `set_registered_model_alias()` y validación manual o automática       |
| **Separación de entornos**     | Desarrollo, staging y producción deben estar claramente separados        | Usa workspaces, clusters o UC para aislar entornos                        |


## 📌 Puntos claves
**Ciclo de vida del modelo**

- MLOps automatiza: entrenamiento → validación → registro → despliegue → monitoreo.
- Siempre busca reproducibilidad → versión de código, datos, modelos y features.

### Best practices clave que debes conocer
| Práctica                   | Qué recordar                                                  |
| -------------------------- | ------------------------------------------------------------- |
| **Tracking**               | Siempre registra métricas, parámetros y artefactos            |
| **Versionado**             | Versiona modelo + código + datos para trazabilidad            |
| **Validación**             | Usa métricas + visuales + revisión humana antes de promover   |
| **Feature Store**          | Garantiza consistencia entre training y serving               |
| **Separación de entornos** | Usa staging vs producción para minimizar riesgos              |
| **Alias en modelos**       | `Champion` es el modelo activo, `Challenger` es el competidor |
| **Gobernanza UC**          | Unity Catalog permite centralizar permisos y versiones        |

## 🆚 Diferencias comunes para memorizar
| Concepto A                      | vs | Concepto B                 | Diferencia clave                                                         |
| ------------------------------- | -- | -------------------------- | ------------------------------------------------------------------------ |
| **MLflow Registry (workspace)** | vs | **Unity Catalog Registry** | El primero es local al workspace, el segundo es global y gobernado       |
| **Promover modelos**            | vs | **Promover código**        | Promover código es para notebooks/scripts; modelos para flujos validados |
| **Online features**             | vs | **Offline features**       | Online: baja latencia, serving; Offline: batch, training                 |


# Identify the advantages of using ML runtimes

## 🧠 ¿Qué es un ML Runtime en Databricks?
Un ML Runtime es una versión de entorno preconfigurado en Databricks que incluye:

- Librerías de machine learning más usadas
- Integración lista con MLflow
- Compatibilidad con GPU/TPU (según instancia)
- Compatibilidad con Spark para trabajo distribuido
- Soporte para AutoML, Feature Store y Model Serving
- Es como un "conda env" + Spark + MLflow listo para usar.

## 📌 Puntos claves

| **Ventaja**                                            | **Explicación clara**                                                                                          | **Término clave a recordar** |
| ------------------------------------------------------ | -------------------------------------------------------------------------------------------------------------- | ---------------------------- |
| 🔌 **Preconfigurado**                                  | Incluye `scikit-learn`, `xgboost`, `tensorflow`, `pytorch`, `mlflow`, etc. sin necesidad de instalación manual | "Listo para usar"            |
| 🧩 **Integración total con MLflow**                    | No necesitas configurar tracking, UI, ni artifacts: ya viene integrado                                         | "MLflow nativo"              |
| 🧠 **Soporte para AutoML**                             | AutoML en Databricks solo está disponible en ML Runtime                                                        | "AutoML solo en ML Runtime"  |
| 🧱 **Compatible con Feature Store**                    | Solo disponible cuando usas ML Runtime en clusters de tipo `ml`                                                | "Feature Store funcional"    |
| 🚀 **Optimizado para GPU y deep learning**             | Versiones de ML Runtime tienen builds con CUDA/cuDNN listos para usar                                          | "GPU-ready"                  |
| 🧪 **Entorno consistente para entrenar y servir**      | Permite que el modelo sea entrenado y desplegado en el mismo entorno (¡menos errores!)                         | "Same environment"           |
| 🔒 **Seguridad y mantenimiento oficial**               | Actualizado por Databricks con parches, dependencias seguras y validación                                      | "Mantenido por Databricks"   |
| ⚙️ **Soporte para clusters compartidos y autoscaling** | Se puede usar con clusters dinámicos para batch y producción                                                   | "Optimizado Spark + ML"      |


## Casos donde usar ML Runtime te da ventaja

| Escenario                                                   | ¿Por qué usar ML Runtime?                  |
| ----------------------------------------------------------- | ------------------------------------------ |
| Quieres hacer pruebas con AutoML rápido                     | Está disponible solo en ML Runtime         |
| Quieres registrar métricas en MLflow automáticamente        | ML Runtime lo hace sin configuración       |
| Necesitas entrenar un modelo con PyTorch en GPU             | Hay ML Runtime con soporte para CUDA       |
| Quieres servir un modelo con Databricks Model Serving       | ML Runtime garantiza compatibilidad        |
| Usas Feature Store para features de entrenamiento y scoring | Solo funciona completamente con ML Runtime |


# Identify how AutoML facilitates model/feature selection

## ¿Qué hace AutoML en Databricks?
AutoML en Databricks automatiza gran parte del proceso de entrenamiento de modelos. En particular:

- Prueba varios algoritmos (modelos) automáticamente
- Hace selección de features relevantes
- Aplica técnicas de preprocesamiento y transformación
- Ajusta hiperparámetros con search space razonable
- Genera un notebook reutilizable y reproducible


## ¿Cómo facilita la selección de modelos y features?
| Función                                         | ¿Cómo AutoML lo hace por ti?                                                                                                 | ¿Por qué es útil?                                              |
| ----------------------------------------------- | ---------------------------------------------------------------------------------------------------------------------------- | -------------------------------------------------------------- |
| 🧠 **Prueba múltiples modelos automáticamente** | Prueba `LogisticRegression`, `RandomForest`, `XGBoost`, etc., y compara métricas como accuracy, ROC AUC, RMSE, etc.          | Ahorra tiempo; puedes elegir el mejor modelo sin codificar     |
| 🧪 **Selecciona features relevantes**           | Aplica técnicas de importancia de variables (ej. `feature_importances_` o SHAP) y elimina features irrelevantes o colineales | Mejora performance y evita overfitting                         |
| 🧹 **Hace preprocesamiento automático**         | Imputación de valores nulos, codificación de variables categóricas, escalado de variables continuas                          | Evita errores comunes y garantiza inputs válidos para modelos  |
| 📊 **Entrega métricas comparativas**            | Genera tabla de runs con métricas por modelo                                                                                 | Puedes analizar resultados y justificar la elección del modelo |
| 🧱 **Genera notebook con el mejor pipeline**    | El código completo con steps, hiperparámetros, evaluación, etc.                                                              | Puedes reproducir, mejorar o usar como base para producción    |


## ¿Qué ocurre internamente?
Cuando ejecutas:

```python
import databricks.automl
summary = databricks.automl.classify(df, target_col="y")
```

Databricks AutoML:

- Detecta automáticamente los tipos de columnas (numéricas, categóricas, fecha, etc.)
- Realiza limpieza básica: elimina columnas constantes, llena nulos, etc.
- Hace ingeniería de características (p. ej., one-hot encoding, extracción de fecha)
- Corre múltiples modelos como:
  - LogisticRegression
  - LightGBM
  - XGBoost
  - RandomForest
- Evalúa modelos con métricas como f1, precision, roc_auc, etc.
- Registra cada experimento en MLflow Tracking
- Te devuelve:
  - El mejor modelo
  - Notebook del pipeline completo
  - MLflow experiment con todas las ejecuciones

## 📌 Puntos claves

| Pregunta típica                                                 | Respuesta esperada                                                    |
| --------------------------------------------------------------- | --------------------------------------------------------------------- |
| ¿Cómo facilita AutoML la selección de modelo?                   | Ejecuta múltiples modelos y compara métricas automáticamente          |
| ¿Cómo ayuda AutoML con la selección de features?                | Evalúa la importancia de variables y elimina las irrelevantes         |
| ¿Qué beneficio clave ofrece AutoML para el proceso de modelado? | Genera automáticamente un notebook con el mejor pipeline reproducible |
| ¿Dónde puedes comparar el rendimiento de los modelos?           | En el experimento de MLflow que AutoML crea automáticamente           |


# Identify the advantages AutoML brings to the model development process

## 📌 Puntos claves

| Etapa del proceso                                      | ¿Qué hace AutoML?                                                               | Ventaja clave                                             |
| ------------------------------------------------------ | ------------------------------------------------------------------------------- | --------------------------------------------------------- |
| 📦 **Carga y limpieza de datos**                       | Detecta tipos de columnas, rellena nulos, descarta columnas vacías o constantes | Reduce errores de entrada y tiempo de preparación         |
| 🧼 **Preprocesamiento automático**                     | Aplica one-hot encoding, escalado, transformaciones temporales, etc.            | Evita código redundante y asegura inputs válidos          |
| 🧠 **Selección automática de modelos y features**      | Corre múltiples algoritmos y selecciona el mejor según métricas                 | Acelera la exploración y evita sesgos del analista        |
| 🧪 **Entrenamiento automático y optimización**         | Ajusta hiperparámetros con lógica propia (ej. grid/random search)               | Ahorra tiempo y mejora la performance sin intervención    |
| 📊 **Evaluación automática**                           | Muestra comparaciones de métricas: ROC AUC, RMSE, F1, etc.                      | Facilita decisiones sin necesidad de graficar manualmente |
| 📝 **Notebook generado automáticamente**               | Entrega notebook 100 % editable y reproducible del mejor pipeline               | Acelera producción y aprendizaje del proceso              |
| 🔄 **Integración con MLflow**                          | Registra experimentos, parámetros, métricas, modelos y código                   | Garantiza trazabilidad y reproducibilidad                 |
| 🚀 **Escalabilidad con Spark y clusters distribuidos** | Corre en Spark clusters si el dataset es grande                                 | Permite manejar datasets grandes sin reescribir código    |


## Flashcards mentales para memorizar
- AutoML reduce el tiempo de desarrollo → automatiza desde limpieza hasta evaluación
- AutoML genera código reutilizable → notebook editable y listo para producción
- AutoML integra con MLflow → todo el tracking ya está hecho
- AutoML escala en Spark → puedes usarlo con datasets grandes
- AutoML mejora productividad y precisión → compara modelos con criterios objetivos

# Identify the benefits of creating feature store tables at the account level in Unity Catalog in Databricks vs at the workspace level


## Contexto: Qué es el Feature Store en Databricks
El Feature Store de Databricks es un sistema centralizado para gestionar, versionar y reutilizar características (features) para modelos de ML. Permite:

Definir, almacenar y documentar features.

Compartir features entre equipos.

Acceder a las features de forma consistente tanto en entrenamiento como en inferencia.

## 🔍 Diferencia clave: Nivel de cuenta (Account-level / Unity Catalog) vs Nivel de workspace

| Aspecto                   | Workspace-level Feature Store                                            | Unity Catalog (Account-level) Feature Store                                                                                |
| ------------------------- | ------------------------------------------------------------------------ | -------------------------------------------------------------------------------------------------------------------------- |
| **Scope**                 | Solo accesible desde el workspace en que fue creado.                     | Accesible desde todos los workspaces que usen Unity Catalog dentro de la misma cuenta.                                     |
| **Governanza**            | Gestión limitada por workspace.                                          | Control total a través de UC: roles, permisos, lineage, etc.                                                               |
| **Reutilización**         | Limitada: features deben recrearse si se quieren usar en otro workspace. | Alta reutilización: features se centralizan y pueden compartirse globalmente.                                              |
| **Seguridad y auditoría** | Permisos locales del workspace.                                          | Seguridad avanzada con Unity Catalog, incluyendo **Auditing**, **Data Lineage**, y **Fine-grained Access Control (ABAC)**. |
| **Escalabilidad**         | Difícil de escalar a nivel organización.                                 | Ideal para equipos grandes, entornos multicloud o multiworkspaces.                                                         |
| **Colaboración**          | Features aislados por workspace.                                         | Promueve la colaboración entre equipos al compartir features desde un catálogo centralizado.                               |


## 📌 Puntos claves

- UC permite centralizar y reutilizar features entre múltiples workspaces.
- UC mejora la seguridad, ya que se basa en acceso por Unity Catalog, no por configuración local.
- UC permite la trazabilidad y gobernanza completa del ciclo de vida de las features (quién las creó, qué modelos las usan, etc.).
- UC es escalable a nivel de organización y multicloud.
- Crear tablas de Feature Store en UC es más adecuado para entornos de producción colaborativos.

# Create a feature store table in Unity Catalog

## ¿Qué es una Feature Store Table en Unity Catalog?
Es una tabla de características reutilizable, registrada y versionada que puede ser accedida por diferentes equipos/proyectos a través de Unity Catalog, lo que permite mayor control, trazabilidad, reutilización y seguridad.

## Requisitos previos
Unity Catalog habilitado y configurado en el workspace.

- Tener acceso a un metastore de Unity Catalog (nivel de cuenta, no solo de workspace).
- Tener permisos para:
- Crear esquemas (schemas) y tablas en Unity Catalog.
- Acceder a datos fuentes.
- Acceder a Feature Store (feature_store en Databricks Runtime for ML).

## Conceptos que debes dominar
Concepto	Descripción
| Concepto       | Descripción                                                               |
| -------------- | ------------------------------------------------------------------------- |
| Unity Catalog  | Sistema de control de acceso y gobernanza de datos a nivel de cuenta.     |
| Feature Store  | Repositorio para almacenar y reutilizar características (features) de ML. |
| Feature Lookup | Mecanismo para acceder a features registrados desde un modelo.            |
| ML Runtime     | Databricks runtime optimizado para ML, incluye Feature Store client.      |


## 🛠️ Pasos para crear una tabla en Unity Catalog Feature Store

In [0]:
from databricks.feature_store import FeatureStoreClient
from databricks.feature_store.entities.feature_table import FeatureTable

# Instanciar el cliente
fs = FeatureStoreClient()

# Crear un DataFrame de ejemplo
from pyspark.sql.functions import col
df = spark.read.table("main.default.customer_data").select("customer_id", "age", "income")

# Especificar el path en Unity Catalog: <catalog>.<schema>.<table>
feature_table_name = "main.marketing.customer_features"

# Crear la tabla
fs.create_table(
    name=feature_table_name,
    primary_keys=["customer_id"],
    df=df,
    schema=df.schema,
    description="Customer demographic features for marketing models"
)

## Validaciones

In [0]:
fs.get_table(feature_table_name)

# o 

spark.sql("DESCRIBE TABLE main.marketing.customer_features").display()

## ¿Por qué usar Unity Catalog en lugar de Feature Store a nivel de workspace?

| Ventaja de Unity Catalog (nivel de cuenta) | Comparación con nivel de workspace       |
| ------------------------------------------ | ---------------------------------------- |
| Reutilización entre workspaces             | Limitado a un solo workspace             |
| Control de acceso centralizado             | Requiere ACLs individuales por workspace |
| Integración con Unity Lineage              | No disponible sin Unity Catalog          |
| Versionado y trazabilidad                  | Manual o limitada                        |
| Gobernanza de datos corporativa            | No apto para ambientes multi-equipo      |


## 📌 Puntos claves

# Write data to a feature store table

## 1. ¿Qué significa escribir datos a una Feature Store Table?
Significa registrar un DataFrame de características (features) en una tabla del Feature Store. Esto permite:

- Reutilizar los features en entrenamiento y producción.
- Asegurar consistencia y trazabilidad.
- Compartirlos con otros equipos y modelos.

## 2. Requisitos previos
El DataFrame debe tener columnas designadas como primary keys (claves únicas por entidad).

- Las columnas deben estar limpias y estables (sin datos faltantes ni altamente volátiles).
- Debes tener una tabla ya creada (o crearla en el momento con create_table()).

## 3. Métodos para escribir datos
a) Usando write_table() para sobrescribir o añadir.

b) Modos disponibles:
- "overwrite": reemplaza toda la tabla.
- "merge": actualiza los registros existentes y añade nuevos.
- "append": añade nuevas filas sin afectar las existentes.

In [0]:
from databricks.feature_store import FeatureStoreClient

fs = FeatureStoreClient()

fs.write_table(
    name="main.catalog.schema.feature_table_name",
    df=features_df,
    mode="overwrite"  # o "merge" para añadir/actualizar
)




## 4. ¿Qué incluye el DataFrame?
Tu DataFrame debe contener:

- Al menos una clave primaria (primary_keys).
- Una columna por feature.
- Idealmente una columna de timestamp si estás haciendo modelado temporal.

Ejemplo 

| customer\_id | timestamp  | avg\_purchase | churn\_score |
| ------------ | ---------- | ------------- | ------------ |
| 12345        | 2024-06-01 | 120.5         | 0.33         |

##  5. Validación automática de esquemas
Al escribir en la tabla, Databricks valida que el esquema del DataFrame coincida con el esquema de la tabla.

Si no coincide y el modo es "merge" o "append", lanza error.

Puedes cambiar el esquema solo si usas "overwrite".

## 6. Buenas prácticas
- No sobreescribas tablas si otros equipos las usan.
- Usa "merge" para mantener un histórico sin perder datos.
- Versiona tus features si cambian los cálculos o la lógica.

## 7. Ejemplo completo


In [0]:
from databricks.feature_store import FeatureStoreClient

fs = FeatureStoreClient()

# Supongamos que ya existe la tabla "customer_features"
fs.write_table(
    name="main.ml_catalog.features.customer_features",
    df=customer_features_df,
    mode="merge"
)


#Train a model with features from a feature store table.


## 1. ¿Por qué usar la Feature Store para entrenar?
- Reutilización de features: Evita duplicación de lógica de ingeniería de variables.
- Trazabilidad total: Puedes saber qué features usó cada modelo.
- Consistencia online-offline: Reduce el riesgo de skew en inferencia.
- Auditoría: Registra automáticamente el origen de las características usadas.


## 2. Flujo general para entrenar un modelo desde la Feature Store

In [0]:
from databricks.feature_store import FeatureStoreClient

fs = FeatureStoreClient()

training_set = fs.create_training_set(
    df=raw_data_df,
    feature_lookups=[
        FeatureLookup(
            table_name="main.catalog_name.feature_table_name",
            lookup_key="id_col",
            feature_names=["feature1", "feature2"]
        )
    ],
    label="target_col",
    exclude_columns=["id_col"],
    lookback_window=None,
)

training_df = training_set.load_df()


## 3. Entrenamiento con un modelo
Una vez cargado training_df, puedes entrenar tu modelo con cualquier framework:

In [0]:
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier()
model.fit(training_df.drop(columns="target_col"), training_df["target_col"])


También puedes usar MLflow para loggear el modelo y asociar los features utilizados:

In [0]:
import mlflow

with mlflow.start_run():
    model.fit(...)
    fs.log_model(
        model=model,
        artifact_path="model",
        flavor=mlflow.sklearn,
        training_set=training_set,
        registered_model_name="mi_modelo_uc"
    )


## 4. Consideraciones técnicas

Puedes hacer lookup a múltiples feature tables.

La columna lookup_key debe estar en tu raw_data_df.

create_training_set también acepta filtros (timestamp_lookup_key, lookback_window, etc.) para datos temporales.



## 📌 Puntos claves
### Memoriza esto para el examen:

| Concepto                | Detalle                                                         |
| ----------------------- | --------------------------------------------------------------- |
| `FeatureStoreClient()`  | Cliente para interactuar con feature store                      |
| `create_training_set()` | Crea el conjunto de entrenamiento uniendo features con raw data |
| `FeatureLookup()`       | Define cómo buscar los features                                 |
| `log_model()`           | Guarda el modelo y su dependencia con la feature store          |
| Beneficios              | Reutilización, auditabilidad, consistencia y trazabilidad       |

# Score a model using features from a feature store table.


## ¿Qué significa "score a model using features from a feature store table"?
Es el proceso de cargar un modelo registrado con la Feature Store, y usarlo para hacer predicciones sobre nuevos datos, combinando estos datos con las características registradas en la Feature Store.

## Flujo general de scoring (inferencia)
Tienes un modelo entrenado con FeatureStoreClient.log_model(...).

Quieres hacer predicciones con datos nuevos (raw_input_df).

Usas fs.score_batch(...) para obtener las predicciones, utilizando los features ya registrados.

## Paso a paso con ejemplo

In [0]:
from databricks.feature_store import FeatureStoreClient

# 1. Crear el cliente
fs = FeatureStoreClient()

# 2. Preparar los datos nuevos para hacer scoring
raw_input_df = spark.read.table("default.nuevos_datos")

# 3. Scoring usando el modelo y las features
predicciones = fs.score_batch(
    model_uri="models:/nombre_modelo/1",
    df=raw_input_df
)


✅ model_uri puede ser una versión específica (models:/modelo/1) o el último (models:/modelo/latest).

## ✅ ¿Qué hace internamente score_batch?
Une tu raw_input_df con las feature tables usadas durante el entrenamiento.

Aplica las mismas transformaciones de features que se usaron para entrenar el modelo.

Devuelve un nuevo DataFrame con las predicciones.

## ⚠️ Requisitos importantes

| Requisito                   | Detalle                                                                                                                      |
| --------------------------- | ---------------------------------------------------------------------------------------------------------------------------- |
| Modelo registrado           | Debe estar registrado con `fs.log_model(...)`, incluyendo su `training_set`.                                                 |
| Columnas de lookup          | `raw_input_df` debe tener las claves necesarias para hacer join con las feature tables.                                      |
| No puedes usar sklearn puro | `score_batch()` funciona con modelos registrados mediante Feature Store, no con modelos sklearn que registraste manualmente. |

## 🧠 Memoriza esto para el examen

| Elemento clave       | Descripción                                                                                 |
| -------------------- | ------------------------------------------------------------------------------------------- |
| `score_batch()`      | Usa modelo y Feature Store para generar predicciones                                        |
| `model_uri`          | Ruta al modelo en el registry (`models:/mi_modelo/1`)                                       |
| `df`                 | DataFrame con claves para lookup de features                                                |
| Requiere `log_model` | Solo funciona si el modelo se registró con `fs.log_model()` y tiene `training_set` asociado |


# Describe the differences between online and offline feature tables

## 🔍 Diferencias entre tablas de características online y offline

| Característica                                    | **Feature Tables Offline**                              | **Feature Tables Online**                                 |
| ------------------------------------------------- | ------------------------------------------------------- | --------------------------------------------------------- |
| **Uso principal**                                 | Entrenamiento y batch scoring (predicciones por lotes)  | Serving de modelos en tiempo real (predicciones online)   |
| **Velocidad de acceso**                           | Más lento (no optimizado para baja latencia)            | Muy rápido (optimizado para baja latencia)                |
| **Frecuencia de actualización**                   | Menos frecuente, programado (por lotes)                 | Frecuente, a menudo en tiempo real o casi en tiempo real  |
| **Dónde se almacena**                             | Delta Lake (almacenamiento en la nube)                  | Tiendas de baja latencia (ej. Redis, Cassandra, etc.)     |
| **Integración con Databricks Feature Store**      | Totalmente soportado para entrenamiento y batch scoring | Necesita configuración adicional para online serving      |
| **Casos de uso**                                  | - Entrenar modelos<br>- Validación<br>- Batch scoring   | - Recomendaciones en tiempo real<br>- Detección de fraude |
| **Versionamiento de características**             | Sí, se versionan automáticamente                        | No necesariamente, puede depender del sistema externo     |
| **Consistencia de datos (training/serving skew)** | Posibilidad de **skew** si no se sincronizan bien       | Reduce el skew si se gestiona correctamente               |


## 📌 Puntos claves

- Offline = Entrenamiento, Online = Serving en tiempo real.

- Las tablas offline están en Delta Lake, las online en almacenes de baja latencia.

- Las tablas online ayudan a minimizar el training/serving skew si se mantienen sincronizadas.

- Usar ambas puede ser necesario para una solución de MLOps completa: entrenas con offline, sirves con online.

- Databricks Feature Store integra nativamente el uso de offline tables, y puede configurarse para servir online features mediante otros servicios.

# Identify the best run using the MLflow Client API.

## ✅ Enfoque con la API MLflow
1. Usando mlflow.search_runs()
Este método es fácil de usar y devuelve un pandas DataFrame con todos los runs de un experimento. Luego puedes ordenar y filtrar según métrica.

In [0]:
import mlflow

runs = mlflow.search_runs(experiment_ids=[exp_id])
best = runs.sort_values("metrics.accuracy", ascending=False).iloc[0]
best_run_id = best.run_id


Este enfoque funciona bien si estás usando MLflow en Databricks y quieres obtener rápidamente el run con la métrica más alta.
mlflow.org
Databricks

## 2. Usando el cliente de bajo nivel MlflowClient.search_runs()
Es útil cuando necesitas más control o paginación, pero puede requerir iterar páginas manualmente.
Preferible usar mlflow.search_runs() ya que devuelve todos los resultados directamente.

## 📌 Ejemplo completo en un notebook de Databricks

In [0]:
import mlflow
from mlflow.tracking.client import MlflowClient

# Si solo conoces el nombre del experimento
exp = MlflowClient().get_experiment_by_name(experiment_name)
exp_id = exp.experiment_id

# Extraer todos los runs del experimento
runs = mlflow.search_runs(experiment_ids=[exp_id])

# Encontrar el mejor run según la métrica deseada
best = runs.sort_values("metrics.f1_score", ascending=False).iloc[0]
best_run_id = best.run_id
best_metric = best["metrics.f1_score"]


## 📌 Puntos claves

| Elemento                                            | Uso                                                    |
| --------------------------------------------------- | ------------------------------------------------------ |
| `mlflow.search_runs(...)`                           | Devuelve todos los runs como pandas DataFrame.         |
| `.sort_values("metrics.<nombre>", ascending=False)` | Ordena para encontrar el mejor run según la métrica.   |
| `.iloc[0]`                                          | Selecciona el top 1.                                   |
| `MlflowClient().search_runs()`                      | Variante de bajo nivel, requiere manejo de paginación. |
| Métrica clave (accuracy, f1\_score, rmse, etc.)     | Define qué “mejor run” buscas.                         |
| Paciencia con paginación si hay muchos runs         | `mlflow.search_runs()` maneja mejor paginación.        |


# Manually log metrics, artifacts, and models in an MLflow Run.

## ✅ ¿Qué es un MLflow Run?
Es una ejecución registrada dentro de MLflow que guarda información sobre un experimento: métricas, parámetros, artefactos (como modelos o gráficos), etc.

## 📌 Puntos claves

| Elemento             | Método en MLflow                                                            | Descripción breve                                        |
| -------------------- | --------------------------------------------------------------------------- | -------------------------------------------------------- |
| Iniciar un run       | `mlflow.start_run()`                                                        | Inicia un bloque de ejecución para registrar información |
| Registrar parámetros | `mlflow.log_param("param", value)`                                          | Guarda hiperparámetros                                   |
| Registrar métricas   | `mlflow.log_metric("metric", value)`                                        | Guarda valores de rendimiento (accuracy, RMSE, etc.)     |
| Registrar artefactos | `mlflow.log_artifact("path")`                                               | Guarda archivos generados (imágenes, logs, etc.)         |
| Registrar modelos    | `mlflow.sklearn.log_model()`                                                | Guarda el modelo entrenado en formato serializable       |
| Finalizar run        | Automáticamente al salir del bloque `with`, o manual con `mlflow.end_run()` |       

## 💡 Ejemplo práctico (en Databricks con scikit-learn)                                                   |


In [0]:
import mlflow
import mlflow.sklearn
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# Datos
X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y)

# Entrenar modelo
model = RandomForestClassifier(n_estimators=100)
model.fit(X_train, y_train)

# Métricas
accuracy = model.score(X_test, y_test)

# Run MLflow
with mlflow.start_run(run_name="iris_rf_model") as run:
    mlflow.log_param("n_estimators", 100)
    mlflow.log_metric("accuracy", accuracy)
    
    # Guardar modelo
    mlflow.sklearn.log_model(model, "model")
    
    # Guardar artefacto adicional (si existiera, por ejemplo una imagen)
    # mlflow.log_artifact("path_to_file")

    print(f"Run ID: {run.info.run_id}")

## 🧠 ¿Qué debes dominar?
- El uso de log_param, log_metric, log_artifact, y log_model.

- Saber que log_artifact espera un archivo en disco, no un objeto.

- Reconocer que los runs se agrupan en experimentos (mlflow.set_experiment("nombre")).

- Puedes usar el MLflow UI para visualizar el run, el modelo y los resultados.

# Identify information available in the MLFlow UI

## ✅ 1. Información disponible en la MLflow UI
La interfaz gráfica de MLflow en Databricks o en instalaciones propias te permite rastrear y visualizar múltiples aspectos de tus experimentos. Estos son los elementos que puedes identificar desde la UI:

## 🧪 Experimentos (Experiments)
Un experimento agrupa múltiples ejecuciones (runs).

Se pueden crear desde el UI, notebook o código.

Desde la pestaña de Experimentos, puedes:

Filtrar ejecuciones por nombre, parámetro, métrica, etiqueta, etc.

Comparar múltiples ejecuciones lado a lado.

## 🔁 Ejecuciones (Runs)
Cada ejecución representa una instancia de entrenamiento o prueba de un modelo.

| Categoría                    | Elementos disponibles en UI                                                       |
| ---------------------------- | --------------------------------------------------------------------------------- |
| **Parametros** (`params`)    | Hiperparámetros usados en el modelo. Ejemplo: `max_depth=3`, `learning_rate=0.01` |
| **Métricas** (`metrics`)     | Resultados cuantitativos, como `accuracy`, `rmse`, `log_loss`, etc.               |
| **Artefactos** (`artifacts`) | Archivos generados: modelo entrenado, gráficos, CSVs, visualizaciones, etc.       |
| **Etiquetas** (`tags`)       | Información adicional como autor, versión del dataset, tipo de modelo.            |


## 📦 Modelos (Registered Models)
Puedes ver los modelos registrados y sus versiones.

Incluye:

Detalles del modelo (nombre, descripción).

Historial de versiones.

Estado del modelo: Staging, Production, Archived.

## 📈 Visualización de métricas
Puedes ver cómo cambia una métrica (ej. accuracy) a través de múltiples ejecuciones.

Herramientas:

Gráficas de dispersión.

Filtrado por condiciones (ej. learning_rate > 0.01).

Comparaciones entre ejecuciones.

## 🔄 Comparación de ejecuciones
Selecciona múltiples ejecuciones y usa la herramienta Compare.

Te permite:

Comparar métricas y parámetros.

Identificar cuál ejecución tiene mejor desempeño.

## ⏳ Tiempos
Fecha y hora de inicio y fin de la ejecución.

Duración total.

## 📌 Puntos claves

| Elemento       | Qué debes recordar                                                                         |
| -------------- | ------------------------------------------------------------------------------------------ |
| `params`       | Hiperparámetros del modelo                                                                 |
| `metrics`      | Indicadores de desempeño (ej. accuracy)                                                    |
| `artifacts`    | Archivos generados (modelo, visualizaciones)                                               |
| `tags`         | Información adicional, como nombre del experimento                                         |
| UI te permite  | Comparar ejecuciones, ver gráficas, registrar modelos                                      |
| Model Registry | Donde se gestionan versiones de modelos y se les asignan estados (`Staging`, `Production`) |


# Register a model using the MLflow Client API in the Unity Catalog registry

Cuando entrenas un modelo y haces mlflow.log_model(...), ese modelo queda en los artifacts del experimento. Pero si quieres que el modelo:

- tenga versiones controladas
- puedas asignarle stage (Staging, Production, Archived)
- puedas usar aliases como "champion" o "shadow"
- lo encuentres fácilmente desde otro workspace o usuario

… entonces debes registrarlo en el Model Registry de Unity Catalog, usando MLflowClient().


**Pasos con MLflowClient() para registrar un modelo en UC**

- Paso 1: Instanciar el cliente
- Paso 2: Registrar el modelo

Debes tener ya un modelo loggeado (con mlflow.log_model()) para poder registrarlo.

In [0]:
from mlflow.tracking import MlflowClient
client = MlflowClient()

model_uri = "runs:/<run_id>/model"
client.create_registered_model(name="main.ml_models.churn_model")
client.create_model_version(
    name="main.ml_models.churn_model",
    source=model_uri,
    run_id="<run_id>"
)



**Alternativa usando mlflow.register_model**

En código menos flexible, también puedes usar. Este método hace internamente el create_registered_model y create_model_version.

In [0]:
import mlflow
mlflow.register_model(
    model_uri="runs:/<run_id>/model",
    name="main.ml_models.churn_model"
)


## 📌 Puntos claves

1. Nombre del modelo → Formato obligatorio

❗ Si estás usando Unity Catalog (UC), el nombre del modelo debe ser:

`"catalog_name.schema_name.model_name"`

Si usas solo "customer_churn_model", estarías registrando en el Model Registry local del workspace, no en Unity Catalog → pregunta trampa muy común.


| Tema                          | Pregunta típica                                                                                             | Tip para elegir bien                                                                       |
| ----------------------------- | ----------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------ |
| ❌ Error por nombre inválido   | ¿Qué causa este error al registrar el modelo?<br>→ Opción correcta: "El nombre no incluye catalog y schema" | Siempre asegúrate de usar el nombre **completo** con `catalog.schema.name`                 |
| 🆚 Workspace vs Unity Catalog | ¿Qué ventaja tiene registrar el modelo en Unity Catalog?                                                    | Permite usar **model aliases**, compartir entre **workspaces**, aplicar **permisos finos** |
| 🔁 Modelos existentes         | ¿Qué pasa si llamas `create_registered_model` y ya existe?                                                  | Lanza error → debes verificar existencia con `client.get_registered_model(name)`           |


# Identify benefits of registering models in the Unity Catalog registry over the workspace registry

**¿Qué es cada uno?**
| Registro de Modelos        | Descripción breve                                                                                                                                     |
| -------------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------- |
| **Workspace Registry**     | Registro tradicional, local a un solo workspace. Modelos accesibles **solo desde ese workspace**.                                                     |
| **Unity Catalog Registry** | Registro moderno, centralizado. Modelos registrados en UC son accesibles desde **cualquier workspace** del metastore y usan **gobernanza unificada**. |

**Beneficios claves del Unity Catalog Registry sobre el Workspace Registry**

Aquí están los beneficios que sí aparecen en las opciones correctas del examen:

| Beneficio                                                  | Descripción                                                                                                                       | ¿Por qué importa para el examen?                                                                                   |
| ---------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------ |
| ✅ **Acceso cross-workspace**                               | Los modelos en UC pueden ser accedidos desde cualquier workspace que esté asociado al mismo metastore de Unity Catalog.           | Es una de las diferencias más preguntadas.                                                                         |
| ✅ **Control de acceso fino (Fine-grained access control)** | Puedes definir **quién puede ver, modificar, ejecutar, o borrar** un modelo usando Unity Catalog y permisos por rol/grupo.        | Esto **no es posible** con el registry tradicional.                                                                |
| ✅ **Soporte para aliases (`champion`, `shadow`, etc.)**    | Solo en Unity Catalog puedes usar **model aliases**, lo cual es clave para prácticas MLOps como A/B testing o shadow deployments. | Pregunta frecuente: “¿Cómo cambiar la versión que representa el modelo en producción sin cambiar código?” → Alias. |
| ✅ **Gobernanza unificada con Unity Catalog**               | Modelos, datos y notebooks pueden ser gobernados con **auditoría, lineage y etiquetas** unificadas.                               | Asociado a prácticas de ML compliance y auditoría.                                                                 |
| ✅ **Integración con CI/CD multientorno**                   | Puedes registrar modelos una sola vez y consumirlos desde distintos workspaces en entornos Dev/Test/Prod.                         | Fundamental para pipelines ML empresariales.                                                                       |


**Limitaciones del Workspace Registry (por contraste)**
| Limitación                                                 | Consecuencia                                                                  |
| ---------------------------------------------------------- | ----------------------------------------------------------------------------- |
| ❌ No permite compartir modelos entre workspaces            | Si tienes múltiples entornos o equipos, tendrías que duplicar modelos         |
| ❌ No puedes usar aliases                                   | Siempre debes especificar la versión exacta, lo que hace más frágil tu código |
| ❌ No puedes aplicar permisos detallados                    | Solo puedes restringir por workspace, no por modelo o acción                  |
| ❌ No se integra con Unity Catalog para lineage y auditoría | Menor trazabilidad, difícil cumplir regulaciones de compliance                |


## 📌 Puntos claves

| Tipo               | Ejemplo de pregunta                                                                                | Opción correcta                               |
| ------------------ | -------------------------------------------------------------------------------------------------- | --------------------------------------------- |
| Conceptual directa | ¿Cuál es una ventaja del Unity Catalog registry sobre el registry del workspace?                   | “Permite compartir modelos entre workspaces”  |
| Casos de uso       | Tu equipo de producción necesita consumir un modelo entrenado en otro workspace. ¿Qué debes hacer? | “Registrar el modelo en Unity Catalog”        |
| Alias              | ¿Cómo cambiarías el modelo en producción sin editar código en múltiples notebooks?                 | “Usando aliases en el Unity Catalog registry” |


# Identify scenarios where promoting code is preferred over promoting models and vice versa

**¿Qué significa "promover"?**

En MLOps, promover = mover algo (modelo o código) a una etapa superior del ciclo de vida:

- de desarrollo → staging
- de staging → producción

Puedes promover:

- El modelo ya entrenado
- El código que entrena el modelo
- Y en cada caso, el comportamiento es diferent

Opción 1: Promover el modelo
➕ Cuándo es preferible

| Escenario                                                                           | ¿Por qué promover el modelo?                                           |
| ----------------------------------------------------------------------------------- | ---------------------------------------------------------------------- |
| 🧪 Ya lo entrenaste y validaste                                                     | El modelo pasó pruebas QA, metadatos de validación, métricas AUC, etc. |
| 🕵🏼 Es costoso o lento reentrenar                                                  | Evitas costos o variabilidad reentrenando                              |
| 🔐 Quieres garantizar reproducibilidad                                              | Ya tienes el `run_id`, modelo logueado, inputs definidos               |
| 🔄 Tienes un sistema de promoción manual con revisión de métricas                   | Promueves modelos solo si cumplen condiciones objetivas                |
| 🎯 Quieres asegurar que en producción se use exactamente **esa versión** del modelo | El hash, los pesos, todo es fijo                                       |


Opción 2: Promover el código
➕ Cuándo es preferible

| Escenario                                                           | ¿Por qué promover el código?                                 |
| ------------------------------------------------------------------- | ------------------------------------------------------------ |
| 📈 Tus datos cambian frecuentemente                                 | Reentrenas con los **últimos datos** en cada entorno         |
| 🔁 Quieres reentrenar automáticamente en Staging/Prod               | Tu pipeline se ejecuta al promover                           |
| 🧹 La lógica de entrenamiento cambia                                | Código es más estable que pesos de un modelo específico      |
| 🧪 Estás usando un workflow automatizado (DAG, Airflow, Jobs, etc.) | Promueves el código y cada entorno lo ejecuta en su contexto |
| 🧰 Necesitas auditar todo el proceso, no solo el output final       | CI/CD entrena desde cero para reproducibilidad completa      |


## 📌 Puntos claves

| Criterio                                     | Promover **Modelo**        | Promover **Código**           |
| -------------------------------------------- | -------------------------- | ----------------------------- |
| Mismo modelo exacto siempre                  | ✅ Sí                       | ❌ No                          |
| Usa datos más recientes                      | ❌ No                       | ✅ Sí                          |
| Mejores prácticas QA / revisión manual       | ✅ Sí                       | ❌ No necesariamente           |
| Apto para CI/CD con entrenamiento automático | ⚠️ No ideal                | ✅ Sí                          |
| Se necesita control completo del proceso     | ❌ No (modelo ya entrenado) | ✅ Sí (entrenas todo de nuevo) |


# Set or remove a tag for a model

**¿Qué es un tag en el Model Registry?**

Un tag es una etiqueta clave:valor que puedes aplicar a:
- Un modelo registrado (RegisteredModel)
- Una versión específica de un modelo (ModelVersion)

Se usa para agregar metadatos útiles y rastreables como:

- "framework": "sklearn"
- "evaluated_by": "QA_team"
- "env": "dev"

**¿Dónde se aplican los tags?**

| Tipo de tag       | Objeto                        | Método correspondiente       |
| ----------------- | ----------------------------- | ---------------------------- |
| Model Tag         | Modelo registrado             | `set_registered_model_tag()` |
| Model Version Tag | Versión específica del modelo | `set_model_version_tag()`    |


In [0]:
from mlflow.tracking import MlflowClient

client = MlflowClient()

# Para una versión del modelo
client.set_model_version_tag(
    name="main.ml_models.churn_model",
    version="3",
    key="framework",
    value="xgboost"
)

# Para el modelo registrado
client.set_registered_model_tag(
    name="main.ml_models.churn_model",
    key="team",
    value="fraud_detection"
)


In [0]:
############### Cómo eliminar un tag ###############

# Para una versión
client.delete_model_version_tag(
    name="main.ml_models.churn_model",
    version="3",
    key="framework"
)

# Para el modelo registrado
client.delete_registered_model_tag(
    name="main.ml_models.churn_model",
    key="team"
)


## 📌 Puntos claves

**Nota de examen:** Si el modelo está en Unity Catalog, el name debe incluir el path completo:
`catalog.schema.model_name`
Ejemplo: "main.ml_models.sales_model"

**Para qué se usan los tags?**

- Documentar modelos: "status": "QA_approved"
- Automatizar decisiones en pipelines:
  → Si "eval_score" > 0.85, promover a "Staging"
- Auditabilidad y trazabilidad
- Identificación de versiones con características específicas

# Promote a challenger model to a champion model using aliases

**Qué significa esto?**

En MLOps, un modelo challenger es una nueva versión candidata que compite con el modelo actual en producción (el champion).
Si el challenger demuestra mejor rendimiento, se promueve y se convierte en el nuevo champion.

🔁 Promover = asignar el alias champion al nuevo modelo

En Unity Catalog, esto se hace usando aliases del MLflow Model Registry.

**¿Qué son los aliases en MLflow?**

Los aliases son nombres simbólicos que puedes asignar a una versión de modelo registrada en Unity Catalog.
Ejemplos comunes:

- champion → versión actual en producción
- challenger → nueva versión que estás evaluando
- shadow, baseline, latest, etc.

**Cómo se usan los aliases en MLflow**

In [0]:
from mlflow.tracking import MlflowClient

client = MlflowClient()

# Promover la versión 5 a 'champion'
client.set_registered_model_alias(
    name="main.ml_models.churn_model",
    alias="champion",
    version="5"
)

# Esto:

#Elimina el alias champion de la versión anterior
#Asigna champion a la versión 5 (el nuevo modelo promovido)


**Flujo completo de promoción**

1. Tienes un modelo en Unity Catalog con:

- version 4: alias = champion
- version 5: alias = challenger

2. Evalúas que version 5 supera a version 4

Ejecutas:

`client.set_registered_model_alias(
    name="main.ml_models.customer_churn",
    alias="champion",
    version="5"
)`


4. Resultado:

- version 5 es el nuevo champion
- version 4 ya no tiene alias

## 📌 Puntos claves

**Beneficio clave de los aliases**

En vez de usar código como:

`model_uri = "models:/main.ml_models.customer_churn/5"`

Puedes usar:

`model_uri = "models:/main.ml_models.customer_churn@champion"`

Esto permite cambiar la versión del modelo sin modificar tu código.