# MLOPs ZoomCamp

---

MLOPs: conjunto de `best practices` para poner ML en produccion

Usaremos como ejemplo:

* Predecir la duracion de un viaje (Uber, Didi)

<div style="text-align: center">
  <img src="../00-notes/assets/00-taxi.png" alt="Returns Histograms" style="display: inline-block; max-width: 500px; margin: 0 auto"> 
</div>

Etapas de un proyecto ML:

1. Diseño -- Realmente necesitamos ML?

2. Entrenamiento -- Entrenamos el modelo, tratamos de encontrar el mejor modelo

3. Operaciones -- Desplegamos el modelo a un servicio web 

MLOPs ayuda en todas las etapas del proceso. Reproducir resultados, reentrenar en un clic, desplegar y monitorear el performance.

Es un conjunto de prácticas para automatizar todo el proceso y trabajar en conjunto.

## [Mejorando la estructura del notebook](https://www.youtube.com/watch?v=teP9KWkP6SM&list=PL3MmuxUbc_hIUISrluw_A7wDSmfOhErJK&index=6)
---

[Notebook](../01-intro/duration-prediction.ipynb)

Identificamos 3 etapas:

1. Cargar y preprocesar los datos

2. Vectorizarlos

3. Entrenar y evaluar metricas

<div style="text-align: center">
  <img src="../00-notes/assets/steps.png" alt="Returns Histograms" style="display: inline-block; max-width: 500px; margin: 0 auto"> 
</div>

Veremos como preparar un pipeline que sea facil de reutilizar con un comando por ejemplo

`python pipeline.py --train-data "" --validation-data ""`

Veremos herramientas como: `Prefect` y `Kubeflow` para convertir los notebooks en pipelines.

El output del pipeline es un modelo, el cual tiene que ser desplegado a un servicio web.

Una vez que el modelo esta desplegado agregaremos `Monitoreo` para saber como se esta comportando y medir su desempeño.

Cuando veamos una caída en el `desempeño` del modelo, se emitirá una alerta al equipo para que revisen que está sucediendo y arreglarlo.

En el mas alto nivel de automatización, una alerta en performance automáticamente ejecutara el reentrenamiento del modelo.

Este es el nivel más alto de automatización que podemos tener en pipelines de ML.

Este nivel necesita que el sistema se encuentre en un estado de madurez avanzado, hay diferentes niveles de madurez.

* Nivel 0: No hay mlops.


* Nivel 4: todo está automatizado.



## [El modelo de madurez de mlops](https://www.youtube.com/watch?v=XwTH8BDGzYk&list=PL3MmuxUbc_hIUISrluw_A7wDSmfOhErJK&index=7)

---

[Artículo de MSFT al respecto](https://learn.microsoft.com/en-us/azure/architecture/ai-ml/guide/mlops-maturity-model)


`Nivel 0: NO HAY MLOPs. `

* Notebooks sin pipelines.

* No hay registros de experimentos.

* No hay registros de parámetros. 

* Todo el código se encuentra en notebooks desordenados. 

* CDDD trabaja solo, no son parte de un equipo, entrega su notebook a los ING y estos se encargan de desplegar.

* `IDEAL PARA POC`

<div style="text-align: center">
  <img src="../00-notes/assets/01-lvl0.png" alt="Returns Histograms" style="display: inline-block; max-width: 500px; margin: 0 auto"> 
</div>

`Nivel 1: DevOps, pero NO MLOPs. Existe un nivel de automatización, hay desarrolladores experimentados apoyando a los CDDD a implementar las mejores practivas de DevOps.`

* Los releases se encuentran automatizados, es posible desplegar un modelo de la misma manera que se despliega un servicio web en ingenieria de software tradicional.

* Existen `unit tests`, `integration tests`, `ci/cd`, `OPs Metrics`. (requests/second, errors, etc)

* Pero estos sistemas no estan conscientes de los modelos de ML.

* No hay reproducibilidad de modelos.

* No hay registro de experimentacion.

* DS separados de los ingenieros.

<div style="text-align: center">
  <img src="../00-notes/assets/02-lvl1.png" alt="Returns Histograms" style="display: inline-block; max-width: 500px; margin: 0 auto"> 
</div>

`En este nivel de madurez, despliegas el modelo, funciona bien y no necesariamente necesitas llegar al siguiente nivel.`

`Nivel 2: Entrenamientos automatizados `

* Pipeline de entrenamiento, anque suene complejo y solo sea un `train.py`.

* Hay registro de la experimentacion.

* Hay registro de los modelos. (Existen multiples modelos en produccion, lo que hace que sea razonable invertir en infraestructura de automatizacion)

* Baja friccion en despliegues.

* Si solo hay 1 o 2 modelos en producción quizás no tiene sentido llegar a este nivel.

<div style="text-align: center">
  <img src="../00-notes/assets/03-lvl2.png" alt="Returns Histograms" style="display: inline-block; max-width: 500px; margin: 0 auto"> 
</div>

`Nivel 3: Despliegue Automatizado`


* No se necesita a un humano para desplegar un modelo, o es súper fácil desplegar modelos.

* Existen A/B tests.

* Modelos se monitorean como parte del proceso de despliegue.

`Nivel 4: Automatización completa de MLOPs`

* Entrenamiento, Reentrenamiento y Despliegue Automatizados.

* Observamos un modelo, notamos que el desempeño empeora, reentrenamos un nuevo modelo, comparamos A/B y lo desplegamos a todos los usuarios.

<div style="text-align: center">
  <img src="../00-notes/assets/04-lvl3.png" alt="Returns Histograms" style="display: inline-block; max-width: 500px; margin: 0 auto"> 
</div>


### Cuando necesitamos estar en qué nivel?
---

Si es el primer proyecto de ML, o es un POC no es necesario estar en la etapa 4.

Una vez que el modelo sale de POC y se quiere despelgar. Hay que seguir buenas prácticas de ingeniería (DevOps). Tener unit tests, saber que se soporta la carga, saber que está pasando con el servicio `Ops Metrics`.

A medida que hay más casos de uso de ML en producción se comienza a invertir en pasar a los niveles 3 y 4.

Incluso en una organización con miles de modelos en producción no se necesita que todos estén en el nivel 4.

Para algunos casos de uso incluso es riesgoso automatizar la salida a producción de un nuevo modelo.

* Hay que ser prágmatico y usar lo que se necesita

## Instalar el ambiente de trabajo
---

Recomendado usar Github Codespaces y la conexión con VS Code local

## 2 - Seguimiento de experimentos

---

* Experimento de ML: el proceso de construir un modelo de ML

* Corrida experimental:

Es el proceso de llevar un registro de toda la informacion relevante de un experimento de ML.

Incluye:

* Codigo fuente

* Ambiente

* Datos

* Modelo

* Hiperparametrox

* Metricas

### Por que es importante?

* Reproducibilidad

* Organizacion

* Optimizacion

* Automatizacion

Un ejemplo de un sistema de seguimiento de experimentos basico puede ser una hoja de calculo en excel que se usa para
registrar la informacion relevante sobre el entrenamiento.

## MLflow

Definicion: una plataforma opensource para el ciclo de vida del machine learning.
(todo el proceso de construir, desplegar y operar una solucion de ML)

Es un paquete de python `pip install mlflow`

Tiene 4 modulos: `Tracking, Models, Model Registry, Projects`

### Seguimiento de experimentos en MLflow

El modulo `Tracking` permite organizar el experimento en `corridas` y dar seguimiento a las siguientes entidades:


* Parameters: dataset version, etc..
 
* Metrics: accuracy, r1 en train, val y test
 
* Metadata: tags
 
* Artifacts: objetos de python usados para el entrenamiento, 
 
* Models: Modelos de ML

Automaticamente da seguimiento a :

* Codigo fuente (git commit)

* Version del codigo fuente

* Hora de inicio y termino

* Nombre del autor

In [1]:
# iniciando con mlfow
# !pip install mlflow==2.13.0
import mlflow 
mlflow.__version__

'2.13.0'

Ejecutando MLflow desde bash con backend en sqlite

```bash
mlflow ui --backend-store-uri sqlite:///mlflow.db
```