In [1]:
import os
import pickle
import warnings
from datetime import datetime

import matplotlib.pyplot as plt
import mlflow
import numpy as np
import pandas as pd
import seaborn as sns
import xgboost
from sklearn.feature_extraction import DictVectorizer
from sklearn.linear_model import Lasso, LinearRegression, Ridge
from sklearn.metrics import recall_score


MLFLOW_TRACKING_URI = "sqlite:///mlflow.db"
warnings.filterwarnings("ignore")


* 'schema_extra' has been renamed to 'json_schema_extra'


Ahora lo que vamos a hacer es ir a la UI y simulemos que algún cientifico de datos o miembro del equipo decide registrar ciertos podemos en "staging", y más adelante nosotros como ingenieros de ML tomamos la decisión de cual modelo registrar para producción bajo las métricas de performance obtenidas y las pruebas. Es muy importante, hacer las pruebas de validación antes de considerar un modelo en producción. Entre ellas se encuentran:

#### 1. Pruebas de Funcionalidad:

* Funcionalidad del Modelo: Asegurarse de que el modelo funcione correctamente en el entorno de producción con los datos reales (Se puede simular con cierta parte de la data o toda idealmente).
* Integración del Modelo: Verificar que el modelo integrado en la infraestructura de producción responda y se comunique adecuadamente con otros componentes del sistema (partes del Pipeline).

####  2. Pruebas de Rendimiento:
* Rendimiento del Modelo: Evaluar el rendimiento del modelo en términos de velocidad de inferencia, uso de recursos (CPU, memoria), y latencia para garantizar que cumple con los requisitos de producción. (El tiempo es un factor muy importante en la generación de soluciones de negocio)
* Escala y Carga: Probar el modelo bajo cargas esperadas para asegurar que el sistema es escalable y puede manejar la demanda prevista. (Orar para que el Kernel no muera con la carga, de lo contrario mirar formas de optimizar el código, hacer carga de datos por chuncks, paralelizar procesos, etc)

#### 3. Pruebas de Robustez:
* Robustez de estrés: Evaluar el comportamiento del modelo en condiciones adversas, como datos de entrada no esperados, valores faltantes, valores atípicos, etc. (Esto es muy importante, ya que en la vida real los datos no son perfectos, y es muy probable que el modelo se caiga si no se tiene en cuenta este factor por lo que generar pruebas unitarias para este tipo de casos es muy importante). 


### Making predictions from mlflow artifacts

Predict on Pandas DataFrame: Para ello debemos tener la misma representación de datos que hemos usado para entrenar el modelo, es decir, las mismas columnas y el mismo orden. Por lo que vamos a usar un par de funciones que hemos venido implementando. 

In [2]:
def load_pickle(filename):
    """ 
    This function loads a pickle file from the data_processed folder
    and returns the data
    Args:
        filename (str): name of the file to load
    Returns:
        data (pd.DataFrame): data loaded from the pickle file
    """
    filepath = os.path.join("data", "data_processed", f"{filename}.pkl")
    with open(filepath, 'rb') as file:
        data = pickle.load(file)
    return data

In [3]:
X_train, y_train = load_pickle("train")
X_test, y_test = load_pickle("test")

In [4]:
y_train.shape

(13269,)

In [5]:
X_train.toarray().shape

(13269, 13692)

In [6]:
assert X_train.toarray().shape[0] == y_train.shape[0]

In [7]:
# Establecer la URI de tracking
mlflow.set_tracking_uri(MLFLOW_TRACKING_URI)

# Ahora puedes cargar tu modelo
#logged_model = './mlruns/1/e1aedba8c8ea485c91f81b8b124c269f/artifacts/models/LogisticRegression'
logged_model ='runs:/8a14c09afb674e45a5e4fa946ef80807/models/LogisticRegressionCVSmote'
loaded_model = mlflow.pyfunc.load_model(logged_model)

In [8]:
# get info from the loaded model
loaded_model

mlflow.pyfunc.loaded_model:
  artifact_path: models/LogisticRegressionCVSmote
  flavor: mlflow.sklearn
  run_id: 8a14c09afb674e45a5e4fa946ef80807

In [9]:
lr_model = mlflow.sklearn.load_model(logged_model)

In [10]:
lr_model.predict(X_test)

array(['0', '2', '2', ..., '0', '2', '2'], dtype=object)

## Model registry and state transitions

<p align="center">
  <img src="https://pbs.twimg.com/media/EoOBoWyWEAAA8In.jpg" width="400" style="display: block; margin: auto;">
</p>


* Tener en cuenta el tiempo de ejecución

* Métricas obtenidas

* Size del tamaño 

* Las pruebas que anteriormente mencionamos. 


In [11]:
from mlflow.tracking import MlflowClient

In [12]:

client = MlflowClient(tracking_uri=MLFLOW_TRACKING_URI)


In [13]:
runs = mlflow.search_runs()
# Extrae los IDs únicos de los experimentos
experiment_ids = runs['experiment_id'].unique()

In [14]:
experiment_ids

array([], dtype=float64)

In [16]:
runs = client.search_runs(experiment_ids=["1"])
for run in runs:
    print(run.info)


<RunInfo: artifact_uri='/Users/mdurango/Proyect/Mlops-platzi/tracking/mlruns/1/13704a5ce26c4f2baecd2907bc4ed7e6/artifacts', end_time=1708291482190, experiment_id='1', lifecycle_stage='active', run_id='13704a5ce26c4f2baecd2907bc4ed7e6', run_name='DecisionTreeClassifierCV', run_uuid='13704a5ce26c4f2baecd2907bc4ed7e6', start_time=1708291477187, status='FINISHED', user_id='mdurango'>
<RunInfo: artifact_uri='/Users/mdurango/Proyect/Mlops-platzi/tracking/mlruns/1/2c103643f9d4425688b843422a746ece/artifacts', end_time=1708291443884, experiment_id='1', lifecycle_stage='active', run_id='2c103643f9d4425688b843422a746ece', run_name='DecisionTreeClassifier', run_uuid='2c103643f9d4425688b843422a746ece', start_time=1708291439206, status='FINISHED', user_id='mdurango'>
<RunInfo: artifact_uri='/Users/mdurango/Proyect/Mlops-platzi/tracking/mlruns/1/6bb6e4aefc6a49ae87f0532d3b8b301f/artifacts', end_time=1708291437660, experiment_id='1', lifecycle_stage='active', run_id='6bb6e4aefc6a49ae87f0532d3b8b301f', 

In [17]:
runs= client.search_runs(
    experiment_ids='1',
    filter_string="", #se puede usar un tag en especial o algún parámetro de interés ej: 'tags.model = "lasso_regression" '
    run_view_type=mlflow.entities.ViewType.ACTIVE_ONLY,
    max_results=5,
    order_by=["metrics.recall_test ASC"]

)

In [18]:
for run in runs:
    print(f"run id: {run.info.run_id}, recall_test: {run.data.metrics['recall_test']}")

run id: 6d844875da0343ffa7629c0e90d28436, recall_test: 0.8401898734177216
run id: 32472b9cde6540088a02fb2e926fb473, recall_test: 0.8401898734177216
run id: ca51a49042dd4ba5b02eb2a3f05d1acf, recall_test: 0.8401898734177216
run id: 6f7badd0de7841c49f1a01d698c2270c, recall_test: 0.8401898734177216
run id: 8f3f9b7319e14e84befbb26f82c3b252, recall_test: 0.8401898734177216


### Promote a model

In [19]:
run_id = "6d844875da0343ffa7629c0e90d28436"
model_uri = f"runs:/{run_id}/model"
mlflow.register_model(model_uri, "classifier_model")

Registered model 'classifier_model' already exists. Creating a new version of this model...
Created version '2' of model 'classifier_model'.


<ModelVersion: aliases=[], creation_timestamp=1708293669498, current_stage='None', description=None, last_updated_timestamp=1708293669498, name='classifier_model', run_id='6d844875da0343ffa7629c0e90d28436', run_link=None, source='/Users/mdurango/Proyect/Mlops-platzi/tracking/mlruns/1/6d844875da0343ffa7629c0e90d28436/artifacts/model', status='READY', status_message=None, tags={}, user_id=None, version=2>

In [29]:
model_uri

'runs:/6d844875da0343ffa7629c0e90d28436/model'

In [20]:
model_name = "classifier_model"
latest_versions = client.get_latest_versions(name=model_name)
for version in latest_versions:
    print(f" version: {version.version} , actual stage: {version._current_stage}")

 version: 1 , actual stage: Production
 version: 2 , actual stage: None


In [21]:
client.transition_model_version_stage(
    name=model_name,
    version=1,
    stage="Production"
)

<ModelVersion: aliases=[], creation_timestamp=1708293221686, current_stage='Production', description='The model version 1 was transitioned to Production on 2024-02-18', last_updated_timestamp=1708293671864, name='classifier_model', run_id='6d844875da0343ffa7629c0e90d28436', run_link=None, source='/Users/mdurango/Proyect/Mlops-platzi/tracking/mlruns/1/6d844875da0343ffa7629c0e90d28436/artifacts/model', status='READY', status_message=None, tags={}, user_id=None, version=1>

In [22]:
client.transition_model_version_stage(
    name=model_name,
    version=1,
    stage="Production"
)

<ModelVersion: aliases=[], creation_timestamp=1708293221686, current_stage='Production', description='The model version 1 was transitioned to Production on 2024-02-18', last_updated_timestamp=1708293672595, name='classifier_model', run_id='6d844875da0343ffa7629c0e90d28436', run_link=None, source='/Users/mdurango/Proyect/Mlops-platzi/tracking/mlruns/1/6d844875da0343ffa7629c0e90d28436/artifacts/model', status='READY', status_message=None, tags={}, user_id=None, version=1>

Cuando vayas a cambiar el staging de un modelo a otro estado, podemos también añadir descripciones: 

In [23]:
client.update_model_version(
    name=model_name, 
    version=1,
    description=f"The model version {1} was transitioned to Production on {datetime.today().date()}"
)

<ModelVersion: aliases=[], creation_timestamp=1708293221686, current_stage='Production', description='The model version 1 was transitioned to Production on 2024-02-18', last_updated_timestamp=1708293673932, name='classifier_model', run_id='6d844875da0343ffa7629c0e90d28436', run_link=None, source='/Users/mdurango/Proyect/Mlops-platzi/tracking/mlruns/1/6d844875da0343ffa7629c0e90d28436/artifacts/model', status='READY', status_message=None, tags={}, user_id=None, version=1>

### Testing a register model: 

De esta forma se deben hacer las pruebas con el pipeline de producción para asegurar que el modelo se comporta como se espera, además de validar la infraestructura y las pruebas que recién habíamos mencionado. 

In [32]:
# OJO: Es importante que recuerdes los formatos permitidos por mlflow load_model, como dataframes, numpy arrays, etc.
def testint_model_from_mlflow(model_name: str, stage:str, X_test: xgboost.core.DMatrix, Y_test: np.ndarray):
    """this function tests a model from mlflow
    Args:
        model_name (str): name of the model
        stage (str): stage of the model
        X_test (scipy.sparse._csr.csr_matrix): test data
        Y_test (scipy.sparse._csr.csr_matrix): test target
    Returns:
        float: recall score of the model
    
    """
    model = mlflow.pyfunc.load_model(f"models:/{model_name}/{stage}")

    y_pred = model.predict(X_test)
    recall_pred = recall_score(Y_test, y_pred)
    return {"recall score": recall_pred}

In [33]:
%time
testint_model_from_mlflow(model_name= "classifier_model", stage="Production", X_test=X_test, Y_test=y_test)


CPU times: user 2 µs, sys: 0 ns, total: 2 µs
Wall time: 3.81 µs


OSError: No such file or directory: '/Users/mdurango/Proyect/Mlops-platzi/tracking/mlruns/1/6d844875da0343ffa7629c0e90d28436/artifacts/model/.'

#### Ventajas de MLflow:

* Gestión de Ciclo de Vida: Facilita el seguimiento de experimentos, versionado de modelos y reproducción de resultados.
* Interoperabilidad: Es compatible con múltiples frameworks de aprendizaje automático y se integra fácilmente en flujos de trabajo existentes.
* Abierto y Modular: Ofrece una arquitectura modular que permite la flexibilidad y personalización.
* Trazabilidad y Reproducibilidad: Registra métricas, parámetros y artefactos para reproducir modelos y resultados.
* Comunidad Activa: Amplia comunidad de usuarios y contribuciones continuas.


#### Desventajas de MLflow:
* Complejidad para Grandes Volúmenes de Datos: Puede enfrentar dificultades al manejar grandes volúmenes de datos o flujos de trabajo muy complejos.
* Curva de Aprendizaje: Requiere tiempo para familiarizarse con todas sus funcionalidades y componentes.
Limitaciones en Algunas Funcionalidades: Algunas funcionalidades pueden no ser tan avanzadas o flexibles como en otras herramientas especializadas.


### Alternativas a MLflow:
* TensorBoard: Enfoque específico para TensorFlow, útil para visualizar gráficamente métricas, grafos de modelos y más.
* DVC (Data Version Control): Se enfoca en versionado de datos y modelos, y gestión de experimentos.
* Comet.ml: Ofrece seguimiento de experimentos, colaboración y visualización de manera similar a MLflow.
* Weights & Biases: Ofrece seguimiento de experimentos, colaboración y visualización de manera similar a MLflow.


#### Conclusiones

* Podemos trackear metadata

* Registrar modelos

* Obtener los requirimientos del ambiente de desarrollo donde fue entrenado los modelos

* Podemos hacer un seguimiento de los modelos y compararlos de forma fácil y amigable con la interfaz de MLflow y en código

* Hacer transiciones de estados de los modelos

* Añadir anotaciones o descripciones 

So, ya sabes incluír el registro de modelos en nuestro pipeline de ML, ahora vamos a aprender de workflows y tasks. ¡Te espero en la próxima clase! :) 