# **Ciencia de Datos e Inteligencia Artificial para la industria del software**

# *Curso MLOps*

## **Edición 2023**

# 4. Despliegue de Modelos

El despliegue de modelos es el proceso de poner modelos de aprendizaje automático en producción. Esto pone las predicciones del modelo a disposición de los usuarios, desarrolladores o sistemas, para que puedan tomar decisiones comerciales basadas en datos, interactuar con su aplicación (como reconocer una cara en una imagen) y más.

El despliegue de modelos se considera una etapa desafiante para los científicos de datos. Esto se debe a que a menudo no se considera su responsabilidad principal y debido a las diferencias tecnológicas y de mentalidad entre el desarrollo y entrenamiento del modelo y la infraestructura tecnológica y organizativa, como la gestión de versiones, pruebas y escalabilidad, que hacen que el despliegue sea complicado. Estos silos organizativos y tecnológicos pueden superarse con los marcos, herramientas y procesos adecuados para el despliegue de modelos.

Una vez que tenemos nuestro modelo entrenado, es necesario llevarlo a producción. A continuación, exploraremos algunas formas de hacer este despliegue y aplicaremos un enfoque local.

## 4.1 Tres formas de desplegar un modelo

* Principalmente, existen dos tipos de despliegues:
    * Por lotes (offline) - se ejecuta regularmente
    * En línea - Siempre en funcionamiento con dos subopciones:
        * Servicio web
        * Streaming

**Por lotes - Offline:**

El despliegue offline o por lotes es una estrategia de despliegue utilizada en el contexto de modelos de aprendizaje automático, particularmente cuando se necesita realizar predicciones o inferencias en un conjunto de datos de gran tamaño, no en tiempo real o de forma asíncrona. Este enfoque se utiliza típicamente cuando la latencia de las predicciones en tiempo real no es una preocupación crítica y puede permitirse procesar datos por lotes.

* Se utiliza para casos de uso donde las actividades que admite no ocurren en tiempo real pero pueden agruparse.
    * Por ejemplo, si estoy enviando ofertas promocionales a los usuarios basadas en su probabilidad de abandono de mi servicio, puedo hacerlo diariamente.

Si podemos esperar un poco para obtener nuestras predicciones. Luego, predecimos periódicamente nuevos datos. Tenemos una base de datos y un trabajo de puntuación. El trabajo de puntuación extrae periódicamente datos de la base de datos y ejecuta el modelo en ellos. El resultado se guarda en una base de datos de predicciones.

**En línea - Servicio web:**

El despliegue en línea o como servicio web es una estrategia de despliegue para modelos de aprendizaje automático en la que el modelo se expone como un servicio web, lo que permite realizar predicciones o inferencias en tiempo real a través de llamadas a API (Interfaz de Programación de Aplicaciones). 
Este enfoque es particularmente útil cuando se requieren respuestas en tiempo real de baja latencia, como en aplicaciones como chatbots, sistemas de recomendación, detección de fraudes y más.

El modelo siempre está disponible para hacer predicciones. Hay dos formas de desplegar un modelo en línea:

**Servicio web:**
Esta relación produce una relación 1:1 entre el cliente (BackendService) y el servidor (DurationPredictionService), que se mantiene activa solo durante el tiempo que lleva procesar la solicitud.

**Streaming:**
En el caso de uso de streaming, el concepto se basa en el servicio web al desacoplar el cliente del servidor y establecer una relación de muchos a muchos entre los productores y consumidores.

## Aplicación de despliegue de un modelo como servicio web

* Creación de un **entorno virtual** con Pipenv
* Creación de un script para hacer predicciones
* Transformación del script en una **aplicación Flask**
* Empaquetamiento de la aplicación en **Docker**

A partir de un archivo .pkl, exportaremos el modelo como un servicio web.

### Entorno virtual

Un entorno virtual es una herramienta que ayuda a mantener separadas las dependencias requeridas por diferentes proyectos creando entornos virtuales de Python aislados para ellos. Esta es una de las herramientas más importantes que utilizan la mayoría de los desarrolladores de Python.

**¿Por qué necesitamos un entorno virtual?**

Imagina un escenario en el que estás trabajando en dos proyectos web en Python, uno de ellos utiliza Django 4.0 y el otro utiliza Django 4.1. En tales situaciones, el entorno virtual puede ser realmente útil para mantener las dependencias de ambos proyectos.

**Cuándo y dónde usar un entorno virtual?**

Por defecto, todos los proyectos en tu sistema utilizarán estos mismos directorios para almacenar y recuperar los paquetes del sitio (bibliotecas de terceros). ¿Por qué esto importa? Ahora, en el ejemplo anterior de dos proyectos, tienes dos versiones de Django. Este es un problema real para Python, ya que no puede diferenciar entre las versiones en el directorio de "site-packages". Aquí es donde entran en juego los entornos virtuales. Para resolver este problema, simplemente necesitamos crear dos entornos virtuales separados para ambos proyectos. Lo genial de esto es que no hay límites en la cantidad de entornos que puedes tener, ya que son solo directorios que contienen algunos scripts. Se debe utilizar un entorno virtual cada vez que trabajas en cualquier proyecto basado en Python. Por lo general, es bueno tener un nuevo entorno virtual para cada proyecto basado en Python en el que trabajes. De esta manera, las dependencias de cada proyecto están aisladas del sistema y de los demás.

**¿Cómo funciona un entorno virtual?**

Usamos un módulo llamado virtualenv, que es una herramienta para crear entornos Python aislados. virtualenv crea una carpeta que contiene todos los ejecutables necesarios para usar los paquetes que un proyecto de Python necesitaría.

### Flask

Flask es un marco web. Esto significa que Flask te proporciona herramientas, bibliotecas y tecnologías que te permiten construir una aplicación web. Esta aplicación web puede ser algunas páginas web, un blog, una wiki o puede ser tan grande como una aplicación de calendario basada en la web o un sitio web comercial.

Flask forma parte de la categoría de los micro marcos. Los micro marcos son normalmente marcos con pocas o ninguna dependencia de bibliotecas externas. Esto tiene pros y contras. Los pros son que el marco es ligero, hay pocas dependencias que actualizar y controlar en busca de errores de seguridad, los contras son que a veces tendrás que hacer más trabajo por ti mismo o aumentar la lista de dependencias agregando complementos. En el caso de Flask, sus dependencias son:

* Werkzeug, una biblioteca de utilidades WSGI.
* Jinja2, que es su motor de plantillas.

### Docker

Docker es una plataforma abierta para desarrollar, enviar y ejecutar aplicaciones. Docker te permite separar tus aplicaciones de tu infraestructura para que puedas entregar software rápidamente. Con Docker, puedes administrar tu infraestructura de la misma manera que administras tus aplicaciones. Al aprovechar las metodologías de Docker para enviar, probar y implementar código, puedes reducir significativamente el retraso entre escribir código y ejecutarlo en producción.

**La plataforma Docker**

Docker proporciona la capacidad de empacar y ejecutar una aplicación en un entorno aislado denominado contenedor. El aislamiento y la seguridad te permiten ejecutar muchos contenedores simultáneamente en un host determinado. Los contenedores son livianos y contienen todo lo necesario para ejecutar la aplicación, por lo que no es necesario depender de lo que esté instalado en el host. Puedes compartir contenedores mientras trabajas y estar seguro de que todos con los que compartes obtienen el mismo contenedor que funciona de la misma manera.

Docker proporciona herramientas y una plataforma para administrar el ciclo de vida de tus contenedores:

* Desarrolla tu aplicación y sus componentes de soporte utilizando contenedores.
* El contenedor se convierte en la unidad para distribuir y probar tu aplicación.
* Cuando estés listo, implementa tu aplicación en tu entorno de producción, ya sea como un contenedor o como un servicio orquestado. Esto funciona de la misma manera, ya sea que tu entorno de producción sea un centro de datos local, un proveedor de la nube o una combinación de ambos.

**¿Para qué puedo usar Docker?**

*Entrega rápida y consistente de tus aplicaciones*

Docker agiliza el ciclo de desarrollo al permitir que los desarrolladores trabajen en entornos estandarizados utilizando contenedores locales que proporcionan tus aplicaciones y servicios. Los contenedores son ideales para flujos de trabajo de integración continua y entrega continua (CI/CD).

Considera el siguiente escenario de ejemplo:

* Tus desarrolladores escriben código localmente y comparten su trabajo con sus colegas utilizando contenedores Docker.
* Utilizan Docker para implementar sus aplicaciones en un entorno de prueba y ejecutan pruebas automáticas y manuales.
* Cuando los desarrolladores encuentran errores, pueden corregirlos en el entorno de desarrollo y volver a implementarlos en el entorno de prueba para su prueba y validación.
* Una vez que la prueba esté completa, llevar la corrección al cliente es tan simple como enviar la imagen actualizada al entorno de producción.

**Implementación y escalado receptivos**

La plataforma basada en contenedores de Docker permite cargas de trabajo altamente portátiles. Los contenedores Docker pueden ejecutarse en el portátil de un desarrollador, en máquinas físicas o virtuales en un centro de datos, en proveedores de la nube o en una combinación de entornos.

La portabilidad y naturaleza ligera de Docker también facilitan la administración dinámica de cargas de trabajo, escalando aplicaciones y servicios hacia arriba o hacia abajo según lo requieran las necesidades comerciales, en tiempo casi real.

**Ejecutar más cargas de trabajo en el mismo hardware**

Docker es ligero y rápido. Proporciona una alternativa viable y rentable a las máquinas virtuales basadas en hipervisor, lo que te permite utilizar más capacidad de tu servidor para lograr tus objetivos comerciales. Docker es perfecto para entornos de alta densidad y para implementaciones pequeñas y medianas donde necesitas hacer más con menos recursos.

## Despliegue de un modelo como servicio web

#### **Paso 1**

Como mencioné anteriormente (y si no lo mencioné antes, lo digo ahora, pero debería haberlo mencionado antes), trabajar con Windows en este tipo de problemas es sumamente complicado y se recomienda trabajar con **LINUX** (nuestro salvador). Pero como sería muy difícil que todos instalaran Linux para tan pocas clases, por eso he decidido adaptarlo para darles las nociones necesarias para abordar estos problemas cuando sea necesario, implementando Windows.

**Instalar Windows PowerShell**

[Tutorial](https://learn.microsoft.com/es-es/powershell/scripting/install/installing-powershell-on-windows?view=powershell-7.3)

En primer lugar, debemos determinar cuál es la versión de scikit-learn con la que entrenamos nuestro modelo en la primera clase para evitar problemas de versiones entre nuestro modelo empaquetado y el entorno.

#### **Paso 2**

Instalar **Pipenv**:

1. Abre un símbolo del sistema (Command Prompt) presionando Win + R, escribe cmd y presiona Enter. Luego, ejecuta el siguiente comando para instalar Pipenv:


```bash
pip install pipenv
```

Esto instalará Pipenv en tu sistema.

2. Agregar rutas de Pipenv a la variable de entorno PATH: Debes agregar directorios específicos a la variable de entorno PATH para que el sistema pueda encontrar los archivos ejecutables de Pipenv. Reemplaza `<username>` en las siguientes rutas con tu nombre de usuario de Windows:

* `C:\Users\<username>\AppData\Roaming\Python\Python310\Scripts`
* `C:\Users\<username>\AppData\Roaming\Python\Python310\site-packages`

Aquí, `Python310` debe reemplazarse con tu versión de Python, en este caso, Python 3.10. Para agregar estas rutas a tu variable de entorno PATH, sigue estos pasos:

a. Presiona Win + S, escribe "Variables de entorno" y selecciona "Editar las variables de entorno del sistema".

b. En la ventana "Propiedades del sistema", haz clic en el botón "Variables de entorno".

c. En la ventana "Variables de entorno", bajo la sección "Variables de usuario", busca la variable "Path", selecciónala y haz clic en el botón "Editar".

d. En la ventana "Editar variable de entorno", haz clic en el botón "Nuevo" y luego agrega las dos rutas mencionadas anteriormente, una a la vez. Haz clic en "Aceptar" después de agregar cada ruta.

e. Haz clic en "Aceptar" para cerrar todas las ventanas.

Debería verse algo así (reemplaza `<username>` y `<Python310>` según corresponda):

> C:\Users\<username>\AppData\Roaming\Python\Python310\Scripts
> C:\Users\<username>\AppData\Roaming\Python\Python310\site-packages


3. Cerrar y volver a abrir el símbolo del sistema: Después de cambiar la variable de entorno PATH, es importante cerrar el símbolo del sistema (si estaba abierto) y volver a abrirlo. Esto asegura que los cambios surtan efecto.

4. Verificar la instalación: Para comprobar si Pipenv se instaló correctamente, abre un nuevo símbolo del sistema y ejecuta:

```bash
pipenv --version
```

Si Pipenv está instalado y configurado correctamente, este comando debería mostrar la versión de Pipenv instalada.

Siguiendo estos pasos, deberías haber instalado Pipenv en Windows y agregado las rutas necesarias a tu variable de entorno PATH para usarlo cómodamente con Python 3.10.

#### **Paso 3**

Comprueba la versión de scikit-learn con la que entrenamos nuestro modelo predictivo en la primera clase.

In [1]:
!pip show scikit-learn

Name: scikit-learn
Version: 1.3.1
Summary: A set of python modules for machine learning and data mining
Home-page: http://scikit-learn.org
Author: 
Author-email: 
License: new BSD
Location: c:\users\marti\anaconda3\envs\mlops2023\lib\site-packages
Requires: joblib, numpy, scipy, threadpoolctl
Required-by: mlflow


Una vez que tenemos esta información, la cual es muy importante, procederemos a crear un virutal environment para dar inicio a la creación de nuestro web deployment. 

#### **Paso 4**

**USAR BASE ENVIRONMENT EN WINDOWS POWERSHELL**

```bash
pipenv install scikit-learn==1.3.0 flask
```

Ahora para entrar: 

```bash
pipenv shell

ls
```
Aparecen: 

* Pipfile

* Pipfile.lock

Vamos a explorar estos archivos.

Aca se explican todas las dependencias de nuestro environment. 

#### **Paso 5**

Procederemos a crear nuestros archivos para deployar a partir del script de la primera clase, estos archivos nos permitiran realizar un preprocesamiento de datos, cargar el modelo y realizar las predicciones. 

Comenzamos por el archivo **predict.py**:

En primer lugar recuerda pegar el archivo .bin doonde guardaste el preprocesamiento y el modelo predictivo que entrenaste en la primera clase en el directorio en el que te encuetnras trabajando, estos son: 

* **lin_reg.bin**

#### Versión inicial **predict_inicial.py**

In [None]:
## Colocamos los inputs
import pickle

from flask import Flask, request, jsonify

# Abrimos el archivo donde estan las cosas que nos permitiran hacer predicciones
with open('lin_reg.bin', 'rb') as f_in:
    (dv, model) = pickle.load(f_in)

def prepare_features(ride):
    features = {}
    features['PU_DO'] = '%s_%s' % (ride['PULocationID'], ride['DOLocationID'])
    features['trip_distance'] = ride['trip_distance']
    return features

# Permite realizar las predicciones, hace el preprocesamiento y prediccion de los datos
def predict(features):
    X = dv.transform(features)
    preds = model.predict(X)
    return float(preds[0])

Seguimos con el archivo **test_inicial.py** que nos permitira testear si nuestro codigo funciona correctamente. 

In [None]:
# Importamos dentro de este script el script de predict_incial para poder utilizar sus funciones
import predict_inicial

ride = {
    "PULocationID": 10,
    "DOLocationID": 50,
    "trip_distance": 40
}

features = predict_inicial.prepare_features(ride)
pred = predict_inicial.predict(features)
print(pred)

Chqueamos que obtengamos la prediccion de forma correcta con: 

```bash
python .\test_inicial.py
```

#### Ahora procedemos a implementar flask en los scripts anteriores: 

In [None]:
## Colocamos los inputs
import pickle

# Importamos tambien flask y las funciones necesarias
from flask import Flask, request, jsonify

# Abrimos el archivo donde estan las cosas que nos permitiran hacer predicciones
with open('lin_reg.bin', 'rb') as f_in:
    (dv, model) = pickle.load(f_in)

# Preparamos variables para la prediccion
def prepare_features(ride):
    features = {}
    features['PU_DO'] = '%s_%s' % (ride['PULocationID'], ride['DOLocationID'])
    features['trip_distance'] = ride['trip_distance']
    return features

# Permite realizar las predicciones, hace el preprocesamiento y prediccion de los datos
def predict(features):
    X = dv.transform(features)
    preds = model.predict(X)
    return float(preds[0])

# Definimos nuestra app
app = Flask('duration-prediction')

# predict_endpoint es un wrapper que junta todo 

@app.route('/predict', methods=['POST'])
def predict_endpoint():
    # Recibimos el request y lo hacemos json
    ride = request.get_json()

    features = prepare_features(ride)
    pred = predict(features)

    result = {
        'duration': pred
    }

    # Devolvemos resultado como json
    return jsonify(result)

# Esto es importante y necesario
# Para cuadno ejecutemos desde consola valla al ip que reservamos para la app
if __name__ == "__main__":
    app.run(debug=True, host='0.0.0.0', port=9696)

Seguimos con el archivo **test.py** e introducimos leves modificaciones

In [None]:
import requests

ride = {
    "PULocationID": 10,
    "DOLocationID": 50,
    "trip_distance": 40
}

url = 'http://localhost:9696/predict'
response = requests.post(url, json=ride)
print(response.json())


* si no lo hicimos antes recordar hacer: 

```bash
pipenv install requests
pipenv install gunicorn
```

#### Para ponerlo en funcionamiento

* En primer lugar debemos dejar corriendo predict.py en el ip que definimos. 

```bash
python .\predict.py
```

Y desde otro terminal ejecutamos test.py

```bash
python .\test.py
```

Esperamos a ver si funciona y continuamos. 

Ahora introduciremos todo dentro de un **Docker container**

Chequeamos la version de python que estamos utilizando

```bash
python -V
```

Procedemos a crear el **Dockerfile**

* En esta pagina podemos encontrar información con respecto a las imagenes de python para descargarlas [images](https://hub.docker.com/_/python)

In [None]:
# Definimos la imagen de python que vamos a utilizar
FROM python:3.9.7-slim

# Instalamos pip y pip env
RUN pip install -U pip
RUN pip install pipenv 

WORKDIR /app

# Instalamos nuestras dependencias
COPY [ "Pipfile", "Pipfile.lock", "./" ]

RUN pipenv install --system --deploy

# Copiamos los archivos necesarios para realizar las predicciones
COPY [ "predict.py", "lin_reg.bin", "./" ]

# Publicamos la docker image en el ip...
EXPOSE 9696

# Definimos el entrypoint, lo que va a ejecutar despues de que el container esta inciado
ENTRYPOINT [ "gunicorn", "--bind=0.0.0.0:9696", "predict:app" ]

Una vez que creamos todos estos archivos procedemos a ejecutar docker: 

**BUILD**:


```bash
docker build -t ride-duration-prediction-service:v1 .
```

(corre las instrucciones brindadas en dockerfile)

Una vez que se construyo, hacemos el **RUN**.

**RUN**:

```bash
docker run -it --rm -p 9696:9696  ride-duration-prediction-service:v1
```

(corremos la imagen construida)

Cabe destacar que para poder correr estos comandos tendran que instalar docker desktop en sus computadoras. 

[Tutorial instalar DockerDesktop](https://docs.docker.com/desktop/install/windows-install/)

Testeamos que este funcionando: 

```bash
python .\test.py
```