# **Ciencia de Datos e Inteligencia Artificial para la industria del software**

# *Curso MLOps*

## **Edición 2023**

# 5. Web depoyment

*Despliegue de modelo en la web*

Por decirlo de alguna forma, si no puedes sacar tus modelos de aprendizaje automático de un *notebook*, probablemente no se utilizarán. Este artículo debería ayudarte a crear un **despliegue de tu modelo lo más rápido posible, para que puedas implementar tus modelos rapidamente**. Se trata de una habilidad importante, ya que significa que **no dependerás indispensablemente de un ingeniero/desarrollador de software para poder poner un modelo en producción.** 

Para ello utilizaremos ***Hugging Face***. 

### ¿Qué es Hugging Face 🤗?

- Una [comunidad colaborativa](https://huggingface.co/) especialmente enfocada en modelos de lenguaje y otros recursos de Inteligencia Artificial (IA).
- Ofrece repositorios para disponibilizar [modelos](https://huggingface.co/models), [datasets](https://huggingface.co/datasets) y [demos](https://huggingface.co/spaces).
- Además, ofrece varias librerías orientadas a la IA, particularmente al Aprendizaje Profundo (*Deep Learning*), entre las que destacan:
    - [`transformers`](https://huggingface.co/docs/transformers): La que veremos en esta charla, para todo lo relacionado a Procesamiento del Lenguaje Natural (PLN) con grandes modelos de lenguaje (*Large Language Models*, LLMs).
    - [`datasets`](https://huggingface.co/docs/datasets): Una librería con funcionalidades para el tratamiento de los conjuntos de datos a utilizar para entrenar o ajustar los LLMs.
    - [`tokenizers`](https://huggingface.co/docs/tokenizers): Una librería para el proceso de "tokenización", i.e. la división de texto de manera discreta en palabras o subpalabras.
- Hugging Face no sólo ofrece soluciones para PLN, sino también para imágenes, con librerías como [`diffusers`](https://huggingface.co/docs/diffusers), para la generación de imágenes:
    - Lectura recomendada: [The Illustrated Stable Diffusion](http://jalammar.github.io/illustrated-stable-diffusion/)

Huggin Face es una empresa que busca desarrollar herramientas de código abierto para el diseño, entrenamiento y puesta en producción de modelos de inteligencia artificial. Creada en 2016, empezó a ganar popularidad gracias a su librería transformers, la cual permite crear y entrenar redes neuronales con la arquitectura *Transformer* de manera sencilla e independiente del framework agnóstica, pudiendo usar en el backend tanto Pytorch como Tensorflo o JAX. Hoy en día, sin embargo, ofrece muchas otras funcionalidades tales como *Datasets*, Modelos pre-entrenados, herramientas para el entrenamiento y puesta en producción de modelos a escala, etc. Recientemente incluso han incluído en su catálogo la librería timm, para la generación de imágenes al estilo *DALL-E* o *Stable Diffusion*, indicando que Hugging Face está creciendo como comunidad, yendo más allá de los *Transfromers* y sus aplicaciones en tareas de lenguaje hacia otros campos como el de la visión artificial o el aprendizaje por refuerzo. 

## ¿Cómo empezar con Hugging Face 🤗?

- Primero se [crea una cuenta en la página](https://huggingface.co/join).
- Luego podemos [crear modelos](https://huggingface.co/new) a través del menú que se despliega de nuestro avatar.

Este es el esquema que seguiremos:

**1.** Crear una cuenta de Hugging Face 🤗
* [crea una cuenta en la página](https://huggingface.co/join).

**2.** Crear un *Space* en Hugging Face y configurarlo
* Los Spaces son repositorios Git que alojan código de aplicación para demos de Machine Learning.

a- Seleccione el SDK de Space: **Gradio**.
b- Space hardware: **Free**.
c- Public.
d- Create space.


**Archivos necesarios:**  

* .gitattributes (Creado automaticamente)
* README.md (Creado automaticamente)
* app.py (app propiamente dicha que realizara la predicción)
* model.pkl (modelo previamente entrenado)
* requirements.txt (requirements del environment con el cual entrenamos nuestro modelo)


**3.** Cargamos el modelo y el preprocesador previamente entrenados:

* lin_reg.bin
* preprocessor.b

**4.** Crear y subir el archivo app.py que realizara el preprocesamiento y las predicciones:

### **app.py** 

```bash
import pickle
import pandas as pd
import numpy as np
import gradio as gr
import pathlib
#plt = platform.system()
#if plt == 'Linux': pathlib.WindowsPath = pathlib.PosixPath

with open('lin_reg.bin', 'rb') as f_in:
    (dv, model) = pickle.load(f_in)

def prepare_features(ride):
    features = {}
    features['PU_DO'] = '%s_%s' % (ride['PULocationID'], ride['DOLocationID'])
    features['trip_distance'] = ride['trip_distance']
    return features
    
def predict(features):
    X = dv.transform(features)
    preds = model.predict(X)
    return float(preds[0])

def main(PULocationID,DOLocationID,trip_distance):
    """request input, preprocess it and make prediction"""
    input_data = {
    "PULocationID": PULocationID,
    "DOLocationID": DOLocationID,
    "trip_distance": trip_distance
    }
    features = prepare_features(input_data)
    pred = predict(features)

    result = {
        'duration': pred
    }

    return result

#create input and output objects
#input
input1 = gr.inputs.Number()
input2 = gr.inputs.Number()
input3 = gr.inputs.Number()

#output object
output = gr.outputs.Textbox() 

intf = gr.Interface(title = "New York taxi duration prediction",
                    description = "The objective of this project is to predict the duration of a taxi trip in the city of New York.",
                    fn=main, 
                    inputs=[input1,input2,input3], 
                    outputs=[output], 
                    live=True,
                    enable_queue=True
                    )
intf.launch()
```

**5.** Crear y subir el archivo requirements.txt:

### requirements.txt

```bash
pandas==2.1.1
scikit-learn==1.3.1
```

**6.** Entrar a la ventana de App, esperar que se construya y realizar predicciones!!!.

[Mi app](https://huggingface.co/spaces/martinnnuez/New_york_taxi_duration_prediction)

#### Explicación cada chunk del cógido app.py:


```python

```

```python

```

```python
import pickle
import pandas as pd
import numpy as np
import gradio as gr
import pathlib
```
* Importación de bibliotecas: En esta sección, se importan las bibliotecas necesarias. Estas bibliotecas incluyen "pickle" para cargar el modelo previamente entrenado, "pandas" y "numpy" para el procesamiento de datos, y "gradio" para crear una interfaz de usuario para la aplicación.

```python
with open('lin_reg.bin', 'rb') as f_in:
    (dv, model) = pickle.load(f_in)
```
* Carga del modelo: En esta sección, se abre el archivo "lin_reg.bin", que contiene un modelo previamente entrenado, se carga en las variables "dv" (vectorizador de características) y "model" (modelo de regresión lineal).

```python
def prepare_features(ride):
    features = {}
    features['PU_DO'] = '%s_%s' % (ride['PULocationID'], ride['DOLocationID'])
    features['trip_distance'] = ride['trip_distance']
    return features
```
* Función "prepare_features": Esta función toma un objeto "ride" como entrada y prepara las características necesarias para hacer una predicción. Crea un diccionario "features" que contiene las ubicaciones de recogida y entrega concatenadas en "PU_DO" y la distancia del viaje en "trip_distance". Luego, devuelve este diccionario de características.

```python
def predict(features):
    X = dv.transform(features)
    preds = model.predict(X)
    return float(preds[0])
```
* Función "predict": Esta función toma un diccionario de características "features" como entrada. Utiliza el vectorizador de características "dv" para transformar las características en un formato adecuado y, a continuación, hace una predicción utilizando el modelo previamente cargado. Devuelve la duración del viaje predicha como un número flotante.

```python
def main(PULocationID, DOLocationID, trip_distance):
    """request input, preprocess it and make a prediction"""
    input_data = {
        "PULocationID": PULocationID,
        "DOLocationID": DOLocationID,
        "trip_distance": trip_distance
    }
    features = prepare_features(input_data)
    pred = predict(features)

    result = {
        'duration': pred
    }

    return result
```
* Función "main": Esta función toma como entrada las ubicaciones de recogida ("PULocationID"), las ubicaciones de entrega ("DOLocationID") y la distancia del viaje ("trip_distance"). Luego, crea un diccionario "input_data" con estas entradas y llama a las funciones "prepare_features" y "predict" para obtener una predicción de la duración del viaje. La función devuelve el resultado en un diccionario con la clave "duration".

```python
# Creación de objetos de entrada y salida
# Entradas
input1 = gr.inputs.Number(label="PULocationID")
input2 = gr.inputs.Number(label="DOLocationID")
input3 = gr.inputs.Number(label="trip_distance")

# Salida
output = gr.outputs.Textbox(label="Duración estimada del viaje")

intf = gr.Interface(
    title="Predicción de duración de viaje en taxis de Nueva York",
    description="El objetivo de este proyecto es predecir la duración de un viaje en taxi en la ciudad de Nueva York.",
    fn=main,
    inputs=[input1, input2, input3],
    outputs=[output],
    live=True,
    enable_queue=True
)
intf.launch()
```

* Interfaz Gradio: En esta sección se crea la interfaz de usuario utilizando la biblioteca Gradio. Se definen objetos de entrada y salida para la interfaz, que incluyen etiquetas y tipos de datos. Luego, se crea la interfaz en sí, especificando el título, descripción, función "main" que realizará la predicción y los objetos de entrada y salida. La interfaz se inicia y se pone en marcha.