# Notebook de Creación del Servicio de API para Despliegue en BentoML

Mediante este notebook pretendemos crear el servicio API para deplegar BentoML y los modelos que hemos creado. Como mención aclarativa, el procedimiento que hemos seguido es fundamentalmente igual que el código proporcionado en clase para realizar las practicas de BentoML. Sin embargo, por motivos de dependecias y obsolescencias (las nuevas versiones pedian metodos más modernos), hemos decidio usar una solución más moderna y adaptada a nuestros intereses.

## 1. Importación de librerías necesarias
Aquí simplemente traemos las librerías que necesitamos: BentoML para crear el servicio, NumPy para manejar los números y Pydantic para definir cómo son los datos que vamos a recibir.

In [1]:
import bentoml
import numpy as np
from pydantic import BaseModel, Field

## 2. Cargar el modelo entrenado desde el Model Store

En este bloque, definimos los "nombres clave" (Tags) con los que guardamos nuestros modelos y escaladores anteriormente.

In [2]:
XGB_TAG            = "ai4i2020_xgbclassifier:latest"
LOGR_TAG           = "ai4i2020_logistic_regression:latest"
SVM_TAG            = "ai4i2020_support_vector_machine:latest"
RF_TAG             = "ai4i2020_random_forest:latest"
HDBSCAN_MODEL_TAG  = "ai4i2020_hdbscan:latest"

XGB_SCALER_TAG       = "ai4i2020_scaler_xgbclassifier:latest"
LOGR_SCALER_TAG      = "ai4i2020_scaler_logistic_regression:latest"
SVM_SCALER_TAG       = "ai4i2020_scaler_svm:latest"
RF_SCALER_TAG        = "ai4i2020_scaler_random_forest:latest"
HDBSCAN_SCALER_TAG   = "ai4i2020_scaler_hdbscan:latest"

## 3. Definir los Schemas de entrada

Aquí creamos dos moldes para los datos. Además, ponemos un ejemplo por defecto para que aparezca bonito en la página web del servicio.

In [None]:
# Esquema para modelos de 12 columnas (Logistic, SVM, XGB)
class Input7Features2(BaseModel):
    # Definimos que esperamos una lista de listas de floats
    input_data: list[list[float]] = Field(
        default=[[298.9, 309.1, 2861, 4.6, 143, 1, 0]],
        description="Matriz de entrada con 12 características."
    )

# Esquema para modelos de 7 columnas (Random Forest, HDBSCAN) (los modelos que obvian el tipo de fallo; ya que serán parte de 'y' o serán obviados)
class Input7Features(BaseModel):
    input_data: list[list[float]] = Field(
        default=[[298.8, 308.9, 1455, 41.3, 208, 1, 0]],
        description="Matriz de entrada con 7 características."
    )

## 4. Cargamos los modelos en la memoria
Este es el momento en que el servidor arranca. Usamos las etiquetas que definimos antes para sacar los modelos reales del disco y cargarlos en la memoria.

In [4]:
print("Cargando MODELOS del Model Store...")
xgb_model   = bentoml.sklearn.load_model(XGB_TAG)
logr_model  = bentoml.sklearn.load_model(LOGR_TAG)
svm_model   = bentoml.sklearn.load_model(SVM_TAG)
rf_model    = bentoml.sklearn.load_model(RF_TAG)
hdb_model   = bentoml.sklearn.load_model(HDBSCAN_MODEL_TAG)

print("Cargando SCALERS del Model Store...")
xgb_scaler   = bentoml.picklable_model.load_model(XGB_SCALER_TAG)
logr_scaler  = bentoml.picklable_model.load_model(LOGR_SCALER_TAG)
svm_scaler   = bentoml.picklable_model.load_model(SVM_SCALER_TAG)
rf_scaler    = bentoml.picklable_model.load_model(RF_SCALER_TAG)
hdb_scaler   = bentoml.picklable_model.load_model(HDBSCAN_SCALER_TAG)

print("Modelos y scalers cargados.")

Cargando MODELOS del Model Store...


  __import__("pkg_resources").declare_namespace(__name__)  # type: ignore


Cargando SCALERS del Model Store...
Modelos y scalers cargados.


  xgb_scaler   = bentoml.picklable_model.load_model(XGB_SCALER_TAG)


## 5. Configuramos el servicio y nuestro asistente de limpieza
Aquí empieza la clase principal. Primero, creamos una función "ayudante" (_prepare_data) que usamos internamente. Esta función se encarga de recibir los datos brutos, convertirlos al formato NumPy y comprobar que el tamaño sea el correcto antes de pasárselos a los modelos.

In [5]:
@bentoml.service(name="AI4I2020__Failure__Prediction__Service")
class AI4I2020FailurePredictionService:
    """
    Servicio BentoML con Inputs definidos mediante Pydantic
    para mostrar ejemplos en la UI (Swagger).
    """

    # Convertir pydantic a numpy y validar
    def _prepare_data(self, pydantic_input, expected_cols: int) -> np.ndarray:
        # Extraemos la lista del objeto pydantic y convertimos a numpy
        data = np.array(pydantic_input.input_data)
        
        # Aseguramos 2D
        if data.ndim == 1:
            data = data.reshape(1, -1)
            
        # Validamos columnas
        if data.shape[1] != expected_cols:
            raise ValueError(f"Se esperaban {expected_cols} columnas, recibidas {data.shape[1]}.")
            
        return data

## 6. Creamos las "ventanillas" de atención (Endpoints)
Finalmente, definimos las funciones que estarán disponibles para el público. Cada función hace lo mismo:
1. Recibe los datos del usuario.
2. Llama al ayudante (_prepare_data) para limpiarlos.
3. Escala los datos.
4. Le pide al modelo correspondiente una predicción y nos la devuelve.

In [None]:
# Logistic Regression (Usa Input7Features2)
@bentoml.api
def predict_logreg(self, input_obj: Input7Features2) -> np.ndarray:
    data = self._prepare_data(input_obj, 7)
    scaled = logr_scaler.transform(data)
    return logr_model.predict_proba(scaled)

# Random Forest (Usa Input7Features)
@bentoml.api
def predict_random_forest(self, input_obj: Input7Features) -> np.ndarray:
    data = self._prepare_data(input_obj, 7)
    scaled = rf_scaler.transform(data)
    return rf_model.predict(scaled)

# SVM (Usa Input7Features2)
@bentoml.api
def predict_svm(self, input_obj: Input7Features2) -> np.ndarray:
    data = self._prepare_data(input_obj, 7)
    scaled = svm_scaler.transform(data)
    return svm_model.predict_proba(scaled)

# XGBoost (Usa Input7Features2)
@bentoml.api
def predict_xgb(self, input_obj: Input7Features2) -> np.ndarray:
    data = self._prepare_data(input_obj, 7)
    scaled = xgb_scaler.transform(data)
    return xgb_model.predict(scaled)

# HDBSCAN (Usa Input7Features)
@bentoml.api
def cluster_hdbscan(self, input_obj: Input7Features) -> np.ndarray:
    data = self._prepare_data(input_obj, 7)
    scaled = hdb_scaler.transform(data)
    # Recordamos que aquí estamos usando el truco del KNN wrapper
    # por lo que podemos usar .predict() directamente
    predictions = hdb_model.predict(scaled)
    return predictions

In [8]:
!bentoml serve service:AI4I2020FailurePredictionService --port 3000

  __import__("pkg_resources").declare_namespace(__name__)  # type: ignore
Cargando MODELOS del Model Store...
Cargando SCALERS del Model Store...
  xgb_scaler   = bentoml.picklable_model.load_model(XGB_SCALER_TAG)
Modelos y scalers cargados.
2025-12-12T20:36:35+0100 [INFO] [cli] Starting production HTTP BentoServer from "service:AI4I2020FailurePredictionService" listening on http://localhost:3000 (Press CTRL+C to quit)
  __import__("pkg_resources").declare_namespace(__name__)  # type: ignore
Cargando MODELOS del Model Store...
Cargando SCALERS del Model Store...
  xgb_scaler   = bentoml.picklable_model.load_model(XGB_SCALER_TAG)
Modelos y scalers cargados.
2025-12-12T20:36:37+0100 [INFO] [entry_service:AI4I2020__Failure__Prediction__Service:1] Service AI4I2020__Failure__Prediction__Service initialized
2025-12-12T20:36:38+0100 [INFO] [entry_service:AI4I2020__Failure__Prediction__Service:1] 127.0.0.1:46392 (scheme=http,method=GET,path=/,type=,length=) (status=200,type=text/html; charset=

http://localhost:3000/