###  Pruebas de API para el Modelo de Predicci√≥n de Accidentes en Miner√≠a

Este notebook forma parte del trabajo final del curso de MLOps  y est√° dise√±ado para probar el modelo de Machine Learning a trav√©s de su API en **Databricks Model Serving**.

El objetivo es verificar que el modelo responde correctamente a solicitudes de predicci√≥n mediante llamadas HTTP a la API.  
Las pruebas incluyen:

- **Carga de la API y autenticaci√≥n** con un token de acceso.
- **Prueba de inferencia con una sola fila de datos** para validar respuestas individuales.
- **Prueba con m√∫ltiples filas** para evaluar el rendimiento con varias predicciones simult√°neas.
- **Medici√≥n del tiempo de respuesta** para analizar la eficiencia del servicio.

Estas pruebas son fundamentales dentro de **MLOps**, ya que aseguran que el modelo puede integrarse correctamente con aplicaciones externas y responder eficientemente a solicitudes en tiempo real.

<style>
    p { text-align: justify; }
</style>


### 1. Importaci√≥n de librer√≠as y configuraci√≥n del entorno
Se importan las librer√≠as necesarias para realizar pruebas de inferencia a trav√©s de la API del modelo desplegado en Databricks Model Serving.
Esto permitir√° evaluar si el modelo responde correctamente en un entorno de producci√≥n.


In [0]:
# Paso 1: Importar librer√≠as
import requests
import json
import time
import pandas as pd

print("Notebook 05 (API_Test) - Iniciando...")


Notebook 05 (API_Test) - Iniciando...


### 2. Configuraci√≥n del endpoint de la API y autenticaci√≥n
Se define la URL de la API donde se encuentra el modelo en Databricks y se configura el token de autenticaci√≥n. Este token es necesario para autorizar las solicitudes y acceder al servicio de inferencia.

In [0]:
# Paso 2: Configurar endpoint y token

API_URL = "https://adb-1781258311325241.1.azuredatabricks.net/serving-endpoints/accidentprediction2025-endpoint/invocations"
DATABRICKS_TOKEN = "********************" 

headers = {
    "Authorization": f"Bearer {DATABRICKS_TOKEN}",
    "Content-Type": "application/json"
}

print("API_URL =", API_URL)


API_URL = https://adb-1781258311325241.1.azuredatabricks.net/serving-endpoints/accidentprediction2025-endpoint/invocations


### 3. Prueba de inferencia con una sola fila de datos
Se env√≠a una sola instancia de prueba a la API para verificar que el modelo responde correctamente. Se mide el tiempo de respuesta y se valida si la predicci√≥n se obtiene sin errores.


In [0]:
# Paso 3: Enviar datos de prueba a la API

sample_data_single = {
    "dataframe_split": {
        "columns": [
            "Shift_Type", 
            "Weather_Risk_Index", 
            "Job_Risk_Level", 
            "Hours_Worked",
            "Employee_Experience_Years", 
            "Safety_Violations", 
            "Inspection_Frequency", 
            "Temperature_C"
        ],
        "data": [
            [1.0, 3.5, 2.0, 8.0, 5.0, 0.0, 3.0, 25.0]
        ]
    }
}

try:
    start_time = time.time()
    response = requests.post(API_URL, headers=headers, json=sample_data_single)
    response_time = time.time() - start_time

    if response.status_code == 200:
        print("‚úÖ API Respondi√≥ correctamente (single).")
        print("Predicci√≥n (single):", response.json())
    else:
        print("‚ùå Error en la respuesta (single):", response.status_code, response.text)

    print(f"‚è± Tiempo de respuesta: {response_time:.2f} segundos")

except Exception as e:
    print("üö® Error al conectar con la API (single):", str(e))


‚úÖ API Respondi√≥ correctamente (single).
Predicci√≥n (single): {'predictions': [1.0]}
‚è± Tiempo de respuesta: 1.54 segundos


### 4. Prueba de inferencia con m√∫ltiples filas de datos
Se prueba la API con varias instancias al mismo tiempo para evaluar la capacidad del modelo de procesar m√∫ltiples solicitudes en paralelo.
Esto es √∫til para verificar el rendimiento del modelo en escenarios reales con grandes vol√∫menes de datos.

In [0]:
# Paso 4: Varias filas de test
sample_data_multi = {
    "dataframe_split": {
        "columns": [
            "Shift_Type", 
            "Weather_Risk_Index", 
            "Job_Risk_Level", 
            "Hours_Worked",
            "Employee_Experience_Years", 
            "Safety_Violations", 
            "Inspection_Frequency", 
            "Temperature_C"
        ],
        "data": [
            [2.0, 1.5, 1.0, 10.0, 2.0, 1.0, 2.0, 15.0],
            [3.0, 4.5, 3.0, 6.0,  8.0, 2.0, 4.0, 20.0],
            [1.0, 2.5, 2.0, 7.0,  3.0, 0.0, 4.0, 22.0]
        ]
    }
}

try:
    start_time = time.time()
    response = requests.post(API_URL, headers=headers, json=sample_data_multi)
    response_time = time.time() - start_time

    if response.status_code == 200:
        print("‚úÖ API Respondi√≥ correctamente (multi).")
        preds_multi = response.json()
        print("Predicciones (multi):", preds_multi)
    else:
        print("‚ùå Error en la respuesta (multi):", response.status_code, response.text)

    print(f"‚è± Tiempo de respuesta: {response_time:.2f} segundos")

except Exception as e:
    print("üö® Error al conectar con la API (multi):", str(e))


‚úÖ API Respondi√≥ correctamente (multi).
Predicciones (multi): {'predictions': [1.0, 1.0, 1.0]}
‚è± Tiempo de respuesta: 0.95 segundos
