<a href="https://colab.research.google.com/github/jserrataylor/cursoAI/blob/main/Despligue_Titanic.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Despliegue de un Modelo ML**


El **despliegue de un modelo** en el contexto de aprendizaje automático y ciencia de datos se refiere al proceso de poner un modelo entrenado en producción para que pueda ser utilizado para hacer predicciones o tomar decisiones basadas en nuevos datos.

Un despliegue efectivo es crucial para garantizar que las inversiones en el desarrollo de modelos de aprendizaje automático se traduzcan en valor práctico y tangible para una organización o usuario final.

Este proceso implica varios pasos y consideraciones importantes:

1. **Entrenamiento del Modelo:** Antes del despliegue, un modelo es desarrollado y entrenado utilizando un conjunto de datos. Este entrenamiento involucra la selección de un algoritmo adecuado y el ajuste de sus parámetros para que el modelo pueda aprender de los datos históricos.

2. **Evaluación y Validación:** Una vez entrenado, el modelo se evalúa para determinar su precisión y fiabilidad. Esto generalmente se hace utilizando un conjunto de datos de prueba que no se ha utilizado durante el entrenamiento.

3. **Preparación para el Despliegue:** El modelo se convierte a un formato que puede ser utilizado en un entorno de producción. Esto puede implicar la optimización del modelo para mejorar la eficiencia y la velocidad, y asegurarse de que es compatible con las herramientas y sistemas en producción.

4. **Integración con Sistemas Existentes:** El modelo se integra con los sistemas y aplicaciones existentes. Esto puede requerir el desarrollo de APIs, servicios web o la integración con bases de datos y otras aplicaciones empresariales.

5. **Monitoreo y Mantenimiento:** Una vez desplegado, el modelo se monitorea continuamente para asegurarse de que sigue siendo preciso y relevante. Esto incluye la actualización periódica del modelo con nuevos datos y la recalibración si su rendimiento decae.

6. **Escalabilidad y Gestión de Recursos:** Es importante asegurarse de que el sistema que aloja el modelo puede manejar la carga de trabajo prevista, tanto en términos de número de solicitudes como de tamaño de los datos procesados.

7. **Seguridad y Cumplimiento:** Se deben considerar aspectos de seguridad, como la protección de datos sensibles y el cumplimiento de las normativas aplicables.

Subir los modelos entrenados de la PC al Colab para su lectura

1. Modelo entrendado con un arbol de decisiones: modelo_titanic_dt.pmml

2. Modelo entrenado con el algoritmo Naive Bayes: modelo_titanic_nb.pmml

3. `!pip install pypmml`: Librería requerida que se instale para lectura de los modelos creados en **Knime** a través de **PMML**

In [None]:
# Instalación de los requerimientos necesarios
!pip install pypmml

In [21]:
from pypmml import Model

# Carga el modelo PMML
#modelo = Model.load('modelo_titanic_dt.pmml')
modelo = Model.load('modelo_titanic_nb.pmml')

# Prepara un ejemplo de datos de entrada
datos_de_entrada = {
    'Clase': 1,
    'Sexo': 'Femenino',
    'Edad': 14,
    'Familia': 2,
    'Tarifa': 50
}

# Realiza una predicción
prediccion = modelo.predict(datos_de_entrada)

# Interpretación de la predicción
resultado = prediccion['predicted_Survived']
probabilidad_sobrevive = prediccion['probability_1']
probabilidad_no_sobrevive = prediccion['probability_0']

if resultado == '1':
    print(f'Predicción: Sobrevivió con una probabilidad de {probabilidad_sobrevive:.2f}')
else:
    print(f'Predicción: No sobrevivió con una probabilidad de {probabilidad_no_sobrevive:.2f}')


Predicción: Sobrevivió con una probabilidad de 0.86
