In [4]:
#Exportar e imprmir a un modelo entrenado de ML

In [6]:
# Importamos las bibliotecas necesarias
import pandas as pd  # Para manejar datos en formato de DataFrame
from sklearn.datasets import load_iris  # Para cargar el dataset Iris
from sklearn.model_selection import train_test_split  # Para dividir los datos en entrenamiento y prueba
from sklearn.ensemble import RandomForestClassifier  # Para el modelo de clasificación
import pickle  # Para guardar y cargar el modelo en formato binario

# 1. Cargar el conjunto de datos
# Usamos el conjunto de datos Iris como un ejemplo
datos = load_iris()  # Cargamos el dataset Iris
X = datos.data  # Variables independientes (características)
y = datos.target  # Variable dependiente (etiquetas)

# 2. Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 3. Entrenar el modelo
# Creamos un modelo de Random Forest
modelo = RandomForestClassifier(n_estimators=100, random_state=42)  # Inicializamos el modelo
modelo.fit(X_train, y_train)  # Entrenamos el modelo con los datos de entrenamiento

# 4. Exportar el modelo a un fichero
# Guardamos el modelo entrenado en un fichero binario utilizando pickle
nombre_fichero = 'modelo_rf.pkl'  # Nombre del fichero donde guardaremos el modelo
with open(nombre_fichero, 'wb') as archivo:  # Abrimos el fichero en modo escritura binaria
    pickle.dump(modelo, archivo)  # Guardamos el modelo en el fichero
print(f"Modelo guardado en el fichero: {nombre_fichero}")

# 5. Importar el modelo desde un fichero
# Cargamos el modelo previamente guardado
with open(nombre_fichero, 'rb') as archivo:  # Abrimos el fichero en modo lectura binaria
    modelo_cargado = pickle.load(archivo)  # Cargamos el modelo desde el fichero
print("Modelo cargado desde el fichero.")

# 6. Evaluar el modelo cargado
# Realizamos predicciones con el modelo cargado
predicciones = modelo_cargado.predict(X_test)  # Usamos el modelo cargado para hacer predicciones

# Imprimimos las predicciones
print("Predicciones realizadas con el modelo cargado:")
print(predicciones)

# 7. Opcional: Guardar y recuperar un modelo de un fichero binario pickle
# Este proceso se realiza en los pasos 4 y 5, donde guardamos y luego cargamos el modelo
# Utilizamos el mismo fichero para demostrar que el modelo se puede persistir y recuperar correctamente.


Modelo guardado en el fichero: modelo_rf.pkl
Modelo cargado desde el fichero.
Predicciones realizadas con el modelo cargado:
[1 0 2 1 1 0 1 2 1 1 2 0 0 0 0 1 2 1 1 2 0 2 0 2 2 2 2 2 0 0]


Explicación de cada sección del código:
Importaciones:

Importamos las bibliotecas necesarias: pandas para manipulación de datos, load_iris para obtener un conjunto de datos, train_test_split para dividir los datos, RandomForestClassifier para crear el modelo de Machine Learning y pickle para guardar y cargar el modelo en formato binario.
Cargar el Conjunto de Datos:

Utilizamos el conjunto de datos Iris como ejemplo. X contiene las características y y contiene las etiquetas de las clases.
Dividir los Datos:

Dividimos los datos en conjuntos de entrenamiento y prueba para evaluar el modelo. En este caso, usamos un 80% de los datos para entrenar y un 20% para probar.
Entrenar el Modelo:

Creamos un modelo de Random Forest y lo entrenamos con los datos de entrenamiento.
Exportar el Modelo:

Utilizamos pickle para guardar el modelo entrenado en un fichero. El fichero se abre en modo escritura binaria ('wb'), y luego usamos pickle.dump() para escribir el modelo en el fichero.
Importar el Modelo:

Para cargar el modelo, abrimos el fichero en modo lectura binaria ('rb') y utilizamos pickle.load() para leer el modelo desde el fichero.
Evaluar el Modelo Cargado:

Una vez cargado el modelo, hacemos predicciones sobre el conjunto de prueba y las imprimimos para verificar que el modelo cargado funciona correctamente.
Notas sobre el uso de pickle:
pickle es una biblioteca en Python que permite serializar (convertir en un formato que se puede guardar) y deserializar (recuperar el formato original) objetos de Python.
Es útil para guardar modelos de Machine Learning entrenados, lo que permite reutilizarlos sin necesidad de volver a entrenar.
Es importante tener en cuenta que pickle es específico de Python, por lo que los modelos guardados no pueden ser usados directamente en otros lenguajes de programación.