# Sección 6 Lección 20: Persistencia de modelos (joblib)

## Para modelos grandes o con mucha información, joblib suele ser más rápido y producir archivos más pequeños.

In [1]:
import joblib
from sklearn.datasets import load_breast_cancer
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Cargar datos
data = load_breast_cancer()
X, y = data.data, data.target

# División train/test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)


In [2]:
# Entrenar modelo
model = RandomForestClassifier(random_state=0)
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

# Predecir con modelo entrenado
acc_pickle = accuracy_score(y_test, y_pred)
print(f"Accuracy con pickle: {acc_pickle:.3f}")
print("Predicciones con pickle:", y_pred[:5])

# Guardar modelo con joblib
joblib.dump(model, 'modelo_joblib.joblib')

Accuracy con pickle: 0.959
Predicciones con pickle: [0 1 1 1 1]


['modelo_joblib.joblib']

In [5]:
# Cargar modelo con joblib
modelo_cargado_joblib = joblib.load('modelo_joblib.joblib')

# Predecir con modelo cargado
y_pred_pickle = modelo_cargado_joblib.predict(X_test)
acc_pickle = accuracy_score(y_test, y_pred_pickle)
print(f"Accuracy con pickle: {acc_pickle:.3f}")
print("Predicciones con pickle:", y_pred_pickle[:5])

Accuracy con pickle: 0.959
Predicciones con pickle: [0 1 1 1 1]
