# Guardar un modelo de aprendizaje automático
En el aprendizaje automático, mientras trabajamos con la biblioteca scikit learn , necesitamos guardar los modelos entrenados en un archivo y restaurarlos para poder reutilizarlos para comparar el modelo con otros modelos, para probar el modelo en nuevos datos. El almacenamiento de datos se denomina serialización , mientras que la restauración de datos se denomina deserialización.

Además, tratamos con diferentes tipos y tamaños de datos. Algunos conjuntos de datos se entrenan fácilmente, es decir, toman menos tiempo para entrenar, pero los conjuntos de datos cuyo tamaño es grande (más de 1 GB) pueden tardar mucho en entrenarse en una máquina local incluso con GPU. Cuando necesitemos los mismos datos entrenados en algún proyecto diferente o más tarde en algún momento, para evitar el desperdicio del tiempo de entrenamiento, almacene el modelo entrenado para que pueda usarse en cualquier momento en el futuro. 

Hay dos formas de guardar un modelo en scikit learn:

### Pickle string

El módulo pickle implementa un algoritmo fundamental pero poderoso para serializar y deserializar una estructura de objeto de Python. 
 
El modelo Pickle proporciona las siguientes funciones:
* `pickle.dump` para serializar una jerarquía de objetos, simplemente usa dump().

* `pickle.load` para deserializar un flujo de datos, llama a la función cargas().

### Ejemplo
Apliquemos K vecino más cercano en el conjunto de datos del iris y luego guardemos el modelo. 


In [11]:
import numpy as np
from sklearn.datasets import load_iris
# import KNeighborsClassifier model
from sklearn.neighbors import KNeighborsClassifier as KNN
from sklearn.model_selection import train_test_split
import pickle

In [3]:
# Load dataset
iris = load_iris()

In [4]:
X = iris.data
y = iris.target

In [8]:
# Split dataset into train and test
X_train, X_test, y_train, y_test = \
    train_test_split(X, y, test_size = 0.3,
                        random_state = 2018)

In [9]:
knn = KNN(n_neighbors = 3)

In [10]:
# train model
knn.fit(X_train, y_train)

KNeighborsClassifier(n_neighbors=3)

In [12]:
# Save the trained model as a pickle string.
saved_model = pickle.dumps(knn)

In [13]:
# Load the pickled model
knn_from_pickle = pickle.loads(saved_model)

In [14]:
# Use the loaded pickled model to make predictions
knn_from_pickle.predict(X_test)

array([0, 1, 1, 1, 0, 1, 2, 1, 2, 0, 0, 2, 2, 2, 0, 2, 2, 0, 1, 1, 1, 0,
       2, 0, 0, 2, 0, 0, 2, 1, 0, 2, 0, 1, 2, 0, 0, 0, 0, 1, 0, 2, 2, 2,
       1])