# Serializar o modelo com Pickle

A serialização é o processo de convertir um objeto em um formato que pode ser armazenado em disco ou transmitido pela rede. Isso é útil quando você deseja salvar o estado de um objeto em um arquivo e restaurá-lo posteriormente, ou compartilhar um objeto com outro programa ou computador.

O módulo pickle do Python fornece uma maneira fácil de serializar e desserializar objetos. Para serializar um objeto usando pickle, basta chamar o método dump do módulo pickle, passando o objeto e o arquivo onde ele deve ser salvo. Para desserializar um objeto, basta chamar o método load do módulo pickle, passando o arquivo onde o objeto foi salvo.

O pickle pode ser usado para serializar qualquer objeto do Python, incluindo modelos treinados de machine learning. Isso é útil quando você deseja salvar o estado de um modelo treinado em um arquivo e restaurá-lo posteriormente, ou compartilhar um modelo treinado com outro programa ou computador.

In [None]:
from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split

import joblib

import time

In [None]:
iris = datasets.load_iris()
X = iris.data
y = iris.target

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [None]:
inicio = time.time()
modelo_knn = KNeighborsClassifier(n_neighbors=3)
modelo_knn.fit(X_train,y_train)
termino = time.time()
print("--- %s segundos para treinar o modelo ---" % (termino - inicio))

--- 0.0039784908294677734 segundos para treinar o modelo ---


In [None]:
inicio = time.time()
predicao = modelo_knn.predict(X_test)
termino = time.time()
print(predicao)
print("--- %s segundos para fazer o scoring do modelo ---" % (termino - inicio))

[1 0 2 1 1 0 1 2 1 1 2 0 0 0 0 1 2 1 1 2 0 2 0 2 2 2 2 2 0 0]
--- 0.005354642868041992 segundos para fazer o scoring do modelo ---


In [None]:
joblib.dump(modelo_knn, "modelo_knn_iris.pkl")

['modelo_knn_iris.pkl']

### No outro arquivo, para ler o Pickle

In [None]:
modelo_knn_recuperado = joblib.load("modelo_knn_iris.pkl")

In [None]:
inicio = time.time()
predicao = modelo_knn_recuperado.predict(X_test)
termino = time.time()
print(predicao)
print("--- %s segundos para fazer o scoring do modelo ---" % (termino - inicio))

[1 0 2 1 1 0 1 2 1 1 2 0 0 0 0 1 2 1 1 2 0 2 0 2 2 2 2 2 0 0]
--- 0.005202293395996094 segundos para fazer o scoring do modelo ---
