### Colocando um modelo em produção

Após gerado o modelo é importante ter uma forma de serializar o modelo e os componentes acessórios para migrá-los para o local de destino, como um servidor que ficará executando mediante demanda ou para um embarcado que o rodará na ponta da rede.

In [None]:
from sklearn.decomposition import PCA
from sklearn import datasets

wine = datasets.load_wine()
X = wine.data
y = wine.target

In [None]:
import pandas as pd

df = pd.DataFrame(X)
df.describe()

## Utilizando joblib

In [None]:
!pip install joblib

In [None]:
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from joblib import dump, load

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)

model = KNeighborsClassifier(n_neighbors=1)
model.fit(X_train_scaled, y_train)

persistence = {}
persistence['scaler'] = scaler
persistence['model']  = model

dump(persistence, 'persist.joblib')

In [None]:
persistence = load('persist.joblib')

scaler = persistence['scaler']
model = persistence['model']

X_test_scaled = scaler.transform(X_test)

y_pred = model.predict(X_test_scaled)

from sklearn.metrics import accuracy_score

print('Acurácia:', accuracy_score(y_test, y_pred))

## Exercício

Uma boa prática é utilizar todo o dado disponível para treino e retreinar o modelo depois de encontrar os melhores parâmetros, antes de colocar em produção. Nesse sentido, realize as seguintes etapas:

1 - Separe os dados em treino e teste (70 - 30).

2 - Na parcela de treino, use todos os dados (70% aplicando GridSearchCV) para encontrar os melhores parâmetros.

3 - Em seguida, retreine o modelo utilizando todos os dados de treino utilizando essa configuração.

4 - Salve o modelo.

5 - Recarregue o modelo e verifique o desempenho no conjunto de teste separado inicialmente.