### Salvar e carregar aprendizado de máquina modelos

Encontrar um modelo preciso de aprendizado de máquina não é o fim do projeto. Neste capítulo você
descobrirá como salvar e carregar seu modelo de aprendizado de máquina em Python usando o scikit-learn.
Isso permite que você salve seu modelo em um arquivo e carregue-o mais tarde para fazer previsões. Depois
concluindo esta lição você saberá:

1. A importância de serializar modelos para reutilização.
2. Como usar pickle para serializar e desserializar modelos de aprendizado de máquina.
3. Como usar Joblib para serializar e desserializar modelos de aprendizado de máquina.

#### Finalize seu modelo com pickle

Pickle é a maneira padrão de serializar objetos em Python. Você pode usar a operação pickle1
para serializar seus algoritmos de aprendizado de máquina e salvar o formato serializado em um arquivo. Mais tarde você
pode carregar este arquivo para desserializar seu modelo e usá-lo para fazer novas previsões. O exemplo
abaixo demonstra como você pode treinar um modelo de regressão logística no início dos índios Pima
conjunto de dados de diabetes, salve o modelo em arquivo e carregue-o para fazer previsões no conjunto de teste não visto.

In [1]:
# Save Model Using Pickle
from pandas import read_csv
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from pickle import dump
from pickle import load

import warnings
warnings.filterwarnings('ignore')

filename = 'datasets/pima-indians-diabetes.csv'
names = ['preg', 'plas', 'pres',
         'skin', 'test', 'mass',
         'pedi', 'age', 'class']

dataframe = read_csv(filename, names=names)
array = dataframe.values
X = array[:,0:8]
Y = array[:,8]
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.33, random_state=7)

# Fit the model on 33%
model = LogisticRegression()
model.fit(X_train, Y_train)

# save the model to disk
filename = 'model/finalized_model.sav'
dump(model, open(filename, 'wb'))

# load the model from disk
loaded_model = load(open(filename, 'rb'))
result = loaded_model.score(X_test, Y_test)
print(result)

0.7874015748031497


A execução do exemplo salva o modelo no model.sav finalizado em seu local de trabalho
diretório. Carregar o modelo salvo e avaliá-lo fornece uma estimativa de precisão do modelo
em dados não vistos.

#### Finalize seu modelo com Joblib

A biblioteca Joblib2 faz parte do ecossistema SciPy e fornece utilitários para pipelining Python
empregos. Ele fornece utilitários para salvar e carregar objetos Python que usam dados NumPy
estruturas, com eficiência3. Isso pode ser útil para alguns algoritmos de aprendizado de máquina que exigem um
muitos parâmetros ou armazenar todo o conjunto de dados (por exemplo, k-vizinhos mais próximos). O exemplo abaixo
demonstra como você pode treinar um modelo de regressão logística no início do diabetes dos índios Pima
conjunto de dados, salve o modelo em arquivo usando Joblib e carregue-o para fazer previsões no teste invisível
definir.

In [4]:
# Save Model Using joblib
from pandas import read_csv
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
import joblib 


import warnings
warnings.filterwarnings('ignore')

filename = 'datasets/pima-indians-diabetes.csv'
names = ['preg', 'plas', 'pres',
         'skin', 'test', 'mass',
         'pedi', 'age', 'class']

dataframe = read_csv(filename, names=names)
array = dataframe.values
X = array[:,0:8]
Y = array[:,8]
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.33, random_state=7)
# Fit the model on 33%
model = LogisticRegression()
model.fit(X_train, Y_train) 

# save the model to disk
filename = 'model/finalized_model-2.sav'
joblib.dump(model, filename)

# some time later...
# load the model from disk
loaded_model = joblib.load(filename)
result = loaded_model.score(X_test, Y_test)
print(result)

0.7874015748031497


A execução do exemplo salva o modelo no arquivo como model.sav finalizado e também cria um
arquivo para cada matriz NumPy no modelo (quatro arquivos adicionais). Depois que o modelo é carregado, um
estimativa da precisão do modelo em dados não vistos é relatada.

#### Dicas para finalizar seu modelo

Esta seção lista algumas considerações importantes ao nalizar seus modelos de aprendizado de máquina.

. Versão Python. Tome nota da versão do Python. Você quase certamente precisa do
mesma versão principal (e talvez secundária) do Python usada para serializar o modelo quando você
depois carregue-o e desserialize-o.

. Versões da biblioteca. A versão de todas as principais bibliotecas usadas em seu aprendizado de máquina
quase certamente precisa ser o mesmo ao desserializar um modelo salvo. Isso é
não limitado à versão do NumPy e à versão do scikit-learn.

. Serialização Manual. Você pode querer enviar manualmente os parâmetros do seu
modelo aprendido para que você possa usá-los diretamente no scikit-learn ou em outra plataforma
o futuro. Muitas vezes, as técnicas usadas internamente pelos algoritmos de aprendizado de máquina para fazer
as previsões são muito mais simples do que aquelas usadas para aprender os parâmetros podem ser fáceis de
implemente no código personalizado sobre o qual você tem controle.

Anote a versão para que você possa recriar o ambiente se por algum motivo você
não pode recarregar seu modelo em outra máquina ou outra plataforma posteriormente.

In [5]:
%reload_ext watermark
%watermark -gu "caiquemiranda" -iv

Github username: caiquemiranda

joblib: 1.1.0



### End.