# Salvando Classificadores no Disco
#### Salvando classificadores no disco para posterior uso.

É possível salvar na máquina classificadores já treinados, possibilitando implementar algoritmos de Machine Learning em outras aplicações. Abaixo é possível conferir todo o código para realizar esse processo.

### Pré-Processamento da Base de Dados

In [1]:
# importando a biblioteca pandas do python
import pandas as pd

# importando a base de dados para o objeto "dataframe"
dataframe = pd.read_csv('Dados de Credito.csv', encoding = 'utf-8', sep = ',')

# substituindo valores inconsistentes no campo idades pela média das idades consistentes
dataframe.loc[dataframe.age < 0, 'age'] = 40.92

# separando os atributos previsores do meta classe
previsores = dataframe.iloc[:, 1:4].values
classe = dataframe.iloc[:, 4].values

# importando a biblioteca sklearn do python
from sklearn.impute import SimpleImputer
# função "SimpleImputer" responsável por corrigir valores faltantes na base de dados

# importando a biblioteca numpy do python
import numpy as np

# criando o objeto "imputer"
imputer = SimpleImputer(missing_values = np.nan, strategy = "mean")

# fazendo o treinamento com a base de dados para correção de valores faltantes
imputer = imputer.fit(previsores[:,0:3])

# corrigindo os valores faltantes usando o objeto criado "imputer"
previsores[:, 0:3] = imputer.transform(previsores[:, 0:3])

# importando a biblioteca sklearn do python
from sklearn.preprocessing import StandardScaler
# a função "StandardScaler" tem a função de escalonas toda a base de dados para corrigir a discrepância
# dos valores

# criando o objeto "scaler"
scaler = StandardScaler()

# escalonando todos os atributos para auxiliar no cálculo de distâncias euclidianas
previsores = scaler.fit_transform(previsores)

### Criando os classificadores

In [2]:
# importando a biblioteca sklearn do python
from sklearn.naive_bayes import GaussianNB
# 'GaussianNB' responsável por aplicar o algoritmo de naive bayes

# importando a biblioteca sklearn do python
from sklearn.tree import DecisionTreeClassifier
# 'DecisionTreeClassifier' responsável por aplicar o algoritmo de árvores de decisão

# importando a biblioteca sklearn do python
from sklearn.ensemble import RandomForestClassifier
# 'RandomForestClassifier' responsável por aplicar o algoritmo de floresta randômica

# importando a biblioteca Orange do python
import Orange

# importando a biblioteca sklearn do python
from sklearn.linear_model import LogisticRegression
# 'LogisticRegression' responsável por aplicar o algoritmo de regressão logística


# importando a biblioteca sklearn do python
from sklearn.svm import SVC
# 'SVC' responsável por aplicar o algoritmo de máquinas de vetores de suporte

# importando a biblioteca sklearn do python
from sklearn.neighbors import KNeighborsClassifier
# 'KNeighborsClassifier' responsável por aplicar o algoritmo de KNN

# importando a biblioteca sklearn do python
from sklearn.neural_network import MLPClassifier
# 'MLPClassifier' responsável por criar uma rede neural multi-camada perceptron

In [3]:
# criando o classificador para o algoritmo naive bayes
classificadorNaive_Bayes = GaussianNB()
# treinando o classificador do algoritmo naive bayes
classificadorNaive_Bayes.fit(previsores, classe)

# criando o classificador para o algoritmo arvore de decisão
classificadorArvore_Decisao = DecisionTreeClassifier()
# treinando o classificador do algoritmo arvore de decisão
classificadorArvore_Decisao.fit(previsores, classe)

# criando o classificador para o algoritmo floresta randômica
classificadorRandom_Forest = RandomForestClassifier(n_estimators=40, criterion='entropy', random_state=0)
# treinando o classificador do algoritmo floresta randômica
classificadorRandom_Forest.fit(previsores, classe)

# importando a base de dados para o objeto 'dados'
base = Orange.data.Table('Dados de Credito.csv')
# definindo o formato do classificador para o algoritmo aprendizagem por regras
cn2_learner = Orange.classification.rules.CN2Learner()
# treinando o classificador do algoritmo aprendizagem por regras
classificadorRegras = cn2_learner(base)

# criando o classificador para o algoritmo regressão logística
classificadorRegressao_Logistica = LogisticRegression()
# treinando o classificador do algoritmo regressão logística
classificadorRegressao_Logistica.fit(previsores, classe)

# criando o classificador para o algoritmo máquinas de vetores de suporte
classificadorSVM = SVC(kernel = 'rbf', random_state = 1, C = 2.0, probability = True)
# treinando o classificador do algoritmo máquinas de vetores de suporte
classificadorSVM.fit(previsores, classe)

# criando o classificador para o algoritmo KNN
classificadorKNN = KNeighborsClassifier(n_neighbors=5, metric='minkowski', p = 2)
# treinando o classificador do algoritmo KNN
classificadorKNN.fit(previsores, classe)

# criando o classificador para o algoritmo redes neurais multicamadas perceptron
classificadorRedes_Neurais = MLPClassifier(verbose = True, max_iter = 1000,
                                           tol = 0.000010, solver='adam',
                                           hidden_layer_sizes=(100), activation = 'relu',
                                           batch_size=200, learning_rate_init=0.001)
# treinando o classificador do algoritmo redes neurais multicamadas perceptron
classificadorRedes_Neurais.fit(previsores, classe)

Iteration 1, loss = 0.62461647
Iteration 2, loss = 0.55446503
Iteration 3, loss = 0.49680467
Iteration 4, loss = 0.45072746
Iteration 5, loss = 0.41227819
Iteration 6, loss = 0.37937003
Iteration 7, loss = 0.35136797
Iteration 8, loss = 0.32633679
Iteration 9, loss = 0.30455361
Iteration 10, loss = 0.28493750
Iteration 11, loss = 0.26705661
Iteration 12, loss = 0.25115526
Iteration 13, loss = 0.23654845
Iteration 14, loss = 0.22349287
Iteration 15, loss = 0.21132983
Iteration 16, loss = 0.20035054
Iteration 17, loss = 0.19042977
Iteration 18, loss = 0.18154079
Iteration 19, loss = 0.17298921
Iteration 20, loss = 0.16552723
Iteration 21, loss = 0.15848254
Iteration 22, loss = 0.15210501
Iteration 23, loss = 0.14632728
Iteration 24, loss = 0.14092457
Iteration 25, loss = 0.13595894
Iteration 26, loss = 0.13143980
Iteration 27, loss = 0.12721896
Iteration 28, loss = 0.12327213
Iteration 29, loss = 0.11966366
Iteration 30, loss = 0.11628693
Iteration 31, loss = 0.11317376
Iteration 32, los

MLPClassifier(activation='relu', alpha=0.0001, batch_size=200, beta_1=0.9,
              beta_2=0.999, early_stopping=False, epsilon=1e-08,
              hidden_layer_sizes=100, learning_rate='constant',
              learning_rate_init=0.001, max_fun=15000, max_iter=1000,
              momentum=0.9, n_iter_no_change=10, nesterovs_momentum=True,
              power_t=0.5, random_state=None, shuffle=True, solver='adam',
              tol=1e-05, validation_fraction=0.1, verbose=True,
              warm_start=False)

In [4]:
# importando a biblioteca pickle do python
import pickle

In [5]:
# salvando o classificador para o algoritmo naive bayes
pickle.dump(classificadorNaive_Bayes, open('naive-bayes_finalizado.sav', 'wb'))
# salvando o classificador para o algoritmo árvores de decisão
pickle.dump(classificadorArvore_Decisao, open('arvore-decisao_finalizado.sav', 'wb'))
# salvando o classificador para o algoritmo floresta randômica
pickle.dump(classificadorRandom_Forest, open('random_forest_finalizado.sav', 'wb'))
# salvando o classificador para o algoritmo de aprendizagem por regras
pickle.dump(classificadorRegras, open('regras_finalizado.sav', 'wb'))
# salvando o classificador para o algoritmo regressão logística
pickle.dump(classificadorRegressao_Logistica, open('regressao-logistica_finalizado.sav', 'wb'))
# salvando o classificador para o algoritmo máquinas de vetores de suporte
pickle.dump(classificadorSVM, open('maquina-vetores-suporte_finalizado.sav', 'wb'))
# salvando o classificador para o algoritmo knn
pickle.dump(classificadorKNN, open('knn_finalizado.sav', 'wb'))
# salvando o classificador para o algoritmo redes neurais
pickle.dump(classificadorRedes_Neurais, open('redes-neurais_finalizado.sav', 'wb'))

Os classificadores foram salvos e adicionados a uma pasta que se encontra nesse mesmo diretório.

### Alguma dúvida? Entre em contato comigo:

- [Me envie um e-mail](mailto:alyssonmachado388@gmail.com);