# Carregando Classificadores Salvos
#### Como importar um classificador salvo na máquina em um código Python.

Vamos realizar o pré-processamento na base de dados de crédito.

### Pré-processamento na base de dados de crédito

In [1]:
# importando a biblioteca pandas do python
import pandas as pd

# importando a base de dados para o objeto "dataframe"
dataframe = pd.read_csv('Dados de Credito.csv', encoding = 'utf-8', sep = ',')

# substituindo valores inconsistentes no campo idades pela média das idades consistentes
dataframe.loc[dataframe.age < 0, 'age'] = 40.92

# separando os atributos previsores do meta classe
previsores = dataframe.iloc[:, 1:4].values
classe = dataframe.iloc[:, 4].values

# importando a biblioteca sklearn do python
from sklearn.impute import SimpleImputer
# função "SimpleImputer" responsável por corrigir valores faltantes na base de dados

# importando a biblioteca numpy do python
import numpy as np

# criando o objeto "imputer"
imputer = SimpleImputer(missing_values = np.nan, strategy = "mean")

# fazendo o treinamento com a base de dados para correção de valores faltantes
imputer = imputer.fit(previsores[:,0:3])

# corrigindo os valores faltantes usando o objeto criado "imputer"
previsores[:, 0:3] = imputer.transform(previsores[:, 0:3])

# importando a biblioteca sklearn do python
from sklearn.preprocessing import StandardScaler
# a função "StandardScaler" tem a função de escalonas toda a base de dados para corrigir a discrepância
# dos valores

# criando o objeto "scaler"
scaler = StandardScaler()

# escalonando todos os atributos para auxiliar no cálculo de distâncias euclidianas
previsores = scaler.fit_transform(previsores)

### Usando o Pickle para importar classificadores salvos

In [2]:
# importando a biblioteca pickle do python
import pickle 

In [3]:
# importando os classificadores para o código python

naive_bayes = pickle.load(open('Classificadores Salvos/naive-bayes_finalizado.sav', 'rb'))
arvore_decisao = pickle.load(open('Classificadores Salvos/arvore-decisao_finalizado.sav', 'rb'))
random_forest = pickle.load(open('Classificadores Salvos/random-forest_finalizado.sav', 'rb'))
knn = pickle.load(open('Classificadores Salvos/knn_finalizado.sav', 'rb'))
regressao_logistica = pickle.load(open('Classificadores Salvos/regressao-logistica_finalizado.sav', 'rb'))
svm = pickle.load(open('Classificadores Salvos/maquina-vetores-suporte_finalizado.sav', 'rb'))
redes_neurais = pickle.load(open('Classificadores Salvos/redes-neurais_finalizado.sav', 'rb'))

In [4]:
# visualizando a predição de acertos para cada uma das base de dados

print('Resultado Naive Bayes: {:.2f}%'.format(naive_bayes.score(previsores, classe) * 100))
print('Resultado Árvore de Decisão: {:.2f}%'.format(arvore_decisao.score(previsores, classe) * 100))
print('Resultado Random Forest: {:.2f}%'.format(random_forest.score(previsores, classe) * 100))
print('Resultado KNN: {:.2f}%'.format(knn.score(previsores, classe) * 100))
print('Resultado Regressão Logística: {:.2f}%'.format(regressao_logistica.score(previsores, classe) * 100))
print('Resultado Máquina de Vetores de Suporte: {:.2f}%'.format(svm.score(previsores, classe) * 100))
print('Resultado Redes Neurais: {:.2f}%'.format(redes_neurais.score(previsores, classe) * 100))

Resultado Naive Bayes: 92.60%
Resultado Árvore de Decisão: 100.00%
Resultado Random Forest: 100.00%
Resultado KNN: 99.20%
Resultado Regressão Logística: 94.80%
Resultado Máquina de Vetores de Suporte: 98.90%
Resultado Redes Neurais: 99.95%


### Criando um novo registro para ser salvo

In [5]:
# criando uma lista com os campos de dados do 'novo_registro'
novo_registro = [[50000, 40, 5000]]

# transformando a lista em um numpy array
novo_registro = np.asarray(novo_registro)

# transformando em um vetor coluna para realizar o escalonamento nos atributos
novo_registro = novo_registro.reshape(-1, 1)
# '-1' indica que a linha ficará inalterada, e '1' indica que será um vetor de 1 coluna

# escalonando os valores do novo registro
novo_registro = scaler.fit_transform(novo_registro)

# retornado o vetor coluna em um vetor linha 
novo_registro = novo_registro.reshape(-1, 3)

In [6]:
# visualizando na saída de dados o novo registro
print(novo_registro)

[[ 1.40846139 -0.81458192 -0.59387946]]


In [7]:
# obtendo a predição da classe em cada classificador criado usando o 'novo_registro'

print('Resposta Naive Bayes: {}'.format(naive_bayes.predict(novo_registro)))
print('Resposta Árvore de Decisão: {}'.format(arvore_decisao.predict(novo_registro)))
print('Resposta Random Forest: {}'.format(random_forest.predict(novo_registro)))
print('Resposta KNN: {}'.format(knn.predict(novo_registro) * 100))
print('Resposta Regressão Logística: {}'.format(regressao_logistica.predict(novo_registro)))
print('Resposta Máquina de Vetores de Suporte: {}'.format(svm.predict(novo_registro)))
print('Resposta Redes Neurais: {}'.format(redes_neurais.predict(novo_registro)))

Resposta Naive Bayes: [0]
Resposta Árvore de Decisão: [0]
Resposta Random Forest: [0]
Resposta KNN: [0]
Resposta Regressão Logística: [0]
Resposta Máquina de Vetores de Suporte: [0]
Resposta Redes Neurais: [0]


Observe que a resposta de todos os classificadores convergiram para um só resultado, indicando que o novo registro feito indica que o usuário não tem chance de pagar o que deve.

### Alguma dúvida? Entre em contato comigo:

- [Me envie um e-mail](mailto:alyssonmachado388@gmail.com);