# Rede Neural para a Base do Censo Usando Keras
#### Usando a biblioteca do python keras para criar uma rede neural usando a base de dados do censo.

### Pré-processamento da base de dados

In [None]:
# importando a biblioteca pandas do python
import pandas as pd

# atribuindo os registros da base de dados para o objeto "dataframe"
dataframe = pd.read_csv('census.csv', encoding = 'utf-8', sep = ',')

# separando os atributos previsores e classe 
previsores = dataframe.iloc[:, 0:14].values
classe = dataframe.iloc[:, 14].values

# importando a biblioteca sklearn do python
from sklearn.preprocessing import LabelEncoder
# LabelEncoder é uma função responsável por  normalizar rótulos
# o objetivo é transoformar variáveis categóricas em numéricas

# criando o objeto "labelencoder_previsores" para fazer a transformação dos atributos categóricos em numéricos
labelencoder_previsores = LabelEncoder()

# aplicando a transformação em todos os campos de dados categóricos usando o objeto criado e definido 
# "LabelEncoder_previsores"
previsores[:,1] = labelencoder_previsores.fit_transform(previsores[:,1])
previsores[:,3] = labelencoder_previsores.fit_transform(previsores[:,3])
previsores[:,5] = labelencoder_previsores.fit_transform(previsores[:,5])
previsores[:,6] = labelencoder_previsores.fit_transform(previsores[:,6])
previsores[:,7] = labelencoder_previsores.fit_transform(previsores[:,7])
previsores[:,8] = labelencoder_previsores.fit_transform(previsores[:,8])
previsores[:,9] = labelencoder_previsores.fit_transform(previsores[:,9])
previsores[:,13] = labelencoder_previsores.fit_transform(previsores[:,13])

# criando o objeto 'labelencoder_classe' para fazer a transformação dos atributos categóricos em numéricos
labelencoder_classe = LabelEncoder()

classe = labelencoder_classe.fit_transform(classe)

# importando a biblioteca sklearn do python
from sklearn.preprocessing import StandardScaler

# criando e configurando o objeto "scaler"
scaler = StandardScaler()

# aplicando o escaolonamento nos atributos previsores
previsores = scaler.fit_transform(previsores)

# importando a biblioteca sklearn do python
from sklearn.model_selection import train_test_split
# a função "train_test_split" tem a função de separar modelos de treinamento e modelos de teste em uma base 
#de dados

# separando as bases de dados entre modelos de treinamento e modelos de teste
previsores_treinamento, previsores_teste, classe_treinamento, classe_teste = train_test_split(previsores, 
                                                                                             classe,
                                                                                             test_size = 0.15, 
                                                                                             random_state = 0)

> O pré-processamento acima teve uma boa adapatação com o algoritmo feito. Outros testes foram feitos com pré-processamentos diferentes e os resultados não foram suficientemente bons.

### Usando o Keras para criar uma rede neural

In [2]:
# importando a biblioteca keras do python
import keras

from keras.models import Sequential
# 'Sequential' indica o modelo de rede neural que conecta a camada de neurônios de entrada, ocultas e saída

from keras.layers import Dense
# 'Dense' indica que os neurônios da camada anterior se conectam com os da camada posterior

Using TensorFlow backend.


In [None]:
# criando o objeto de configuração para a rede neural 'classificador'
classificador = Sequential()

In [4]:
# visualizando a quantidade de dados do dataframe
previsores_treinamento.shape

(27676, 14)

In [None]:
# adicionando a primeira camada de entrada a rede neural
classificador.add(Dense(units = 8, activation = 'relu', input_dim = 14))

In [None]:
# adicionando a segunda camada oculta a rede neural
classificador.add(Dense( units = 8, activation = 'relu'))

In [None]:
# adicionando a quarta camada de saída a rede neural
classificador.add(Dense(units = 1, activation = 'sigmoid'))

In [None]:
# configurando os parâmetros da rede neural
classificador.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

In [9]:
# realizando o treinamento com a base de dados
classificador.fit(previsores_treinamento, classe_treinamento, batch_size = 10, nb_epoch = 100)

  


Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.callbacks.callbacks.History at 0x7fb3ec0b2278>

In [None]:
# realizando a predição com a base de dados de teste
previsoes = classificador.predict(previsores_teste)

In [11]:
# observando na saída de dados as previsões feitas
print(previsoes)

[[1.4841139e-02]
 [2.1438897e-02]
 [2.4466136e-01]
 ...
 [3.3843826e-04]
 [4.3996010e-02]
 [6.8978620e-01]]


In [12]:
# observando as previsões ideais na saída de dados para a base de teste
print(classe_teste)

[0 0 0 ... 0 0 0]


In [None]:
# convertendo os registros previstos para uma base binária, com um limiar de 0.5
previsoes = (previsoes > 0.5)

In [14]:
# visualizando os valores previstos pelo algoritmo de forma binarizada
print(previsoes)

[[False]
 [False]
 [False]
 ...
 [False]
 [False]
 [ True]]


### Observando a capacidade de predição do algoritmo

In [None]:
# importando a biblioteca sklearn do python
from sklearn.metrics import accuracy_score, confusion_matrix

In [None]:
# visualizado a precisão de acertos do algoritmo
precisao = accuracy_score(classe_teste, previsoes)

In [17]:
# visualizando a precisão de acertos do algoritmo
print(precisao)

0.8452405322415558


O algoritmo obteve **84.52%** de precisão de acertos para a base de dados de acerto.

In [None]:
# criando a matriz de confusão 
matriz = confusion_matrix(classe_teste, previsoes)

In [19]:
# observando a matriz de confusão
print(matriz)

[[3462  231]
 [ 525  667]]


Observe que houve muitos registros classificado de forma incorreta, mas no geral o algoritmo se saiu bem.

### Visualizando o balanceamento dos dados da classe

In [None]:
# importando a biblioteca collections do python
import collections

In [21]:
# observando a quantidade de registros para cada classe da base de dados de teste
collections.Counter(classe_teste)

Counter({0: 3693, 1: 1192})

### Alguma dúvida? Entre em contato comigo:

- [Me envie um e-mail](mailto:alysson.barbosa@ee.ufcg.edu.br);