# Validação Cruzada
#### Aplicando a validação cruzada na base de dados de dígitos escrito a mão.

### Importação das Bases de Dados

In [15]:
# importando da biblioteca keras do python
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Flatten, Conv2D, MaxPooling2D
from keras.utils import np_utils

# importando a biblioteca numpy do python
import numpy as np

# importando da biblioteca sklearn
from sklearn.model_selection import StratifiedKFold

### Semente de Geração Randômica

In [16]:
# definindo um número randômico
seed = 5
# definindo uma semente de geração randômica
np.random.seed(seed)

### Carregamento da Base de Dados

In [17]:
# separando os atributos previsores dos atributos meta e definindo uma 
# base de dados de treinamento e outra de teste
(X, y), (X_teste, y_teste) = mnist.load_data()

### Pré-processamento dos Dados

In [18]:
# visualizando a dimensão dos atributos previsores
print(X.shape)

(60000, 28, 28)


In [19]:
# organizando a imagem com somente uma camada, dado que as cores
# não influenciarão no treinamento da rede neural
previsores = X.reshape(X.shape[0], 28, 28, 1)

# definindo os tipos de dados da matriz como um número flutuante
# de 32 bits
previsores = previsores.astype('float32')

# normalizando a base de dados para melhor processamento
previsores /= 255

# definindo os atributos meta como variáveis do tipo meta
classe = np_utils.to_categorical(y, 10)
# como existem 10 dígitos diferentes, criamos uma variável
# com 10 casas numéricas

### Validação Cruzada na Base de Dados

In [20]:
# configurando o objeto para realizar a validação cruzada
kfold = StratifiedKFold(n_splits = 5, shuffle = True, 
                       random_state = seed)

# criando uma lista vazia para armazenar os valores da 
# validação cruzada
resultados = []

### Estruturando a Rede Neural

In [21]:
# interando os dados para relização da validação cruzada
for indice_treinamento, indice_teste in kfold.split(previsores, np.zeros(shape = (classe.shape[0], 1))):
    
    # criando o objeto classificador
    classificador = Sequential()
    # adicionando a primeira camada de convolução
    classificador.add(Conv2D(32, (3, 3), input_shape = (28, 28, 1), activation = 'relu'))
    # adicionando a camada de pooling
    classificador.add(MaxPooling2D(pool_size = (2, 2)))
    # adicionando a camada de Flatten
    classificador.add(Flatten())
    # adicionando uma camada oculta na rede neural
    classificador.add(Dense(units = 128, activation = 'relu'))
    # adicionando uma camada de saída a rede neural
    classificador.add(Dense(units = 10, activation = 'softmax'))
    
    
    # definindo mais alguns parâmetros da rede neural
    classificador.compile(loss = 'categorical_crossentropy', optimizer = 'adam', metrics = ['accuracy'])
    
    # realizando o treinamento na rede neural
    classificador.fit(previsores[indice_treinamento], classe[indice_treinamento], batch_size = 128, 
                     epochs = 5)
    
    # obtendo a precisão nos acertos dos dados pela rede neural
    precisao = classificador.evaluate(previsores[indice_teste], classe[indice_teste])
    
    # adicionando os resultados da validação cruzada em uma lista
    resultados.append(precisao[1])

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


### Obtendo a Acurácia da Rede Neural

In [22]:
# visualizando a precisão da rede neural
print(precisao)

[0.057879772037267685, 0.9835000038146973]


In [24]:
# visualizando a lista de resultados
print(resultados)

[0.9829166531562805, 0.984083354473114, 0.9851666688919067, 0.984499990940094, 0.9835000038146973]


In [25]:
# obtendo a média da lista de resultados
media = sum(resultados) / len(resultados)

# visualizando a média dos resultados obtidos em validação cruzada
print(media)

0.9840333342552186
