# Deep Learning A Z Convolucional - MNIST cruzada

In [1]:
import keras
import numpy as np
import tensorflow as tf
import sklearn

In [2]:
keras.__version__, np.__version__, tf.__version__, sklearn.__version__

('3.6.0', '1.26.4', '2.17.0', '1.5.1')

In [3]:
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import InputLayer, Dense, Flatten, Conv2D, MaxPooling2D
from tensorflow.keras import utils as np_utils
import numpy as np
from sklearn.model_selection import StratifiedKFold

In [4]:
(X, y), (X_teste, y_teste) = mnist.load_data()
X = X.reshape(X.shape[0], 28, 28, 1) # Reshape dos dados de treino
X = X.astype('float32') # Conversão dos dados de treino para float
X /= 255 # Normalização dos dados de treino
y = np_utils.to_categorical(y, 10) # Conversão dos labels de treino para one-hot encoding

In [6]:
np.zeros(5)

array([0., 0., 0., 0., 0.])

In [9]:
y.shape, y.shape[0]

((60000, 10), 60000)

In [5]:
np.zeros(shape = (y.shape[0], 1)) # Matriz de zeros com o mesmo número de linhas que y (60000)
# O 1 é utilizado para deixar em formato de matriz

array([[0.],
       [0.],
       [0.],
       ...,
       [0.],
       [0.],
       [0.]])

In [6]:
seed = 5
np.random.seed(seed) # Utilizaremos uma seed para garantir a reprodutibilidade dos resultados

In [7]:
kfold = StratifiedKFold(n_splits = 5, shuffle=True, random_state = seed)
# Dividimos o dataset em 5 partes 

In [8]:
resultados = []
for indice_treinamento, indice_teste in kfold.split(X, np.zeros(shape = (y.shape[0], 1))):
  print("Índices treinamento: ", indice_treinamento, "Índice teste: ", indice_teste)
  classificador = Sequential()
  #Camada de convolução
  classificador.add(InputLayer(shape=(28, 28, 1)))
  classificador.add(Conv2D(32, (3, 3), activation='relu'))
  classificador.add(MaxPooling2D(pool_size=(2,2)))
  classificador.add(Flatten())
  # Camada oculta
  classificador.add(Dense(units=128, activation='relu'))
  # Camada saída
  classificador.add(Dense(units=10, activation='softmax'))
  classificador.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
  classificador.fit(X[indice_treinamento], y[indice_treinamento], batch_size = 128, epochs = 5) # Passando os dados de treino com o índice de treinamento (por conta do kfold)
  precisao = classificador.evaluate(X[indice_teste], y[indice_teste]) # Passando os dados de teste com o índice de teste
  resultados.append(precisao[1])

Índices treinamento:  [    0     1     2 ... 59997 59998 59999] Índice teste:  [    5     7    10 ... 59983 59985 59993]
Epoch 1/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 20ms/step - accuracy: 0.8670 - loss: 0.4915
Epoch 2/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 19ms/step - accuracy: 0.9770 - loss: 0.0797
Epoch 3/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 18ms/step - accuracy: 0.9851 - loss: 0.0517
Epoch 4/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 15ms/step - accuracy: 0.9902 - loss: 0.0337
Epoch 5/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 14ms/step - accuracy: 0.9927 - loss: 0.0253
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.9815 - loss: 0.0674
Índices treinamento:  [    1     2     5 ... 59995 59996 59999] Índice teste:  [    0     3     4 ... 59989 59997 59998]
Epoch 1/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━

In [9]:
resultados

[0.9818333387374878,
 0.9835000038146973,
 0.9856666922569275,
 0.984499990940094,
 0.9808333516120911]

In [10]:
results = np.array(resultados)

In [11]:
results.mean(), results.std()

(0.9832666754722595, 0.001749920508422236)