In [1]:
# Importa o TensorFlow, uma biblioteca popular para aprendizado de máquina e redes neurais.
import tensorflow as tf 

# Importa o Keras, que é uma API de alto nível para construir e treinar modelos, integrado ao TensorFlow.
import keras 

# Importa o Matplotlib, usado para visualização de dados e gráficos.
import matplotlib 

# Importa o NumPy, uma biblioteca fundamental para operações matemáticas e manipulação de arrays.
import numpy as np


In [2]:
# Importa o conjunto de dados MNIST, que contém imagens de dígitos escritos à mão (0-9).
from tensorflow.keras.datasets import mnist 

# Importa a classe Sequential para criar modelos de rede neural sequenciais (camada a camada).
from tensorflow.keras.models import Sequential 

# Importa diversas camadas que podem ser usadas no modelo:
# InputLayer: Define a camada de entrada.
# Dense: Camada totalmente conectada.
# Flatten: Transforma entradas multidimensionais em vetores.
# Conv2D: Camada de convolução para processamento de imagens.
# MaxPooling2D: Camada de pooling para redução dimensional.
from tensorflow.keras.layers import InputLayer, Dense, Flatten, Conv2D, MaxPooling2D 

# Importa o módulo utils do Keras (com alias np_utils) para ferramentas úteis, como manipulação de rótulos.
from tensorflow.keras import utils as np_utils 

# Importa o NumPy, uma biblioteca fundamental para operações matemáticas e manipulação de arrays.
import numpy as np

# Importa a classe StratifiedKFold do Scikit-learn para realizar validação cruzada estratificada.
# Essa técnica divide os dados em dobras (folds), garantindo que a proporção de classes seja mantida em cada uma delas.
from sklearn.model_selection import StratifiedKFold


In [3]:
(X, y), (X_teste, y_teste) = mnist.load_data()
X = X.reshape(X.shape[0], 28, 28, 1)
X = X.astype('float32')
X /= 255
y = np_utils.to_categorical(y, 10)

In [4]:
np.zeros(5)

array([0., 0., 0., 0., 0.])

In [5]:
y.shape, y.shape[0]

((60000, 10), 60000)

In [6]:
np.zeros(shape = (y.shape[0], 1))

array([[0.],
       [0.],
       [0.],
       ...,
       [0.],
       [0.],
       [0.]])

In [7]:
# Define uma semente fixa para o gerador de números aleatórios do NumPy.
# Isso garante que os resultados sejam reproduzíveis, pois as operações aleatórias sempre gerarão os mesmos resultados.
seed = 5
np.random.seed(seed)


In [8]:
# Cria um objeto StratifiedKFold para realizar validação cruzada estratificada.
# `n_splits = 5`: Divide os dados em 5 dobras (folds), ou seja, o modelo será treinado e validado 5 vezes, 
# usando 4 dobras para treinamento e 1 para validação em cada iteração.
# `shuffle=True`: Embaralha os dados antes de dividi-los nas dobras, para garantir uma distribuição mais uniforme.
# `random_state = seed`: Define a semente para garantir a reprodutibilidade ao embaralhar os dados.
kfold = StratifiedKFold(n_splits = 5, shuffle=True, random_state = seed)


In [9]:
resultados = []
for indice_treinamento, indice_teste in kfold.split(X, np.zeros(shape = (y.shape[0], 1))):
  print("Índices treinamento: ", indice_treinamento, "Índice teste: ", indice_teste)
  classificador = Sequential()
  classificador.add(InputLayer(shape=(28, 28, 1)))
  classificador.add(Conv2D(32, (3, 3), activation='relu'))
  classificador.add(MaxPooling2D(pool_size=(2,2)))
  classificador.add(Flatten())
  classificador.add(Dense(units=128, activation='relu'))
  classificador.add(Dense(units=10, activation='softmax'))
  classificador.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
  classificador.fit(X[indice_treinamento], y[indice_treinamento], batch_size = 128, epochs = 5)
  precisao = classificador.evaluate(X[indice_teste], y[indice_teste])
  resultados.append(precisao[1])

Índices treinamento:  [    0     1     2 ... 59997 59998 59999] Índice teste:  [    5     7    10 ... 59983 59985 59993]
Epoch 1/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 12ms/step - accuracy: 0.8649 - loss: 0.4920
Epoch 2/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 10ms/step - accuracy: 0.9770 - loss: 0.0807
Epoch 3/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 10ms/step - accuracy: 0.9857 - loss: 0.0496
Epoch 4/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 12ms/step - accuracy: 0.9888 - loss: 0.0356
Epoch 5/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 12ms/step - accuracy: 0.9916 - loss: 0.0284
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.9797 - loss: 0.0610
Índices treinamento:  [    1     2     5 ... 59995 59996 59999] Índice teste:  [    0     3     4 ... 59989 59997 59998]
Epoch 1/5
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━

In [10]:
resultados

[0.981249988079071,
 0.9827499985694885,
 0.9854999780654907,
 0.984000027179718,
 0.984250009059906]

In [11]:
np.array(resultados).mean()

0.9835500001907349

In [12]:
np.array(resultados).std()

0.0014439535122410215