<a href="https://colab.research.google.com/github/filipehcunha/filipehcunha/blob/main/examples/vision/ipynb/mnist_convnet.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Simple MNIST convnet

**Author:** [fchollet](https://twitter.com/fchollet)<br>
**Date created:** 2015/06/19<br>
**Last modified:** 2020/04/21<br>
**Description:** A simple convnet that achieves ~99% test accuracy on MNIST.

## Setup

In [None]:
import numpy as np
import keras
from keras import layers

## Prepare the data

In [None]:
# Parâmetros do modelo e dos dados
num_classes = 10               # Dígitos de 0 a 9 – total de 10 classes possíveis.
input_shape = (28, 28, 1)      # Formato das imagens: 28x28 pixels com 1 canal (escala de cinza).

#* x_train, y_train – conjunto principal (~90%) usado para AJUSTAR os pesos do modelo.
#* Esses dados são onde a rede “aprende” padrões e relações dos dígitos.

#* x_test, y_test – dados completamente novos, utilizados apenas no final para AVALIAR
#* se o modelo generaliza bem para dados reais. Garante uma avaliação imparcial.

# Carrega os dados e divide entre conjuntos de treino e teste
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

# Escala os valores dos pixels para o intervalo [0, 1]
x_train = x_train.astype("float32") / 255
x_test = x_test.astype("float32") / 255

# Garante que as imagens tenham a forma (28, 28, 1), adicionando uma dimensão de canal
x_train = np.expand_dims(x_train, -1)
x_test = np.expand_dims(x_test, -1)

# Exibe informações sobre o conjunto de treino e teste
print("x_train shape:", x_train.shape)
print(x_train.shape[0], "train samples")
print(x_test.shape[0], "test samples")

# Converte os rótulos das classes para vetores binários no formato one-hot
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

## Build the model

In [None]:

model = keras.Sequential(
    [
        keras.Input(shape=input_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation="softmax"),
    ]
)

model.summary()

## Train the model

In [None]:

batch_size = 128     # Número de amostras por lote durante o treinamento.
epochs = 15          # Número de vezes que o modelo verá todo o conjunto de treino.

# Compila o modelo com função de perda, otimizador e métrica
model.compile(
    loss="categorical_crossentropy",     # Perda usada para classificação multiclasse.
    optimizer="adam",                    # Otimizador eficiente e amplamente utilizado.
    metrics=["accuracy"],                # Métrica monitorada: acurácia.
)

# Treina o modelo com os dados de treino, utilizando 10% para validação
model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, validation_split=0.1)


## Evaluate the trained model

In [None]:

# Avalia o desempenho do modelo nos dados de teste (nunca vistos antes)
score = model.evaluate(x_test, y_test, verbose=0)

# Exibe a perda e a acurácia no conjunto de teste
print("Test loss:", score[0])
print("Test accuracy:", score[1])