Importar as bibliotecas

In [64]:
import numpy as np
import datetime
import tensorflow as tf
from tensorflow.keras.datasets import fashion_mnist

Importar o banco dados de treino e teste e depois testar os resultados de treino

In [65]:
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()

In [66]:
y_train.shape

(60000,)

In [67]:
for value in y_train[:10]:
    print(value)

9
0
0
3
0
2
7
2
5
5


**Normalizando as imagens**
- Dividimos cada pixel das imagens do banco de treinamento e teste, utilizando o maior valor que é 255.
- Com isso, cada pixel estará na faixa entre 0 e 1, pois dessa forma a rede neural vai ser treinada mais rapidamente.

In [68]:
x_train = x_train / 255.0
x_test = x_test / 255.0

In [69]:
x_train[0]

array([[0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        ],
       [0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        ],
       [0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.    

**Remodelando (reshaping) a base de dados**
- Como estamos trabalhando com uma rede neural densa, mudamos a dimensão das bases de dados para ficarem no formato de vetor

In [70]:
x_train.shape

(60000, 28, 28)

In [71]:
# Como a dimensão de cada imagem é 28 x 28, mudamos toda a base de dados para o formato: -1 (todos os elementos), altura * largura.
x_train = x_train.reshape(-1, 28*28)

In [72]:
x_train.shape

(60000, 784)

In [73]:
x_train[0]

array([0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.     

In [74]:
# Mudamos também a dimensão da base de teste
x_test = x_test.reshape(-1, 28*28)

In [75]:
x_test.shape

(10000, 784)

**Construção da Rede Neural Artificial**

- Definir o modelo: objeto do tipo sequencial ou seja, que segue um modelo de sequência de camadas

In [85]:
model = tf.keras.models.Sequential()

In [86]:
model

<keras.src.engine.sequential.Sequential at 0x1509b8820>

**Adiciona a primeira camada densa (fully-connected)**

Hyper-parameters da camada
- número de units/neurônios: 128
- função de ativação: ReLu
- input_shape (camada de entrada): 784 (tamanho da imagem/quantidade de pixel)

In [87]:
model.add(tf.keras.layers.Dense(units=128, activation='relu', input_shape=(784,)))

**Adiciona a primeira camada densa o Dropout**

- Dropout é uma técnica de regularização na qual alguns neurônios da camada tem seu valor mudado para zero, ou seja, durante o treinamento esses neurônios não serão atualizados. Com isso, temos menos chances de ocorrer overfiting.
- É setado como parâmetro para Dropout o valor de 20% como o paper sobre o conceito.

In [88]:
model.add(tf.keras.layers.Dropout(0.2))

**Adiciona a camada de saída**
- units: 10 (número de classes disponíveis no Fashion MNIST)
- função de ativação: softmax (visto que temos um problema com mais de 2 classes)

In [89]:
model.add(tf.keras.layers.Dense(units=10, activation='softmax'))

**Compila o modelo**
- Optmizer: adam
- Loss (função de erro): sparse softmax (categorical) crossentropy

In [90]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['sparse_categorical_accuracy'])
model.summary()

Model: "sequential_5"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_6 (Dense)             (None, 128)               100480    
                                                                 
 dropout_2 (Dropout)         (None, 128)               0         
                                                                 
 dense_7 (Dense)             (None, 10)                1290      
                                                                 
Total params: 101770 (397.54 KB)
Trainable params: 101770 (397.54 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [94]:
# Treina o modelo
model.fit(x_train, y_train, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x150a4e4f0>

In [95]:
test_loss, test_accuracy = model.evaluate(x_test, y_test)



In [97]:
print(f" Test accuracy {test_accuracy} | Test loss {test_loss}")

 Test accuracy 0.8712999820709229 | Test loss 0.35741984844207764
