<a href="https://colab.research.google.com/github/gcanapa/base_mnist_usando_rede_neural_backpropagation_e_cnn/blob/main/base_mnist_usando_rede_neural_backpropagation_e_cnn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Importando as bibliotecas necessárias

In [1]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.datasets import mnist

Carregando dados do MNIST


In [2]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


Pré-processando dados 

In [3]:
# Normalizar os pixels para o intervalo [0, 1]
x_train = x_train / 255.0
x_test = x_test / 255.0

# Redimensionar as imagens para o tamanho desejado (por exemplo, 28x28 pixels)
x_train = np.expand_dims(x_train, axis=-1)
x_test = np.expand_dims(x_test, axis=-1)

# Codificar os rótulos usando one-hot encoding
y_train = tf.keras.utils.to_categorical(y_train, num_classes=10)
y_test = tf.keras.utils.to_categorical(y_test, num_classes=10)


**Defindo a arquitetura da Backpropagation**
# **Teste 1:**



In [None]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28, 1)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

Nesse exemplo, a rede neural possui uma camada de entrada flattenizada (transformando a imagem 28x28 em um vetor de tamanho 784), uma camada oculta com 128 neurônios usando a função de ativação ReLU, e uma camada de saída com 10 neurônios usando a função de ativação softmax para classificação multiclasse.

Compilando o modelo

In [None]:
model.compile(optimizer='sgd', loss='categorical_crossentropy', metrics=['accuracy'])


Utilizando o otimizador SGD (Stochastic Gradient Descent) e a função de perda categorical_crossentropy, que é comumente usada em problemas de classificação multiclasse.

Treinando o modelo usando a Backpropagation

In [None]:
model.fit(x_train, y_train, batch_size=32, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7f8377171f90>

Estamos treinando o modelo com os dados de treinamento (x_train e y_train) durante 10 épocas, com um tamanho de lote (batch_size) de 32.

Durante o treinamento, o TensorFlow irá automaticamente realizar a propagação para frente (forward propagation), onde os dados são passados pela rede neural, e a retropropagação do erro (backward propagation), onde os gradientes são calculados e os pesos da rede são atualizados usando o algoritmo de otimização escolhido (SGD neste caso).

Avaliando o desempenho:

In [None]:
test_loss, test_accuracy = model.evaluate(x_test, y_test)




A "loss" (perda) é uma medida do quão bem o modelo está se ajustando aos dados de treinamento. Quanto menor o valor da perda, melhor o modelo está se ajustando aos dados. O valor de 0.1602 indica uma boa adequação do modelo aos dados de treinamento.

A "accuracy" (precisão) é uma métrica que mede a taxa de acertos do modelo em relação aos rótulos verdadeiros dos exemplos de treinamento. Ela é expressa como uma porcentagem, variando de 0 a 1 (ou 0% a 100%). Uma precisão de 0.9552 ou 95.52% indica que o modelo está prevendo corretamente a classe correta para cerca de 95.52% dos exemplos de treinamento



---

# **Teste 2:**

Substituindo a função de ativação ReLU por tangente hiperbólica (tanh) na camada oculta.

In [None]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28, 1)),
    tf.keras.layers.Dense(128, activation='tanh'),
    tf.keras.layers.Dense(10, activation='softmax')
])

Otimizador e função de perda:

In [None]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

Utilizando o otimizador Adam e a função de perda sparse_categorical_crossentropy, que é usada quando os rótulos não estão codificados em one-hot encoding.

A função sparse_categorical_crossentropy espera rótulos na forma de inteiros, em vez de codificação one-hot. Portanto, você precisa garantir que os rótulos y_train estejam no formato correto antes de treinar o modelo.

Uma maneira de corrigir isso é ajustar a forma dos rótulos usando a função np.argmax() antes de chamar model.fit(). 

In [None]:
y_train = np.argmax(y_train, axis=1)

 Utilizando um tamanho de lote de 64 e treinando o modelo por 20 épocas.

In [None]:
model.fit(x_train, y_train, batch_size=64, epochs=20)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x7f83774de8c0>

Convertendo os dados para o formato de inteiros

In [None]:
y_test = np.argmax(y_test, axis=1)

Avaliando o desempenho

In [None]:
test_loss, test_accuracy = model.evaluate(x_test, y_test)



Loss: O valor de 0.0836 indica a média da perda para os exemplos do conjunto de teste. Essa perda é calculada usando a função de perda que você especificou ao compilar o modelo. Quanto menor o valor da perda, melhor o modelo está performando nos dados de teste.

Accuracy: O valor de 0.0990 indica a precisão média do modelo para os exemplos do conjunto de teste. Essa precisão é calculada como a taxa de acertos do modelo em relação aos rótulos verdadeiros dos exemplos do conjunto de teste. Uma precisão de 0.0990 ou 9.90% indica que o modelo está prevendo corretamente a classe correta apenas para cerca de 9.90% dos exemplos do conjunto de teste.



---


# **Teste 3:**

Aumentando a quantidade de neuronios na camada oculta para 256

In [4]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28, 1)),
    tf.keras.layers.Dense(256, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

In [5]:
model.compile(optimizer='sgd', loss='categorical_crossentropy', metrics=['accuracy'])

Vamos utilizar um batch_size de 64 e 20 épocas

In [6]:
model.fit(x_train, y_train, batch_size=64, epochs=20)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x7f5af1ed7c40>

In [7]:
test_loss, test_accuracy = model.evaluate(x_test, y_test)



Loss: O valor de 0.1519 indica uma boa adequação do modelo aos dados de treinamento.

Accuracy: Uma precisão de 0.9552 ou 95.52% indica que o modelo está prevendo corretamente a classe correta para cerca de 95.52% dos exemplos de treinamento



---

# Utilizando rede neural CNN

#Teste 1

Essas linhas de código abaixo importam as bibliotecas necessárias. O mnist é importado da biblioteca Keras.datasets e é usado para carregar o conjunto de dados MNIST. O Sequential é importado da biblioteca Keras.models e é usado para criar uma sequência de camadas da rede neural. Conv2D, MaxPooling2D, Flatten e Dense são importados da biblioteca Keras.layers e são usados para definir diferentes tipos de camadas da rede neural. to_categorical é importado da biblioteca Keras.utils e é usado para converter os rótulos de classe em formato one-hot.

In [8]:
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
from keras.utils import to_categorical

Essa linha de código abaixo carregam o conjunto de dados MNIST usando a função load_data() do módulo mnist do Keras.datasets. Ele retorna duas tuplas: uma contendo as imagens de treinamento (x_train) e os rótulos correspondentes (y_train), e a outra contendo as imagens de teste (x_test) e os rótulos correspondentes (y_test).

In [9]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()

Essas linhas de código abaixo redimensionam e normalizam as imagens de treinamento e teste. As imagens originais têm uma forma de (número de amostras, 28, 28), mas a camada de convolução espera uma entrada com uma dimensão adicional para representar os canais de cor. Portanto, usamos reshape para adicionar uma dimensão adicional de 1, resultando em uma forma de (número de amostras, 28, 28, 1). Em seguida, as imagens são convertidas para o tipo de dados float32 e normalizadas dividindo cada pixel por 255.0, para que os valores estejam na faixa entre 0 e 1.

In [10]:
x_train = x_train.reshape((-1, 28, 28, 1)).astype('float32') / 255.0
x_test = x_test.reshape((-1, 28, 28, 1)).astype('float32') / 255.0

Essas linhas de código abaixo convertem os rótulos de classe em formato one-hot usando a função to_categorical do Keras.utils. O formato one-hot codifica as classes como vetores binários, onde cada posição do vetor representa uma classe possível e é marcada com 1 se a amostra pertence àquela classe e 0 caso contrário.

In [11]:
y_train = to_categorical(y_train)
y_test = to_categorical(y_test)

Essas linhas de código abaixo definem a arquitetura da rede neural. A classe Sequential é inicializada para criar um modelo sequencial. Em seguida, diferentes camadas são adicionadas ao modelo usando o método add(). Primeiro, uma camada convolucional com 32 filtros de tamanho 3x3 e função de ativação ReLU é adicionada, com uma forma de entrada (28, 28, 1). Em seguida, uma camada de max pooling com janela 2x2 é adicionada para reduzir a dimensionalidade. Essa sequência de uma camada convolucional seguida por uma camada de max pooling é repetida com 64 filtros na segunda camada convolucional. Depois disso, a saída da camada de convolução é achatada para uma representação vetorial única usando a camada Flatten(). Duas camadas totalmente conectadas são adicionadas: uma camada oculta com 64 unidades e função de ativação ReLU, e uma camada de saída com 10 unidades (correspondendo às 10 classes do conjunto de dados MNIST) e função de ativação softmax.



In [12]:
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(64, activation='relu'))
model.add(Dense(10, activation='softmax'))

Essa linha de código abaixo compilam o modelo. O otimizador 'adam' é usado, que é uma variante do otimizador de descida do gradiente estocástico (SGD). A função de perda 'categorical_crossentropy' é usada, pois temos várias classes categóricas. Além disso, a métrica de avaliação 'accuracy' é especificada para monitorar o desempenho durante o treinamento.



In [13]:
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

Essa linha de código abaixo treinam o modelo. A função fit() é usada para ajustar o modelo aos dados de treinamento. x_train e y_train são os dados de treinamento, epochs=10 define o número de épocas de treinamento, batch_size=128 especifica o tamanho do lote usado durante o treinamento e validation_data=(x_test, y_test) indica os dados de validação usados durante o treinamento para avaliar o desempenho do modelo.






In [14]:
model.fit(x_train, y_train, epochs=10, batch_size=128, validation_data=(x_test, y_test))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7f5af1d379d0>

Para obter o resultado de desempenho da rede neural treinada, você pode usar o método evaluate() do modelo. O método evaluate() calcula a perda e a métrica especificada durante o treinamento (nesse caso, a precisão) nos dados de teste fornecidos (x_test e y_test). O valor da perda e a precisão são então retornados.

In [15]:
loss, accuracy = model.evaluate(x_test, y_test)
print('Test Loss:', loss)
print('Test Accuracy:', accuracy)

Test Loss: 0.03818608820438385
Test Accuracy: 0.9890999794006348


Esses números indicam um bom desempenho do modelo treinado. A perda é baixa e a precisão é alta, sugerindo que a rede neural está fazendo previsões precisas para a maioria das amostras de teste.

loss: 0.0382 indica o valor da perda obtido no conjunto de teste. A perda é de aproximadamente 0.0382.

accuracy: 0.9891 indica a precisão alcançada no conjunto de teste. A precisão é de aproximadamente 0.9891, o que significa que cerca de 98,91% das amostras de teste foram classificadas corretamente pela rede neural.



---
#Teste 2



Neste exemplo, estamos adaptando a arquitetura da CNN para lidar com imagens de tamanho 28x28 pixels e uma única camada de cor (escala de cinza). Portanto, fazemos algumas modificações, como o ajuste da forma de entrada, que agora é (28, 28, 1), e a remoção da camada de pooling adicional para preservar mais informações. Alteramos também a função de ativação para sigmoid.

In [18]:
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
from keras.utils import to_categorical

# Carregando o conjunto de dados MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# Pré-processamento dos dados
x_train = x_train.reshape(-1, 28, 28, 1).astype('float32') / 255.0
x_test = x_test.reshape(-1, 28, 28, 1).astype('float32') / 255.0
y_train = to_categorical(y_train)
y_test = to_categorical(y_test)

# Criando o modelo da CNN
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='sigmoid', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='sigmoid'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(64, activation='sigmoid'))
model.add(Dense(10, activation='softmax'))

# Compilando e treinando o modelo
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(x_train, y_train, epochs=10, batch_size=128, validation_data=(x_test, y_test))

# Avaliando o desempenho do modelo nos dados de teste
print('\n')
loss, accuracy = model.evaluate(x_test, y_test)
print('\nTest Loss:', loss)
print('Test Accuracy:', accuracy)


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10



Test Loss: 0.04353326931595802
Test Accuracy: 0.9860000014305115


Esses números indicam um bom desempenho do modelo treinado. A perda é baixa e a precisão é alta, sugerindo que a rede neural está fazendo previsões precisas para a maioria das amostras de teste.

loss: 0.0435 indica o valor da perda obtido no conjunto de teste. A perda é de aproximadamente 0.0435.

accuracy: 0.9860 indica a precisão alcançada no conjunto de teste. A precisão é de aproximadamente 0.9860, o que significa que cerca de 98,60% das amostras de teste foram classificadas corretamente pela rede neural.



---
#Teste 3


Neste exemplo, há algumas alterações nos parâmetros da arquitetura da CNN em comparação com o exemplo anterior:

A primeira camada convolucional agora usa 16 filtros com tamanho 5x5.
A segunda camada convolucional agora usa 32 filtros com tamanho 3x3.

In [17]:
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
from keras.utils import to_categorical

# Carregando o conjunto de dados MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# Pré-processamento dos dados
x_train = x_train.reshape(-1, 28, 28, 1).astype('float32') / 255.0
x_test = x_test.reshape(-1, 28, 28, 1).astype('float32') / 255.0
y_train = to_categorical(y_train)
y_test = to_categorical(y_test)

# Criando o modelo da CNN com uma variação de parâmetros
model = Sequential()
model.add(Conv2D(16, (5, 5), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(32, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(64, activation='relu'))
model.add(Dense(10, activation='softmax'))

# Compilando e treinando o modelo
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(x_train, y_train, epochs=10, batch_size=128, validation_data=(x_test, y_test))

# Avaliando o desempenho do modelo nos dados de teste
print('\n')
loss, accuracy = model.evaluate(x_test, y_test)
print('\nTest Loss:', loss)
print('Test Accuracy:', accuracy)


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10



Test Loss: 0.028864169493317604
Test Accuracy: 0.9907000064849854


loss: 0.0288 indica o valor da perda obtido no conjunto de teste. A perda é de aproximadamente 0.0288.

accuracy: 0.9907 indica a precisão alcançada no conjunto de teste. A precisão é de aproximadamente 0.9907, o que significa que cerca de 99,07% das amostras de teste foram classificadas corretamente pela rede neural.