<a href="https://colab.research.google.com/github/sthefaniarcaro/Algoritmos-ordenacao/blob/main/cnn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [6]:
# imports necessários
import tensorflow as tf
from tensorflow.keras import layers,models
from tensorflow import keras
import numpy as np


In [7]:
# dataset MNIST (para uso de imagens)

# X_train são as imagens para treinamento
# y_train são os rótulos corretos para treinar o modelo

# X_test e y_test contém as imgs para testar o modelo depois que ele foi treinado
(X_train,y_train),(X_test,y_test)=keras.datasets.mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step


In [8]:
# processando o dataset

# testes para validar se os dados carregaram corretamente
X_train[0]

In [9]:
y_train[2]

np.uint8(4)

In [10]:
# normalização do dataset - valores entre 0 e 1
X_train=X_train/255

In [11]:
X_test=X_test/255

In [12]:
# redimensiona a matriz para a API do keras - 3 dimensões (linha, coluna, cor)
# a 3ª dimensão é usada para cores rgb, mas no caso usaremos cores monocromáticas
X_train=X_train.reshape(-1,28,28,1) #conjunto de treinamento

In [13]:
X_test=X_test.reshape(-1,28,28,1) #conjunto de teste

In [14]:
1# criar e treinar modelo de cnn usando tensorFlow - arquitetura da rede neural

# CAMADA Conv2D: aplicam filtro na cnn (matriz)
# filters é o número de filtros que a camada vai aprender, quanto maior, mais caracteristicas podem ser detectadas
# kernel_size é o tamanho do filtro (3x3)
# activation é a função de ativação (reLu), introduz a não linearidade (para aprender relações mais complexas)
# input_shape é o formato das imagens de entrada (apenas na primeira camada, 28x28)

# CAMADA MaxPooling2D: reduz as dimensões da imagem, mantendo somente o importante

# CAMADA Flatten: "achata" todas as caracteristicas (que estão em 2D ou 3D) para um único vetor (1D) - para ser usada na proxima camada

# CAMADA Dense (reLu): onde o modelo classifica as características extraídas

# CAMADA Dense (softmax): camada de saída - tem 10 neurônios, um para cada dígito possível
# a função de ativação softmax transforma a saída em probabilidade, somando 1
# quanto maior a probabilidade, mais alto indica qual digito o modelo acredita que a imagem é

# CAMADA Dropout é para combater o overfitting - ele desativa uma porcentagem de neurônios de uma cadama,
# assim força a rede a aprender outras características

# BatchNormalization para estabilizar o treinamento

convolutional_neural_network=models.Sequential([
  layers.Conv2D(filters=25,kernel_size=(3,3),use_bias=False,input_shape=(28,28,1)), # Removendo bias pois BatchNormalization tem seu próprio
  layers.BatchNormalization(),
  layers.Activation('relu'),
  layers.MaxPooling2D((2,2)),
  layers.Dropout(0.25),

  layers.Conv2D(filters=64,kernel_size=(3,3),use_bias=False),
  layers.BatchNormalization(),
  layers.Activation('relu'),
  layers.MaxPooling2D((2,2)),
  layers.Dropout(0.25),

  layers.Conv2D(filters=64,kernel_size=(3,3),use_bias=False),
  layers.BatchNormalization(),
  layers.Activation('relu'),

  layers.Flatten(),
  layers.Dense(64,use_bias=False),
  layers.BatchNormalization(),
  layers.Activation('relu'),
  layers.Dropout(0.5),

  layers.Dense(10,activation='softmax')
])

In [15]:
# estrutura da rede neural

# output shape: mostra as dimensões dos dados após passarem por cada camada
# None indica o tamanho do lote (batch size) que pode ser qualquer número (por isso none), os outros valores são as dimensões da img
# exemplo: (None, 11, 11, 64) -> 11 de altura e largura, 64 é a quantidade de filtros (mapas de caracteristicas) que a camada conv2d anteriori aprendeu a detectar

# param é o número de parametros treinaveis
# param conv2d = tamanho_do_filtro * tamanho_do_filtro * canais_de_entrada + 1 (bias)) * número_de_filtros
# param dense = (neurônios_de_entrada + 1 (bias)) * neurônios_de_saída

convolutional_neural_network.summary()

In [16]:
# compilando e treinando o modelo

# COMPILAÇÃO
# optimizer irá ajustar os pesos para minimizar os erros

# loss é a função de perda (mede o quão bom ou ruim o modelo esta performando)
# a função de perda cálcula a diferença do que o modelo previu e o valor real
# o objetivo do treinamento é minimizar a função de perda

# metrics é a métrica que observaremos no treinamento, 'accuracy' dirá a porcentagem das previsões corretas que o modelo faz

# TREINAMENTO
# X_train e y_train são os dados de entrada (imagens) e os rótulos que o modelo usará
# 1 epochs siginifica que o modelo passará por todo o conjunto de treinamento uma vez - aqui passará 10x

convolutional_neural_network.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
convolutional_neural_network.fit(X_train, y_train, epochs=10)

Epoch 1/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m48s[0m 24ms/step - accuracy: 0.8020 - loss: 0.6464
Epoch 2/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m82s[0m 24ms/step - accuracy: 0.9636 - loss: 0.1237
Epoch 3/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m45s[0m 24ms/step - accuracy: 0.9730 - loss: 0.0980
Epoch 4/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m45s[0m 24ms/step - accuracy: 0.9774 - loss: 0.0799
Epoch 5/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m46s[0m 24ms/step - accuracy: 0.9803 - loss: 0.0698
Epoch 6/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m46s[0m 24ms/step - accuracy: 0.9820 - loss: 0.0614
Epoch 7/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m83s[0m 25ms/step - accuracy: 0.9843 - loss: 0.0568
Epoch 8/10
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m82s[0m 25ms/step - accuracy: 0.9846 - loss: 0.0547
Epoch 9/

<keras.src.callbacks.history.History at 0x789578553ef0>

In [20]:
# fazendo previsões

# avaliando o modelo criado
convolutional_neural_network.evaluate(X_test,y_test)
y_predicted_by_model=convolutional_neural_network.predict(X_test)

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 7ms/step - accuracy: 0.9917 - loss: 0.0294
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 6ms/step


In [21]:
# para visualizarmos a probabilidade de cada digito conter na imagem
y_predicted_by_model[11]

array([1.6453562e-08, 8.5366901e-14, 7.4466285e-14, 1.4110061e-15,
       6.7514362e-12, 1.3171552e-08, 9.9999994e-01, 1.3356997e-15,
       5.7775007e-11, 2.5049906e-12], dtype=float32)

In [22]:
# qual digito teve a maior probabilidade
np.argmax(y_predicted_by_model[11])


np.int64(6)