
Imports e definição do dataset.

In [1]:
import tensorflow as tf
from tensorflow import keras
import matplotlib.pyplot as plt

Carregamento do dataset cifar-10

In [None]:
# Carregar o conjunto de dados CIFAR-10
cifar10 = keras.datasets.cifar10
#Carrega duas tuplas, representando os dados de treinamento e de teste.
#Cada tupla tem as imagens e os respectivos rótulos
(train_images, train_labels), (test_images, test_labels) = cifar10.load_data()
num_classes = 10

O código abaixo mostra as 10 primeiras imagens de treino e teste do cifar-10

In [None]:
# Defina as classes do CIFAR-10
class_names = ['Avião', 'Automóvel', 'Pássaro', 'Gato', 'Cervo',
               'Cachorro', 'Sapo', 'Cavalo', 'Navio', 'Caminhão']

# Crie um dicionário para mapear as classes para as imagens correspondentes
class_to_image = {}
for i in range(10):
    index = (test_labels == i).nonzero()[0][0]  # Encontre o primeiro índice da classe
    class_to_image[i] = test_images[index]

# Mostre uma imagem de cada classe
plt.figure(figsize=(10, 5))
for i in range(10):
    plt.subplot(2, 5, i + 1)
    plt.xticks([])  # Remova os rótulos do eixo x
    plt.yticks([])  # Remova os rótulos do eixo y
    plt.imshow(class_to_image[i])
    plt.xlabel(class_names[i])

plt.tight_layout()
plt.show()

Abaixo, convertemos os rótulos escalares (números de 0 a 9) para one-hot encoding.

Não é necessário realizar este passo, caso seja utilizada a função de custo esparse_categorical_cross_entropy

In [None]:
# Converter para codificação one-hot dos labels
train_labels = tf.keras.utils.to_categorical(train_labels, num_classes=num_classes)
test_labels = tf.keras.utils.to_categorical(test_labels, num_classes=num_classes)
#Não é necessário se utilizar como função de custo esparse_categorical_cross_entropy

Função que retorna uma rede neural para o cifar-10

In [None]:
# Crie o modelo de rede neural convolucional simples
def get_cifar10_network():
    model = keras.Sequential([
        keras.layers.Input(shape=(32, 32, 3)), #(32, 32, 3) porque as imagens são 32X32 e RGB, portanto, tendo 3 canais de cor
        keras.layers.Conv2D(32, (3, 3), activation='relu'),
        keras.layers.MaxPooling2D((2, 2)),
        keras.layers.Flatten(),
        keras.layers.Dense(64, activation='relu'),
        keras.layers.Dense(num_classes, activation='softmax')  # 10 classes de saída
    ])

    # Compile o modelo
    model.compile(optimizer='adam',
                  loss='categorical_crossentropy',#pode ser substituída pela esparse_categorical_cross_entropy
                  metrics=['accuracy'])

    model.summary()

    return model

Trecho para treinar e avaliar a rede neural.
O treino é realizado com os dados de treino e a avaliação do modelo é realizada nos dados de teste.

In [None]:
# Treine o modelo
model = get_cifar10_network()
model.fit(train_images, train_labels, epochs=10)

# Avalie o modelo no conjunto de teste
test_loss, test_accuracy = model.evaluate(test_images, test_labels)
print(f'Acurácia no conjunto de teste: {test_accuracy * 100:.2f}%')

Na célula abaixo, adicione o código para carregar os demais datasets

In [2]:
#Inclua o código para carregar os demais datasets

datasets = [
    keras.datasets.mnist,
    keras.datasets.fashion_mnist,
    keras.datasets.cifar10,
    keras.datasets.cifar100
]
#Carrega duas tuplas, representando os dados de treinamento e de teste.
#Cada tupla tem as imagens e os respectivos rótulos
all_data = [dataset.load_data() for dataset in datasets]
all_train = [data[0] for data in all_data]
all_test = [data[1] for data in all_data]

Tarefa
Escreva código para executar redes neurais nos seguintes datasets:

MNIST (pode aproveitar o codigo existente)
Fashion MNIST
CIFAR-10
CIFAR-100
Cada execução deve ser por 10 épocas.

Você deve preencher as funções a seguir para retornarem a rede neural com a melhor configuração que você conseguiu para cada dataset. O notebook deve ser entregue com a rede neural que obteve a melhor performance em cada conjunto de dados.

IMPORTANTE: as funções não devem TREINAR nem AVALIAR as redes neurais, apenas instanciá-las e retorná-las.

Ao final, preencha o dict results com o desempenho encontrado em cada execução.

In [22]:
def get_mnist_network():
  pass  # substitua pelo seu codigo

def get_fashion_mnist_network():
  pass  # substitua pelo seu codigo

def get_cifar10_network():
  num_classes = 10
  model = keras.Sequential([
      keras.layers.Input(shape=(32, 32, 3)), #(32, 32, 3) porque as imagens são 32X32 e RGB, portanto, tendo 3 canais de cor

      keras.layers.Conv2D(32, (3, 3), activation='relu'),
      keras.layers.BatchNormalization(),
      keras.layers.MaxPooling2D((2, 2)),
      keras.layers.Dropout(0.25),

      keras.layers.Conv2D(64, (3, 3), activation='relu'),
      keras.layers.BatchNormalization(),
      keras.layers.MaxPooling2D((2, 2)),
      keras.layers.Dropout(0.25),

      keras.layers.Conv2D(128, (3, 3), activation='relu'),
      keras.layers.BatchNormalization(),
      keras.layers.MaxPooling2D((2, 2)),
      keras.layers.Dropout(0.25),

      #keras.layers.Conv2D(64, (3, 3), activation='relu', padding='same'),
      #keras.layers.BatchNormalization(),
      #keras.layers.Conv2D(64, (3, 3), activation='relu', padding='same'),
      #keras.layers.BatchNormalization(),
      #keras.layers.MaxPooling2D((2, 2)),
      #keras.layers.Dropout(0.2),

      #keras.layers.Conv2D(128, (3, 3), activation='relu'),
      #keras.layers.BatchNormalization(),
      #keras.layers.Conv2D(128, (3, 3), activation='relu'),
      #keras.layers.BatchNormalization(),
      #keras.layers.MaxPooling2D((2, 2)),
      #keras.layers.Dropout(0.2),

      keras.layers.Flatten(),

      keras.layers.Dense(64, activation='relu'),
      
      keras.layers.Dense(num_classes, activation='softmax')  # 10 classes de saída
  ])

  # Compile o modelo
  model.compile(optimizer='adam',
                loss='sparse_categorical_crossentropy',#pode ser substituída pela esparse_categorical_cross_entropy
                metrics=['accuracy'])

  model.summary()
  return model

def get_cifar100_network():
  pass # substitua pelo seu codigo


In [23]:
model_generators = [
    get_mnist_network,
    get_fashion_mnist_network,
    get_cifar10_network,
    get_cifar100_network
]

def train_model(index):
    model = model_generators[index]()
    model.fit(*all_train[index], epochs=10)

    # Avalie o modelo no conjunto de teste
    test_loss, test_accuracy = model.evaluate(*all_test[index])
    print(f'Acurácia no conjunto de teste {index}: {test_accuracy * 100:.2f}%')
    return model

In [24]:
train_model(2)

Epoch 1/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m46s[0m 28ms/step - accuracy: 0.4402 - loss: 1.5623
Epoch 2/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m45s[0m 29ms/step - accuracy: 0.5814 - loss: 1.1822
Epoch 3/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m44s[0m 28ms/step - accuracy: 0.6281 - loss: 1.0467
Epoch 4/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m44s[0m 28ms/step - accuracy: 0.6619 - loss: 0.9598
Epoch 5/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m45s[0m 29ms/step - accuracy: 0.6829 - loss: 0.9031
Epoch 6/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m45s[0m 29ms/step - accuracy: 0.6986 - loss: 0.8587
Epoch 7/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m45s[0m 29ms/step - accuracy: 0.7116 - loss: 0.8228
Epoch 8/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m46s[0m 30ms/step - accuracy: 0.7215 - loss: 0.7963
Epoch 9/

<Sequential name=sequential_6, built=True>

Preencha o dict abaixo substituindo os None com a acuracia final (acc) e o tempo de treinamento (time) encontrado no seu experimento pra cada dataset

In [None]:
results = {
    "mnist": {"time": None, "acc": None},
    "fashion_mnist": {"time": None, "acc": None},
    "cifar10": {"time": None, "acc": None},
    "cifar100": {"time": None, "acc": None},
}