In [None]:
# Passo 1: Importar as bibliotecas e o dataset
# Como fiz: Nessa etapa eu usei o mesmo modelo do colab e alterei apenas o dataset

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.utils import to_categorical

from tensorflow.keras.datasets import fashion_mnist  # Alterei o "cifar10" para "fashion_mnist"

import matplotlib.pyplot as plt
import numpy as np

In [None]:
# Passo 2: Carregamento de dados
# Como fiz: Alterei o modelo do colab para incluir o que estava no dataset

(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data() # Alterei o dataset de "cifar10" para "fashion_mnist"

# Mostrando o tamanho do dataset (dimensão)

print("Dimensões do conjunto de treinamento:", X_train.shape)
print("Dimensões do conjunto de teste:", X_test.shape)

# Classes presentes no dataset

classes = ['T-shirt', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot'] # Alterei as classes para ficarem correspondentes com o dataset utilizado
plt.figure(figsize=(10, 5))
for i in range(10):
    plt.subplot(2, 5, i + 1)
    plt.imshow(X_train[i])
    plt.title(classes[y_train[i]]) # [y_train], no fashion_mnist, é um vetor de uma dimensão, então o correto seria y_train[i], não y_train[i][0]
    plt.axis('off')
plt.show()

In [None]:
# Passo 3: Normalização dos dados
# Como fiz: Não fiz alterações do modelo do colab para esse

''' Explicação breve de normalização de dados (eu não entendia direito o que era): 
Ajuda a melhorar o desempenho de modelos de aprendizado de máquina, 
pois evita que valores muito grandes dominem os cálculos 
e facilita a convergência durante o treinamento.'''

X_train = X_train / 255.0
X_test = X_test / 255.0

# No fashion_mnist, os pixels variam de 0 a 255, ao dividí-los por 255, os valores variam entre a faixa 0 a 1

y_train = to_categorical(y_train, 10) # Essa parte não entendi, preciso de uma explicação
y_test = to_categorical(y_test, 10)

In [None]:
# Passo 4: Separação dos dados entre treino e teste
# Cada imagem do fashion_mnist é representada por uma matriz de pixels 28x28
# Como fiz: Alterei os valores do código original (32, 64, 128) para múltiplos de 28 (pixels do fashion_mnist)

model = Sequential([
    Conv2D(28, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D((2, 2)),
    Conv2D(56, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(112, (3, 3), activation='relu'),
    Flatten(),
    Dense(112, activation='relu'),
    Dropout(0.5),  # Para evitar overfitting
    Dense(10, activation='softmax')
])

# Terá como saída uma tabela de "model"

model.summary() 

NameError: name 'Sequential' is not defined

In [None]:
# Passo 5: Primeiro treino

model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

history = model.fit(X_train, y_train, epochs=10, batch_size=64, validation_split=0.2)

In [None]:
# Passo 6: Juntar as estatísticas do primeiro treino

test_loss, test_acc = model.evaluate(X_test, y_test, verbose=2)
print(f"Acurácia no conjunto de teste: {test_acc * 100:.2f}%")

In [None]:
# Passo 7: Montar os gráficos do primeiro teste

plt.figure(figsize=(12, 4))

# Gráficos de perda

plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], label='Treinamento')
plt.plot(history.history['val_loss'], label='Validação')
plt.title('Perda')
plt.xlabel('Época')
plt.ylabel('Perda')
plt.legend()

# Gráficos de acurácia

plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], label='Treinamento')
plt.plot(history.history['val_accuracy'], label='Validação')
plt.title('Acurácia')
plt.xlabel('Época')
plt.ylabel('Acurácia')
plt.legend()

# Expor o gráfico

plt.show()

In [None]:
# Passo 8: Aumento do dataset (para tornar o programa mais treinado)

datagen = ImageDataGenerator(
    rotation_range=10, # Basicamente mudamos o ângulo e o tamanho das imagens para que haja mais dados para treinar o programa
    width_shift_range=0.1,
    height_shift_range=0.1,
    horizontal_flip=False
)

# Somando os dados alterados

datagen.fit(X_train)

# Treinar o modelo novamente, agora com as novas imagens 

model.fit(datagen.flow(X_train, y_train, batch_size=64), epochs=10, validation_data=(X_test, y_test))

In [None]:
# Passo 9: Juntar as estatísticas do segundo treino
test_loss, test_acc = model.evaluate(X_test, y_test, verbose=2)
print(f"Acurácia no conjunto de teste: {test_acc * 100:.2f}%")

In [None]:
# Passo 10: Montar os gráficos do segundo teste

plt.figure(figsize=(12, 4))

# Gráficos de perda

plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], label='Treinamento')
plt.plot(history.history['val_loss'], label='Validação')
plt.title('Perda')
plt.xlabel('Época')
plt.ylabel('Perda')
plt.legend()

# Gráficos de acurácia

plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], label='Treinamento')
plt.plot(history.history['val_accuracy'], label='Validação')
plt.title('Acurácia')
plt.xlabel('Época')
plt.ylabel('Acurácia')
plt.legend()

# Expor o gráfico

plt.show()