# Dataset Fashion MNIST

- [Carregando as bibliotecas](#1)
- [Carregando o conjunto de dados do dataset MNIST](#2)
- [Gerando o nome das classes](#3)
- [Visualizar as primeiras 10 imagens do conjunto de treino](#4)
- [Partição dos dados de treino e teste](#5) 
- [Definir arquitetura do modelo](#6)
- [Treinamento do modelo](#7)
- [Gerar predições com o modelo](#8)
- [Visualizando a evolução do modelo pela função de acurácia e perda](#9)

Fashion-MNIST é um conjunto de dados de imagens de artigos da empresa de moda Zalando. Ele foi criado como um substituto direto para o conjunto de dados MNIST original, que consiste em dígitos manuscritos. O Fashion-MNIST possui 60.000 exemplos de treinamento e 10.000 exemplos de teste. Cada exemplo é uma imagem em tons de cinza de 28x28 pixels e está associado a um rótulo de uma das 10 classes.

A Zalando desenvolveu o Fashion-MNIST para fornecer um conjunto de dados mais desafiador para benchmarking de algoritmos de aprendizado de máquina em comparação com o MNIST. O MNIST é considerado muito fácil, com redes convolucionais e algoritmos clássicos alcançando altas taxas de precisão, como 99,7% e 97%, respectivamente. O Fashion-MNIST apresenta uma alternativa mais complexa, com a intenção de representar tarefas de visão computacional modernas.

O MNIST é amplamente utilizado pela comunidade de IA/aprendizado de máquina/ciência de dados como referência para validar algoritmos. No entanto, alguns pesquisadores acreditam que depender exclusivamente do MNIST pode ser limitante e não refletir o desempenho em tarefas mais desafiadoras. Eles argumentam que muitas boas ideias podem não funcionar bem no MNIST e que muitas ideias ruins podem ter sucesso nele, mas não se transferirem para problemas reais.

### Carregando as bibliotecas <a id="1" ></a>

In [None]:
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.utils import to_categorical
from sklearn.model_selection import train_test_split
from datetime import datetime

train_fas e test_fas são o conjunto de treinamento dos dados do modelo usados para aprendizado.

### Carregar o conjunto de dados Fashion MNIST <a id="2" ></a>

In [None]:
train_fas = pd.read_csv("/kaggle/input/fashion-mnist/fas_test.csv")
test_fas = pd.read_csv("/kaggle/input/fashion-mnist/fas_train.csv")
train_fas.info()
test_fas.info()

Cada imagem é mapeada com um só label. 
Já que o nome das classes não são incluídas na base de dados, 
Os dados são armazenados em categorias para serem plotados com o respectivo nome de Classe.

### Gerando o nome das classes <a id="3" ></a>

In [None]:
class_names = ['Camiseta', 'Calças', 'Suéter', 'Vestido', 'Casaco',
               'Sandália', 'Camisa', 'Tênis', 'Bolsa', 'Bota']

### Visualizar as primeiras 10 imagens do conjunto de treinamento <a id="4" ></a>

In [None]:

plt.figure(figsize=(10, 10))
for i in range(36):
    image = train_fas.iloc[i, 1:].values.reshape(28, 28)  # Reshape para o formato 28x28
    label = train_fas.iloc[i, 0]  # Rótulo da imagem (converte de one-hot encoding para valor inteiro)
    
    plt.subplot(6, 6, i + 1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    
    plt.imshow(image, cmap='gray')
    plt.title(class_names[label])
    plt.axis('off')

plt.show()

### Partição dos dados de treino e teste <a id="5" ></a>

In [None]:
x_train_fas = (train_fas.iloc[:,1:].values).astype('float32')/255 # divisão dos valores
y_train_fas = train_fas.iloc[:,0].values.astype('int32') # apenas classes
x_test_fas = (test_fas.iloc[:,1:].values).astype('float32')/255
y_test_fas = test_fas.iloc[:,0].values.astype('int32')
num_classes = 10 # número de classes existentes

### Converter rótulos para o formato adequado

In [None]:
x_train_fas = x_train_fas.reshape(x_train_fas.shape[0], 28, 28,1)
x_test_fas = x_test_fas.reshape(x_test_fas.shape[0], 28, 28,1)

### Realizar partição do dataset de treino e validação

In [None]:
x_train_fas, x_val_fas, y_train_fas, y_val_fas = \
train_test_split(x_train_fas, y_train_fas, test_size=0.20, random_state=42)

In [None]:
image_rows = 28
image_cols = 28
image_shape = (image_rows,image_cols,1) 

x_train_fas = x_train_fas.reshape(x_train_fas.shape[0],*image_shape)
x_test_fas = x_test_fas.reshape(x_test_fas.shape[0],*image_shape)
x_val_fas = x_val_fas.reshape(x_val_fas.shape[0],*image_shape)

y_train_fas = to_categorical(y_train_fas)
y_test_fas = to_categorical(y_test_fas)
y_val_fas = to_categorical(y_val_fas)

In [None]:
x_train_fas.shape,x_val_fas.shape, x_test_fas.shape, y_train_fas.shape, y_val_fas.shape, y_test_fas.shape

### Definir a arquitetura do modelo <a id="6" ></a>

In [None]:
model = keras.Sequential(
    [
        keras.Input(shape=image_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation="sigmoid")
    ]
)

print(model.summary())

### Compilação do modelo

In [None]:
model.compile(loss="categorical_crossentropy", optimizer="adam", metrics=["accuracy"])

### Treinamento do modelo <a id="7" ></a>

In [None]:
batch_size = 150
epochs = 250
history = model.fit(x_train_fas, y_train_fas, batch_size=batch_size, epochs=epochs, \
                    validation_data=(x_val_fas, y_val_fas))

### Avaliar o modelo no conjunto de treinamento

In [None]:
score_fas = model.evaluate(x_test_fas, y_test_fas, verbose=0)
print("Erro no teste:", round(score_fas[0], 5))
print("Acurácia no teste:", round(score_fas[1], 5))

### Gerar predições no conjunto de teste <a id="8" ></a>

In [None]:
predictions = model.predict(x_test_fas)

output_fas = pd.DataFrame({'id': test_fas.label, 'label': np.argmax(predictions, axis=1)})

### Visualizar as primeiras 10 imagens do conjunto de teste agora com classes definidas pelo modelo

In [None]:
plt.figure(figsize=(10, 10))
for i in range(36):
    image = test_fas.iloc[i, 1:].values.reshape(28, 28)  # Reshape para o formato 28x28
    label = output_fas.iloc[i, 0]  # Rótulo da imagem
    
    plt.subplot(6, 6, i + 1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    
    plt.imshow(image, cmap='gray')
    plt.title(class_names[label])
    plt.axis('off')

plt.show()

### Visualizando a evolução do modelo pela função de acurácia e perda <a id="9" ></a>

In [None]:
plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.title('model accuracy')
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train_fas', 'test_fas'], loc='upper left')
plt.show()

In [None]:
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('model loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc='upper left')
plt.show()