Nom 1: Eric Escrich

Nom 2: Adrià Vilariño

# Repte 4: Fashion CNN

## Enunciat

En aquest repte classficarem les diferents peces de roba fent servir una **Xarxa Neuronal Convolucional**.

In [4]:
# Descarrega i prepara les dades del dataset fashion_mnist. En aquest cas, no
# transformarem la sortida del model a un vector de 0' i 1's, per tant, haurem
# d'escollir bé la funció de pèrdua a l'hora de fer l'entrenament de la xarxa.

import tensorflow as tf
from tensorflow import keras
import numpy as np
import matplotlib.pyplot as plt
from keras.utils import to_categorical
from keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D, BatchNormalization, LeakyReLU
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.optimizers import Adam

(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()

# Normalitzem dataset
x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

In [3]:
# Crea una Xarxa Neuronal amb 2 capes Convolucionals de 64 i 128 filtres, de
# mides 7x7 i 3x3. A cada capa li aplicarem la operació MaxPooling 2x2. Afegeix
# també una capa densa de 64 neurones abans de la capa de sortida. Experimenta
# amb les diferents opcions de l'hiperparàmetre padding.

model = Sequential()

# Primera capa convolucional amb 64 filtres de mida 7x7 i padding 'same'
model.add(Conv2D(64, kernel_size=(7, 7), activation='relu', padding='same', input_shape=(28, 28, 1)))
model.add(MaxPooling2D(pool_size=(2, 2)))

# Segona capa convolucional amb 128 filtres de mida 3x3 i padding 'same'
model.add(Conv2D(128, kernel_size=(3, 3), activation='relu', padding='same'))
model.add(MaxPooling2D(pool_size=(2, 2)))

# Aplanar les dades per a les capes denses
model.add(Flatten())

# Capa densa amb 64 neurones
model.add(Dense(64))

# Capa de sortida amb 10 neurones (una per cada classe) i activació softmax
model.add(Dense(10, activation='softmax'))

# Compilar el model
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

In [4]:
# Entrena el model i visualitza el resultat de l'evaluació amb les dades de validació
history = model.fit(x_train, y_train, epochs=10, batch_size=32, validation_data=(x_test, y_test))

# Avaluar el model amb les dades de test
loss, accuracy = model.evaluate(x_test, y_test)
print(f"Pèrdua del model: {loss}")
print(f"Precisió del model: {accuracy}")

Epoch 1/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 7ms/step - accuracy: 0.7956 - loss: 0.5671 - val_accuracy: 0.8848 - val_loss: 0.3175
Epoch 2/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 7ms/step - accuracy: 0.8973 - loss: 0.2836 - val_accuracy: 0.8931 - val_loss: 0.2876
Epoch 3/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 7ms/step - accuracy: 0.9106 - loss: 0.2478 - val_accuracy: 0.9063 - val_loss: 0.2635
Epoch 4/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 7ms/step - accuracy: 0.9209 - loss: 0.2154 - val_accuracy: 0.9034 - val_loss: 0.2722
Epoch 5/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 7ms/step - accuracy: 0.9305 - loss: 0.1906 - val_accuracy: 0.9108 - val_loss: 0.2488
Epoch 6/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 7ms/step - accuracy: 0.9381 - loss: 0.1700 - val_accuracy: 0.9118 - val_loss: 0.2492
Epoch 7/10

La capa **BatchNormalization** normalitza les entrades de la capa de manera que la mitja de la seva activació de sortida sigui 0 i la desviació estàndard 1.

La capa **Dropout** ajuda a evitar els error per sobreentrenament (overfitting). Aquesta tècnica es basa en ignorar certs conjunts de neurones de manera aleatòria durant la fase d'entrenament.

In [8]:
# Crea i entrena una CNN amb 4 capes convolucionals de 32, 32, 64 i 128 filtres
# i mida de 3x3. En comptes de la operació MaxPooling, aplicarem les capes
# BatchNormalization i Dropout al 25% a cadascuna d'elles. Configurarem el padding
# de manera que la sortida i l'entrada siguin de la mateixa mida.

# Per finalitzar la nostra xarxa, afegirem 2 capes denses de 512 i 128 neurones
# amb les capes BatchNormalization i Dropout al 50% abans de la capa de sortida.

model = Sequential()

# Primera capa convolucional amb 32 filtres de mida 3x3 i padding 'same'
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', padding='same', input_shape=(28, 28, 1)))
model.add(BatchNormalization())
model.add(Dropout(0.25))

# Segona capa convolucional amb 32 filtres de mida 3x3 i padding 'same'
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', padding='same'))
model.add(BatchNormalization())
model.add(Dropout(0.25))

# Tercera capa convolucional amb 64 filtres de mida 3x3 i padding 'same'
model.add(Conv2D(64, kernel_size=(3, 3), activation='relu', padding='same'))
model.add(BatchNormalization())
model.add(Dropout(0.25))

# Quarta capa convolucional amb 128 filtres de mida 3x3 i padding 'same'
model.add(Conv2D(128, kernel_size=(3, 3), activation='relu', padding='same'))
model.add(BatchNormalization())
model.add(Dropout(0.25))

# Aplanar les dades per a les capes denses
model.add(Flatten())

# Primera capa densa amb 512 neurones
model.add(Dense(512, activation='relu'))
model.add(BatchNormalization())
model.add(Dropout(0.5))

# Segona capa densa amb 128 neurones
model.add(Dense(128, activation='relu'))
model.add(BatchNormalization())
model.add(Dropout(0.5))

# Capa de sortida amb 10 neurones (una per cada classe) i activació softmax
model.add(Dense(10, activation='softmax'))

# Compilar el model
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# Entrenar el model
history = model.fit(x_train, y_train, epochs=10, batch_size=32, validation_data=(x_test, y_test))

# Avaluar el model amb les dades de test
loss, accuracy = model.evaluate(x_test, y_test)
print(f"Pèrdua del model: {loss}")
print(f"Precisió del model: {accuracy}")


Epoch 1/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m309s[0m 204ms/step - accuracy: 0.7565 - loss: 0.7342 - val_accuracy: 0.8821 - val_loss: 0.3209
Epoch 2/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m299s[0m 200ms/step - accuracy: 0.8784 - loss: 0.3483 - val_accuracy: 0.9078 - val_loss: 0.2559
Epoch 3/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m298s[0m 199ms/step - accuracy: 0.8961 - loss: 0.2914 - val_accuracy: 0.9147 - val_loss: 0.2296
Epoch 4/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m297s[0m 198ms/step - accuracy: 0.9063 - loss: 0.2651 - val_accuracy: 0.9192 - val_loss: 0.2175
Epoch 5/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m298s[0m 199ms/step - accuracy: 0.9192 - loss: 0.2290 - val_accuracy: 0.9248 - val_loss: 0.2183
Epoch 6/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m298s[0m 199ms/step - accuracy: 0.9307 - loss: 0.2006 - val_accuracy: 0.9257 - val_loss:

## Part opcional

Experimenta amb diferents configuracions de xarxa modificant el número de capes, morfologia, hiperparàmetres, etc i compara els resultats.

In [3]:
optional_model = Sequential([
    Conv2D(32, (3, 3), activation='relu', padding='same', input_shape=(28, 28, 1)),
    BatchNormalization(),
    Dropout(0.1),

    Conv2D(64, (3, 3), activation='relu', padding='same'),
    BatchNormalization(),
    Dropout(0.1),

    Conv2D(128, (3, 3), activation='relu', padding='same'),
    BatchNormalization(),
    Dropout(0.25),

    Conv2D(256, (3, 3), activation='relu', padding='same'),
    BatchNormalization(),
    Dropout(0.25),

    Flatten(),
    Dense(512),
    LeakyReLU(alpha=0.1),
    BatchNormalization(),
    Dropout(0.5),

    Dense(128),
    LeakyReLU(alpha=0.1),
    BatchNormalization(),
    Dropout(0.5),

    Dense(10, activation='softmax')
])

optional_model.compile(optimizer=Adam(learning_rate=0.0005), loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# Entrenar el model
history = model.fit(x_train, y_train, epochs=10, batch_size=32, validation_data=(x_test, y_test))

# Avaluar el model amb les dades de test
loss, accuracy = model.evaluate(x_test, y_test)
print(f"Pèrdua del model: {loss}")
print(f"Precisió del model: {accuracy}")


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/10
[1m  22/1875[0m [37m━━━━━━━━━━━━━━━━━━━━[0m [1m12:47[0m 414ms/step - accuracy: 0.4358 - loss: 1.9640

KeyboardInterrupt: 