# Redes Neuronales
## Fashion detector 

In [None]:
# dependencias necesarias
from pathlib import Path

import numpy as np
import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Input, Dropout, Convolution2D, MaxPooling2D, Flatten
from tensorflow.keras.preprocessing.image import load_img, img_to_array, ImageDataGenerator
from tensorflow.keras.preprocessing import image_dataset_from_directory
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.layers.experimental.preprocessing import Rescaling

from sklearn.metrics import accuracy_score, confusion_matrix

#import warnings
#warnings.filterwarnings('ignore')

# configuración para que las imágenes se vean dentro del notebook
%matplotlib inline

In [None]:
# obtenemos las imágenes (x) y salidas/categorías (y) del dataset
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()

### 1) Análisis exploratorio sobre el conjunto de datos.  
Este es un dataset de 70000 imágenes en blanco y negro de 28x28 pixeles, de 10 categorías de prendas, divididas en un set de train con 60000 imágenes y otro de test de 10000. 

In [None]:
print('Cantidad y tamaño de imágenes de train:')
x_train.shape  

In [None]:
print('Cantidad y tamaño de imágenes de test:')
x_test.shape

In [None]:
# clases de prendas
CLASES = ["T-shirt/top", "Trouser", "Pullover", 
          "Dress", "Coat", "Sandal", "Shirt",
          "Sneaker", "Bag", "Ankle boot"]

Ejemplos de la imágenes sin modificaciones:

In [None]:
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(x_train[i], cmap=plt.cm.binary)
    plt.xlabel(CLASES[y_train[i]])
plt.show()

Las categorías de prendas son las siguientes:

In [None]:
for clase in CLASES:
    print(clase)

A partir de los gráficos siguientes, podemos notar que el set de datos está completamente balanceado tanto en train como test. En el set de train, hay 6000 imágenes de cada tipo de prenda, mientras que en el set de test hay 1000 imágenes de cada uno.

In [None]:
# función para contar y graficar la cantidad de prendas por tipo
def distribucion(salidas, titulo=''):
    CANTIDADES = [0,0,0,0,0,0,0,0,0,0]
    for salida in salidas:
        CANTIDADES[salida] += 1
        
    display(titulo)
    plt.pie(CANTIDADES, labels=CLASES, autopct="%0.1f %%")

In [None]:
distribucion(y_train, 'Distribución de train')

In [None]:
distribucion(y_test, 'Distribución de test')

### 2) Machine Learning. 

##### Reescalar imágenes  
En primera instancia reescalamos los valores de las imágenes, tanto en test como en train. Esto se puede comprobar en los siguientes gráficos que muestran el rango de valores que posee una imagen del dataset antes y después de reescalar.

In [None]:
# reescalamos los valores de las imágenes
x_train_r = x_train/ 255.0
x_test_r = x_test / 255.0

In [None]:
print('Antes de escalar:')
plt.figure()
plt.imshow(x_train[0])
plt.colorbar()
plt.grid(False)
plt.show()

In [None]:
print('Después de escalar:')
plt.figure()
plt.imshow(x_train_r[0])
plt.colorbar()
plt.grid(False)
plt.show()

##### Modificar el tamaño de las imágenes 
En cuanto al tamaño de las imágenes, optamos por NO modificarlo, debido a que ya es lo suficientemente pequeño como para entrenar sin demorar demasiado.

#### Funciones para graficar

In [None]:
# función para graficar la curva de aprendizaje
def curva_aprendizaje(historial):
    plt.plot(historial.history['accuracy'], label='train')
    plt.plot(historial.history['val_accuracy'], label='test')
    plt.title('Accuracy over train epochs')
    plt.ylabel('Accuracy')
    plt.xlabel('Epoch')
    plt.legend(loc='upper left')
    plt.show()

In [None]:
# función para graficar la matriz de confusión
def matriz_confusion(modelo, dt_x, dt_y, title=''):
    predictions = modelo.predict(dt_x)
    pred_label = [np.argmax(i) for i in predictions]
    labels = dt_y
    
    conf_matrix = confusion_matrix(labels, pred_label)

    ax = sns.heatmap(conf_matrix, 
                cmap='Blues', 
                xticklabels=CLASES, 
                yticklabels=CLASES,
                annot=True,
                fmt='d')

    plt.xlabel('Predicted class') 
    plt.ylabel('True class') 
    
    print(title)
    plt.show()

#### Entrenamiento y evaluación  
Para este análisis decidimos definir y evaluar diversas redes neuronales.

En un principio definimos una red MLP con determinados parámetros, y en base a ella, probamos otras redes a las cuales les fuimos modificando diversas características como cantidad de capas y de neuronas, cantidad de épocas, tamaño del batch, tipo de función de activación, nivel de dropout, etc. 

Luego...

#### REDES NEURONALES 1, 1-a y 1-b
La red 1 obtuvo valores de accuracy por encima del 70%, tanto para train como para test, ya en la primera época. Este valor fue aumentando hasta alcanzar un accuracy superior al 90% para train y al 87% para test en la última época.  
Además, al observar la curva de aprendizaje, podemos corroborar que no hay sobreentrenamiento, ya que la diferencia del accuracy en train y test, es tan solo del 3% aproximadamente. Sin embargo, a medida que pasan las épocas, estas líneas parecen ir separándose, por lo cual entrenamos una red (1-a) con las mismas características, pero con 80 épocas. Tras analizar la curva de aprendizaje de esta última, comprobamos que el error creció y que la distancia entre las líneas de train y test continúa aumentando, lo cual, si bien sube más los valores del accuracy en test, podría llegar a generar algo de sobreentrenamiento si continuamos agregando épocas.  
También decidimos probar a entrenar la red con un batch más pequeño (1-b) y evaluar las medidas obtenidas, pero notamos que no hubo grandes modificaciones en el accuracy. En general, de los 3 casos, hasta ahora, el mejor es el primero, ya que se obtuvo un accuracy mayor en el set de test.  
Con respecto a las matrices de confusión, podemos ver que, son bastante similares en los 3 casos. En general, si bien hay muchos aciertos, también hay predicciones erróneas, pero en las clases de prendas que son similares (remera y camisa, botas y zapatillas, por ejemplo), lo cual tiene sentido.

##### Red Neuronal 1:
* Tipo: MLP.
* Capas: 3 densas, con 20, 20 y 10 neuronas en ese orden.
* Dropout: no aplica.
* Función de activación: 'tanh' en la primeras capas y 'softmax' en la de salida.
* Épocas: 25.
* Tamaño del batch: 250.

In [None]:
model_mlp_1 = Sequential([
    Flatten(input_shape=(28, 28, 1)),
    Dense(20, activation='tanh'),
    Dense(20, activation='tanh'),
    Dense(len(CLASES), activation='softmax'),
])

model_mlp_1.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_mlp_1.summary()

In [None]:
history_mlp_1 = model_mlp_1.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_mlp_1)

In [None]:
matriz_confusion(model_mlp_1, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_mlp_1, x_test_r, y_test, 'Matriz de confusión - Test')

##### Red Neuronal 1-a:
* Tipo: MLP.
* Capas: 2 densas, con 20, 20 y 10 neuronas en ese orden.
* Dropout: no aplica.
* Función de activación: 'tanh' en la primer capa y 'softmax' en la de salida.
* **Épocas: 80.**
* Tamaño del batch: 250.

In [None]:
model_mlp_1a = Sequential([
    Flatten(input_shape=(28, 28, 1)),
    Dense(20, activation='tanh'),
    Dense(20, activation='tanh'),
    Dense(len(CLASES), activation='softmax'),
])

model_mlp_1a.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_mlp_1a.summary()

In [None]:
history_mlp_1a = model_mlp_1a.fit(
    x_train_r,
    y_train,
    epochs=80,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_mlp_1a)

In [None]:
matriz_confusion(model_mlp_1a, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_mlp_1a, x_test_r, y_test, 'Matriz de confusión - Test')

##### Red Neuronal 1-b:
* Tipo: MLP.
* Capas: 2 densas, con 20, 20 y 10 neuronas en ese orden.
* Dropout: no aplica.
* Función de activación: 'tanh' en la primer capa y 'softmax' en la de salida.
* Épocas: 25.
* **Tamaño del batch: 125.**

In [None]:
model_mlp_1b = Sequential([
    Flatten(input_shape=(28, 28, 1)),
    Dense(20, activation='tanh'),
    Dense(20, activation='tanh'),
    Dense(len(CLASES), activation='softmax'),
])

model_mlp_1b.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_mlp_1b.summary()

In [None]:
history_mlp_1b = model_mlp_1b.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=125,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_mlp_1b)

In [None]:
matriz_confusion(model_mlp_1b, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_mlp_1b, x_test_r, y_test, 'Matriz de confusión - Test')

#### REDES NEURONALES 2, 2-a y 2-b  
Para la red 2, mantuvimos los valores de la red 1, a excepción del número de capas y neuronas, que decidimos aumentar. Tras el entrenamiento, esta obtuvo una diferencia mayor en el accuracy con respecto a la red 1 en ambos sets. Además, podemos ver que el error, para esta red con más parámetros, disminuyó.  
Tras modificar la cantidad de épocas en el entrenamiento (red 2-a), también pudimos comprobar que, si bien aumentaba la métrica en train, esta comenzaba a alejarse de los valores de test, confirmando nuevamente que si continuáramos agregando épocas, podría llegar a sobreentrenar.  
Por otra parte, decidimos probar una red con mucha más cantidad de capas y neuronas (2-b). Tras entrenarla, comprobamos que tan solo en 10 épocas el accuracy llegaba a valores del 10%, lo cual indica que tener una gran cantidad de parámetros no es bueno, tal y como vimos en la teoría. Esto también se puede comprobar en las matrices de confusión, ya que la red solo predice Shirt.

##### Red Neuronal 2:
* Tipo: MLP.
* **Capas: 10 densas, con 60, 60, 60, 60, 40, 40, 40, 20, 20 y 10 neuronas en ese orden.**
* Dropout: no aplica.
* Función de activación: 'tanh' en cada capa y 'softmax' en la de salida.
* Épocas: 25.
* Tamaño del batch: 250.

In [None]:
model_mlp_2 = Sequential([
    Flatten(input_shape=(28, 28, 1)),
    Dense(60, activation='tanh'),
    Dense(60, activation='tanh'),
    Dense(60, activation='tanh'),
    Dense(60, activation='tanh'),   
    Dense(40, activation='tanh'),
    Dense(40, activation='tanh'),
    Dense(40, activation='tanh'),
    Dense(20, activation='tanh'),
    Dense(20, activation='tanh'),
    Dense(len(CLASES), activation='softmax'),
])

model_mlp_2.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_mlp_2.summary()

In [None]:
history_mlp_2 = model_mlp_2.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_mlp_2)

In [None]:
matriz_confusion(model_mlp_2, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_mlp_2, x_test_r, y_test, 'Matriz de confusión - Test')

##### Red Neuronal 2-a:
* Tipo: MLP.
* **Capas: 10 densas, con 60, 60, 60, 60, 40, 40, 40, 20, 20 y 10 neuronas en ese orden.**
* Dropout: no aplica.
* Función de activación: 'tanh' en cada capa y 'softmax' en la de salida.
* **Épocas: 80.**
* Tamaño del batch: 250.

In [None]:
model_mlp_2a = Sequential([
    Flatten(input_shape=(28, 28, 1)),
    Dense(60, activation='tanh'),
    Dense(60, activation='tanh'),
    Dense(60, activation='tanh'),
    Dense(60, activation='tanh'),   
    Dense(40, activation='tanh'),
    Dense(40, activation='tanh'),
    Dense(40, activation='tanh'),
    Dense(20, activation='tanh'),
    Dense(20, activation='tanh'),
    Dense(len(CLASES), activation='softmax'),
])

model_mlp_2a.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_mlp_2a.summary()

In [None]:
history_mlp_2a = model_mlp_2a.fit(
    x_train_r,
    y_train,
    epochs=80,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_mlp_2a)

In [None]:
matriz_confusion(model_mlp_2a, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_mlp_2a, x_test_r, y_test, 'Matriz de confusión - Test')

##### Red Neuronal 2-b:
* Tipo: MLP.
* **Capas: 31 densas, 3 de 200 neuronas, 7 de 120, 6 de 100, 5 de 80, 4 de 60, 3 de 40, 2 de 20 y la última de 10 neuronas, en ese orden.**
* Dropout: no aplica.
* Función de activación: 'tanh' en cada capa y 'softmax' en la de salida.
* **Épocas: 10.**
* Tamaño del batch: 250.

In [None]:
model_mlp_2b = Sequential([
    Flatten(input_shape=(28, 28, 1)),
    Dense(200, activation='tanh'),
    Dense(200, activation='tanh'),
    Dense(200, activation='tanh'),
    Dense(120, activation='tanh'),
    Dense(120, activation='tanh'),
    Dense(120, activation='tanh'),
    Dense(120, activation='tanh'),
    Dense(120, activation='tanh'),
    Dense(120, activation='tanh'),
    Dense(120, activation='tanh'),
    Dense(100, activation='tanh'),
    Dense(100, activation='tanh'),
    Dense(100, activation='tanh'),
    Dense(100, activation='tanh'),
    Dense(100, activation='tanh'),
    Dense(100, activation='tanh'),
    Dense(80, activation='tanh'),
    Dense(80, activation='tanh'),
    Dense(80, activation='tanh'),
    Dense(80, activation='tanh'),
    Dense(80, activation='tanh'),
    Dense(60, activation='tanh'),
    Dense(60, activation='tanh'),
    Dense(60, activation='tanh'),
    Dense(60, activation='tanh'),   
    Dense(40, activation='tanh'),
    Dense(40, activation='tanh'),
    Dense(40, activation='tanh'),
    Dense(20, activation='tanh'),
    Dense(20, activation='tanh'),
    Dense(len(CLASES), activation='softmax'),
])

model_mlp_2b.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_mlp_2b.summary()

In [None]:
history_mlp_2b = model_mlp_2b.fit(
    x_train_r,
    y_train,
    epochs=10,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_mlp_2b)

In [None]:
matriz_confusion(model_mlp_2b, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_mlp_2b, x_test_r, y_test, 'Matriz de confusión - Test')

#### RED NEURONAL 3:  
En esta red, con respecto a la primera, decidimos modificar la función de activación de las capas ocultas, reemplazando ‘tanh’ por ‘relu’, para evaluar si genera alguna diferencia. Tras el entrenamiento comprobamos que este cambio no generó mejores resultados, ya que el accuracy, tanto en train como en test, se redujo. También vimos que aumentó el error.    
* Tipo: MLP.
* Capas: 3 densas, con 20, 20 y 10 neuronas en ese orden.
* Dropout: no aplica.
* **Función de activación: 'relu' en la primeras capas y 'softmax' en la de salida.**
* Épocas: 25.
* Tamaño del batch: 250.

In [None]:
model_mlp_3 = Sequential([
    
    Flatten(input_shape=(28, 28, 1)),
    Dense(20, activation='relu'),
    Dense(20, activation='relu'),
    Dense(len(CLASES), activation='softmax'),
])

model_mlp_3.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_mlp_3.summary()

In [None]:
history_mlp_3 = model_mlp_3.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_mlp_3)

In [None]:
matriz_confusion(model_mlp_3, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_mlp_3, x_test_r, y_test, 'Matriz de confusión - Test')

#### RED NEURONAL 4:  
Para esta red, mantuvimos los valores de la red 1, a excepción del dropout, ya que decidimos aplicarle un 30% y analizar los resultados. Luego de entrenar, verificamos que esta modificación empeoró los valores del accuracy tanto para train, como para test. También vimos que aumentó el error.  
* Tipo: MLP.
* Capas: 3 densas, con 20, 20 y 10 neuronas en ese orden.
* **Dropout: 30% en capas ocultas.**
* Función de activación: 'tanh' en la primeras capas y 'softmax' en la de salida.
* Épocas: 25.
* Tamaño del batch: 250.

In [None]:
model_mlp_4 = Sequential([
    
    Flatten(input_shape=(28, 28, 1)),
    Dense(20, activation='relu'),
    Dropout(0.3),
    Dense(20, activation='relu'),
    Dropout(0.3),
    Dense(len(CLASES), activation='softmax'),
])

model_mlp_4.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_mlp_4.summary()

In [None]:
history_mlp_4 = model_mlp_4.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_mlp_4)

In [None]:
matriz_confusion(model_mlp_4, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_mlp_4, x_test_r, y_test, 'Matriz de confusión - Test')

MODIFICAR LO SIGUIENTE:

#### RED NEURONAL 6:
* Tipo: Convolucional.
* Capas: 2 convolucionales con 8 filtros de 4x4 con stride 1, un max pooling de 4x4 y 4 densas, con 30, 20, 20 y 10 neuronas en ese orden.
* Dropout: 20% en cada capa.
* Función de activación: 'tanh' en cada capa y 'softmax' en la salida.
* Épocas: 25.
* Tamaño del batch: 250.

In [None]:
model_conv_1 = Sequential([
    
    Convolution2D(input_shape=(28, 28, 1), filters=8, kernel_size=(4, 4), strides=1, activation='tanh'),
    Dropout(0.2),
    
    Convolution2D(filters=8, kernel_size=(4, 4), strides=1, activation='tanh'),
    Dropout(0.2),
    
    MaxPooling2D(pool_size=(4, 4)),
    
    Flatten(),
    
    Dense(30, activation='tanh'),
    Dropout(0.2),
    
    Dense(20, activation='tanh'),
    Dropout(0.2),
            
    Dense(20, activation='tanh'),
    Dropout(0.2),

    Dense(len(CLASES), activation='softmax'),
])

model_conv_1.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_conv_1.summary()

In [None]:
history_conv_1 = model_conv_1.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_conv_1)

In [None]:
matriz_confusion(model_conv_1, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_conv_1, x_test_r, y_test, 'Matriz de confusión - Test')

#### RED NEURONAL 7:
* Tipo: Convolucional.
* Capas: 2 convolucionales con 16 filtros de 4x4 con stride 1, un max pooling de 4x4 y 4 densas, con 30, 20, 20 y 10 neuronas en ese orden.
* Dropout: 20% en cada capa.
* Función de activación: 'tanh' en cada capa y 'softmax' en la salida.
* Épocas: 25.
* Tamaño del batch: 250.

In [None]:
model_conv_2 = Sequential([
    
    Convolution2D(input_shape=(28, 28, 1), filters=16, kernel_size=(4, 4), strides=1, activation='tanh'),
    Dropout(0.2),
    
    Convolution2D(filters=16, kernel_size=(4, 4), strides=1, activation='tanh'),
    Dropout(0.2),
    
    MaxPooling2D(pool_size=(4, 4)),
    
    Flatten(),
    
    Dense(30, activation='tanh'),
    Dropout(0.2),
    
    Dense(20, activation='tanh'),
    Dropout(0.2),
            
    Dense(20, activation='tanh'),
    Dropout(0.2),

    Dense(len(CLASES), activation='softmax'),
])

model_conv_2.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_conv_2.summary()

In [None]:
history_conv_2 = model_conv_2.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_conv_2)

In [None]:
matriz_confusion(model_conv_2, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_conv_2, x_test_r, y_test, 'Matriz de confusión - Test')

#### RED NEURONAL 8:
* Tipo: Convolucional.
* Capas: 2 convolucionales con 8 filtros de 8x8 con stride 1, un max pooling de 4x4 y 4 densas, con 30, 20, 20 y 10 neuronas en ese orden.
* Dropout: 20% en cada capa.
* Función de activación: 'tanh' en cada capa y 'softmax' en la salida.
* Épocas: 25.
* Tamaño del batch: 250.

In [None]:
model_conv_3 = Sequential([
    
    Convolution2D(input_shape=(28, 28, 1), filters=8, kernel_size=(8, 8), strides=1, activation='tanh'),
    Dropout(0.2),
    
    Convolution2D(filters=8, kernel_size=(8, 8), strides=1, activation='tanh'),
    Dropout(0.2),
    
    MaxPooling2D(pool_size=(4, 4)),
    
    Flatten(),
    
    Dense(30, activation='tanh'),
    Dropout(0.2),
    
    Dense(20, activation='tanh'),
    Dropout(0.2),
            
    Dense(20, activation='tanh'),
    Dropout(0.2),

    Dense(len(CLASES), activation='softmax'),
])

model_conv_3.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_conv_3.summary()

In [None]:
history_conv_3 = model_conv_3.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_conv_3)

In [None]:
matriz_confusion(model_conv_3, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_conv_3, x_test_r, y_test, 'Matriz de confusión - Test')

#### RED NEURONAL 9:
* Tipo: Convolucional.
* Capas: 2 convolucionales con 8 filtros de 4x4 con stride 2, un max pooling de 4x4 y 4 densas, con 30, 20, 20 y 10 neuronas en ese orden.
* Dropout: 20% en cada capa.
* Función de activación: 'tanh' en cada capa y 'softmax' en la salida.
* Épocas: 25.
* Tamaño del batch: 250.

In [None]:
model_conv_4 = Sequential([
    
    Convolution2D(input_shape=(28, 28, 1), filters=8, kernel_size=(8, 8), strides=2, activation='tanh'),
    Dropout(0.2),
    
    Convolution2D(filters=8, kernel_size=(4, 4), strides=2, activation='tanh'),
    Dropout(0.2),
    
    MaxPooling2D(pool_size=(4, 4)),
    
    Flatten(),
    
    Dense(30, activation='tanh'),
    Dropout(0.2),
    
    Dense(20, activation='tanh'),
    Dropout(0.2),
            
    Dense(20, activation='tanh'),
    Dropout(0.2),

    Dense(len(CLASES), activation='softmax'),
])

model_conv_4.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_conv_4.summary()

In [None]:
history_conv_4 = model_conv_4.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_conv_4)

In [None]:
matriz_confusion(model_conv_4, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_conv_4, x_test_r, y_test, 'Matriz de confusión - Test')

#### RED NEURONAL 10:
* Tipo: Convolucional.
* Capas: 4 convolucionales con 8 filtros de 4x4 con stride 1, un max pooling de 4x4 y 4 densas, con 30, 20, 20 y 10 neuronas en ese orden.
* Dropout: 20% en cada capa.
* Función de activación: 'tanh' en cada capa y 'softmax' en la salida.
* Épocas: 25.
* Tamaño del batch: 250.

In [None]:
model_conv_5 = Sequential([
    
    Convolution2D(input_shape=(28, 28, 1), filters=8, kernel_size=(8, 8), strides=2, activation='tanh'),
    Dropout(0.2),
    
    Convolution2D(filters=8, kernel_size=(4, 4), strides=2, activation='tanh'),
    Dropout(0.2),
    
    Convolution2D(filters=8, kernel_size=(8, 8), strides=2, activation='tanh'),
    Dropout(0.2),
    
    Convolution2D(filters=8, kernel_size=(4, 4), strides=2, activation='tanh'),
    Dropout(0.2),
    
    MaxPooling2D(pool_size=(4, 4)),
    
    Flatten(),
    
    Dense(30, activation='tanh'),
    Dropout(0.2),
    
    Dense(20, activation='tanh'),
    Dropout(0.2),
            
    Dense(20, activation='tanh'),
    Dropout(0.2),

    Dense(len(CLASES), activation='softmax'),
])

model_conv_5.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_conv_5.summary()

In [None]:
history_conv_5 = model_conv_5.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_conv_5)

In [None]:
matriz_confusion(model_conv_5, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_conv_5, x_test_r, y_test, 'Matriz de confusión - Test')

MODIFICAR LO SIGUIENTE:

#### RED NEURONAL 11:
* Tipo: Convolucional.
* Capas: 2 convolucionales con 8 filtros de 4x4 con stride 1, un max pooling de 4x4 y 4 densas, con 30, 20, 20 y 10 neuronas en ese orden.
* Dropout: 20% en cada capa.
* Función de activación: 'relu' en cada capa y 'softmax' en la salida.
* Épocas: 25.
* Tamaño del batch: 250.

In [None]:
model_conv_6 = Sequential([
    
    Convolution2D(input_shape=(28, 28, 1), filters=8, kernel_size=(8, 8), strides=2, activation='relu'),
    Dropout(0.2),
    
    Convolution2D(filters=8, kernel_size=(4, 4), strides=2, activation='relu'),
    Dropout(0.2),
    
    MaxPooling2D(pool_size=(4, 4)),
    
    Flatten(),
    
    Dense(30, activation='relu'),
    Dropout(0.2),
    
    Dense(20, activation='relu'),
    Dropout(0.2),
            
    Dense(20, activation='relu'),
    Dropout(0.2),

    Dense(len(CLASES), activation='softmax'),
])

model_conv_6.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy',],
)
    
model_conv_6.summary()

In [None]:
history_conv_6 = model_conv_6.fit(
    x_train_r,
    y_train,
    epochs=25,
    batch_size=250,
    validation_data=(x_test_r, y_test)
)

In [None]:
curva_aprendizaje(history_conv_6)

In [None]:
matriz_confusion(model_conv_6, x_train_r, y_train, 'Matriz de confusión - Train')
matriz_confusion(model_conv_6, x_test_r, y_test, 'Matriz de confusión - Test')

##### Aumentación de datos

In [None]:
train_generator_alterado = ImageDataGenerator(
    rescale=1/255,
    rotation_range=30,
    width_shift_range=0.3,
    height_shift_range=0.3,
    brightness_range=(0.5, 1.5),
    horizontal_flip=False,
    vertical_flip=False,
)