## Ejercicio 2

Se buscará resolver la clasificación de los dígitos de MNIST usando la siguiente configuración:

```python
model = Sequential()
model.add(Input(shape=(28, 28, 1)))
model.add(Conv2D(F, kernel_size=K, strides=(S,S), activation=FUN))
model.add(MaxPooling2D(pool_size=(2,2)))   # -- opcional --
model.add(Flatten())
model.add(Dense(10,activation='softmax'))

model.summary()
```

Donde **F** es la cantidad de filtros o de mapas de características, **K** es el tamaño del kernel o máscara, **S** es el valor del stride y **FUN** es la función de activación de la capa de convolución.

La tabla que aparece a continuación sugiere los valores a utilizar. Se recomienda emplear Parada Temprana para reducir el tiempo de entrenamiento. Para ello utilice:

```python
from tensorflow.keras.callbacks import EarlyStopping  
es = EarlyStopping(monitor='val_accuracy', patience=5, min_delta=0.001)
```

Esto indica que, si el valor del accuracy sobre los datos de validación no mejora después de 5 épocas, el entrenamiento finaliza. Puede usarse el parámetro min_delta para indicar cuando la diferencia entre dos accuracy se considerará significativa. Luego agregue este objeto en el momento del entrenamiento por medio del párametro callbacks

```python
H = model.fit(x = X_train, y = Y_train, batch_size = LOTES,
              validation_data = (X_test, Y_test), epochs = 4000, callbacks = [es])
```

<p align="center">

<table>
<tr><th>Cant. de filtros</th><th>Tamaño del kernel o filtro</th><th>Stride</th><th>Función de activación</th><th>Max Pooling</th><th>Total de parámetros</th><th>Épocas</th><th>Accuracy Train</th><th>Accuracy Test</th></tr>
<tr><td>4</td><td>3x3</td><td>1</td><td>ReLU</td><td>Sí</td><td></td><td></td><td></td><td></td></tr>
<tr><td>16</td><td>3x3</td><td>1</td><td>ReLU</td><td>Sí</td><td></td><td></td><td></td><td></td></tr>
<tr><td>64</td><td>3x3</td><td>1</td><td>ReLU</td><td>Sí</td><td></td><td></td><td></td><td></td></tr>
<tr><td>4</td><td>7x7</td><td>1</td><td>ReLU</td><td>Sí</td><td></td><td></td><td></td><td></td></tr>
<tr><td>16</td><td>7x7</td><td>1</td><td>ReLU</td><td>Sí</td><td></td><td></td><td></td><td></td></tr>
<tr><td>64</td><td>7x7</td><td>1</td><td>ReLU</td><td>Sí</td><td></td><td></td><td></td><td></td></tr>
<tr><td>64</td><td>3x3</td><td>2</td><td>ReLU</td><td>No</td><td></td><td></td><td></td><td></td></tr>
<tr><td>64</td><td>3x3</td><td>3</td><td>ReLU</td><td>No</td><td></td><td></td><td></td><td></td></tr>
<tr><td>64</td><td>3x3</td><td>1</td><td>TanH</td><td>Sí</td><td></td><td></td><td></td><td></td></tr>
<tr><td>64</td><td>3x3</td><td>1</td><td>Sigmoide</td><td>Sí</td><td></td><td></td><td></td><td></td></tr>
</table>

</p>



In [5]:
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical
import numpy as np

(X_train, Y_train), (X_test, Y_test) = mnist.load_data()

# Normalizar los datos
Y_train= to_categorical(np.array(Y_train))
Y_test = to_categorical(np.array(Y_test))

# dimension de las imagenes sacadas del primer ejmeplo
IMG_SHAPE = X_train[0].shape # (28,28)
TARGET_CNT= len(Y_train[0])  # 10 dígitos/clases

#### Creación y entrenamiento del modelo

In [11]:
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dense, Flatten, Input
from tensorflow.keras.models import Sequential
from tensorflow.keras.callbacks import EarlyStopping  

F = 8        # cantidad de filtros
K = (3, 3)   # tamaño del kernel
S = 1        # stride
FUN = 'relu' # función de activación
LOTES = 32   # tamaño del lote
WITH_MAXPOOL = True  # si usar o no maxpooling

configs = [
	{
		'F': 4,
		'K': (3,3),
		'S': 1,
		'FUN': 'relu',
		'WITH_MAXPOOL': True
	},
	{
		'F': 16,
		'K': (3,3),
		'S': 1,
		'FUN': 'relu',
		'WITH_MAXPOOL': True
	},
	{
		'F': 64,
		'K': (3,3),
		'S': 1,
		'FUN': 'relu',
		'WITH_MAXPOOL': True
	},
	{
		'F': 4,
		'K': (7,7),
		'S': 1,
		'FUN': 'relu',
		'WITH_MAXPOOL': True
	},
	{
		'F': 16,
		'K': (7,7),
		'S': 1,
		'FUN': 'relu',
		'WITH_MAXPOOL': True
	},
	{
		'F': 64,
		'K': (7,7),
		'S': 1,
		'FUN': 'relu',
		'WITH_MAXPOOL': True
	},
	{
		'F': 64,
		'K': (3,3),
		'S': 2,
		'FUN': 'relu',	
		'WITH_MAXPOOL': False
	
	},
	{
		'F': 64,
		'K': (3,3),
		'S': 3,
		'FUN': 'relu',
		'WITH_MAXPOOL': False
	},
	{
		'F': 64,
		'K': (3,3),
		'S': 1,
		'FUN': 'tanh',
		'WITH_MAXPOOL': True
	},
	{
		'F': 64,
		'K': (3,3),
		'S': 1,
		'FUN': 'sigmoid',
		'WITH_MAXPOOL': True
	}
]



for config in configs:
    F = config['F']; K = config['K']; S = config['S']; FUN = config['FUN']; WITH_MAXPOOL = config['WITH_MAXPOOL']    
    model = Sequential()
    model.add(Input(shape=(28, 28, 1)))
    model.add(Conv2D(F, kernel_size=K, strides=(S,S), activation=FUN))
    if WITH_MAXPOOL:
        model.add(MaxPooling2D(pool_size=(2,2)))
    model.add(Flatten())
    model.add(Dense(10,activation='softmax'))
    
    total_params = model.count_params()
    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
    
    es = EarlyStopping(monitor='val_accuracy', patience=5, min_delta=0.001)
    H = model.fit(x = X_train, y = Y_train, batch_size = LOTES, validation_data = (X_test, Y_test), epochs = 4000, callbacks = [es], verbose=0)
    
    train_acc = H.history['accuracy'][-1]  
    val_acc = H.history['val_accuracy'][-1]
    epochs_trained = len(H.history['accuracy'])
    
    test_loss, test_acc = model.evaluate(X_test, Y_test, verbose=2)
    
    print("\n==============================")
    print(f"Filtros: {F}, Kernel: {K}, Stride: {S}, Activación: {FUN}, MaxPool: {WITH_MAXPOOL}")
    print(f"Total de parámetros: {total_params}")
    print(f"Épocas entrenadas: {epochs_trained}")
    print(f"Train accuracy: {train_acc:.4f}")
    print(f"Test accuracy: {test_acc:.4f}")


313/313 - 1s - 2ms/step - accuracy: 0.9709 - loss: 0.1052

Filtros: 4, Kernel: (3, 3), Stride: 1, Activación: relu, MaxPool: True
Total de parámetros: 6810
Épocas entrenadas: 11
Train accuracy: 0.9734
Test accuracy: 0.9709
313/313 - 0s - 2ms/step - accuracy: 0.9721 - loss: 0.1809

Filtros: 16, Kernel: (3, 3), Stride: 1, Activación: relu, MaxPool: True
Total de parámetros: 27210
Épocas entrenadas: 11
Train accuracy: 0.9905
Test accuracy: 0.9721
313/313 - 1s - 2ms/step - accuracy: 0.9747 - loss: 0.2121

Filtros: 64, Kernel: (3, 3), Stride: 1, Activación: relu, MaxPool: True
Total de parámetros: 108810
Épocas entrenadas: 10
Train accuracy: 0.9918
Test accuracy: 0.9747
313/313 - 0s - 1ms/step - accuracy: 0.9653 - loss: 0.1489

Filtros: 4, Kernel: (7, 7), Stride: 1, Activación: relu, MaxPool: True
Total de parámetros: 5050
Épocas entrenadas: 13
Train accuracy: 0.9747
Test accuracy: 0.9653
313/313 - 1s - 2ms/step - accuracy: 0.9744 - loss: 0.4768

Filtros: 16, Kernel: (7, 7), Stride: 1, Acti