# FULLY CONNECTED VS. CONVOLUTIONAL NEURAL NETWORK

## DATOS

In [2]:
# Importamos las librerías necesarias
import tensorflow as tf
import matplotlib.pyplot as plt
import cv2
import numpy as np
import random

In [None]:
# Cargamos los datos (x) de entrenamiento y test junto a sus etiquetas (y)
datos = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = datos.load_data()

# Imprimimos el número de muestras para entrenamiento y test
print(f'Número de muestras para entrenar: {len(x_train)}')
print(f'Número de muestras para probar: {len(x_test)}')

In [None]:
# Visualizamos una muestra aleatoria del conjunto de entrenamiento
indice = random.randint(0, len(x_train))
plt.axis('off')
plt.imshow(x_train[indice], cmap=plt.cm.binary_r);

In [5]:
def normalize(images):
  images = images/255
  return images

# Normalizamos los datos
x_train = normalize(x_train)
x_test = normalize(x_test)

<br>

## RED NEURONAL FULLY CONNECTED (MULTYLAYER PERCEPTRON)

En este ejemplo construiremos la red neuronal densa que se muestra acontinuación:

<center>
<img src=https://gitlab.com/luis.guayacan1/semillero_macv_2022-1/-/raw/main/S9-Activity/arquitectura.png width="700">
</center>

Si desean avanzar por su propia cuenta, o entender mejor el funcionamiento de algún método en particular, pueden encontrar la documentación oficial de tf.keras en [este enlace](https://www.tensorflow.org/api_docs/python/tf/keras/).

<br>

In [6]:
# Creamos el modelo 
model_fc = tf.keras.models.Sequential()
model_fc.add(tf.keras.layers.Flatten())
model_fc.add(tf.keras.layers.Dense(128, activation='relu'))
model_fc.add(tf.keras.layers.Dense(128, activation='relu'))
model_fc.add(tf.keras.layers.Dense(10, activation='softmax'))

In [7]:
# Definimos algunos parámetros importantes para el entrenamiento
model_fc.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [None]:
# Entrenamos el modelo
history_fc = model_fc.fit(x_train, y_train, epochs=3, batch_size=32)

In [None]:
# visualizamos la información de las capas de nuestro modelo
model_fc.summary()

In [None]:
# Ver la funcion de perdida en cada epoch
plt.xlabel("# Epoch");
plt.ylabel("Loss");
plt.plot(history_fc.history["loss"]);

In [None]:
# Evaluamos el modelo con los datos de test
val_loss, val_acc = model_fc.evaluate(x_test, y_test)

<br>

# RED NEURONAL CONVOLUCIONAL (CNN)

En este ejemplo construiremos la red neuronal convolucional que se muestra acontinuación:

<center>
<img src=https://gitlab.com/luis.guayacan1/semillero_macv_2022-1/-/raw/main/S11-Activity/CNN.png width="700">
</center>

In [8]:
# Creamos el modelo 
model_cnn = tf.keras.models.Sequential()
model_cnn.add(tf.keras.layers.Conv2D(32, (3,3), input_shape=(28,28,1),activation='relu'))
model_cnn.add(tf.keras.layers.MaxPooling2D(2,2))

model_cnn.add(tf.keras.layers.Conv2D(32, (3,3),activation='relu'))
model_cnn.add(tf.keras.layers.MaxPooling2D(2,2))

model_cnn.add(tf.keras.layers.Flatten())

model_cnn.add(tf.keras.layers.Dense(100, activation='relu'))
model_cnn.add(tf.keras.layers.Dense(10, activation='softmax'))

In [9]:
# Definimos algunos parámetros importantes para el entrenamiento
model_cnn.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [None]:
# Entrenamos el modelo
history_cnn = model_cnn.fit(x_train, y_train, epochs=3, batch_size=32)

In [None]:
# visualizamos la información de las capas de nuestro modelo
model_cnn.summary()

In [None]:
# Ver la funcion de perdida en cada epoch
plt.xlabel("# Epoch");
plt.ylabel("Loss");
plt.plot(history_cnn.history["loss"]);


In [None]:
# Evaluamos el modelo con los datos de test
val_loss, val_acc = model_cnn.evaluate(x_test, y_test)

<br>

# ACTIVIDAD

1. Explica cómo se obtiene (de dónde sale) la cantidad de parámetros **100480** de la capa **dense_2 (Dense)** de la red Fully Connected.

>> Da doble click en esta celda e ingresa tu respuesta <<

<br>

2. Explica cómo se obtiene (de dónde sale) la cantidad de parámetros **9248** de la capa **conv2d_5 (Conv2D)** de la red Convolucional.

>> Da doble click en esta celda e ingresa tu respuesta <<

<br>

3.   Escribe algunas razones por las que las redes convolucionales se desempeñan mejor que las fully connected cuando los datos son imágenes.

>> Da doble click en esta celda e ingresa tu respuesta <<

<br>

4. Varía la cantidad de epochs de las dos redes e identifica cuál parece ser el número "apropiado" de epochs para cada una según tu criterio (explica tu respuesta).
_Ten en cuenta que cada epoch de la CNN tarda aproximadamente 50 segundos._

>> Da doble click en esta celda e ingresa tu respuesta <<