<a href="https://colab.research.google.com/github/mtermor/NTIC_DeepLearning/blob/main/CNN/Examen.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Dado que el entrenamiento de redes neuronales es una tarea  muy costosa, **se recomienda ejecutar el notebooks en [Google Colab](https://colab.research.google.com)**, por supuesto también se puede ejecutar en local.

Al entrar en [Google Colab](https://colab.research.google.com) bastará con hacer click en `upload` y subir este notebook. No olvide luego descargarlo en `File->Download .ipynb`

**El examen deberá ser entregado con las celdas ejecutadas, si alguna celda no está ejecutadas no se contará.**

El examen se divide en dos partes, con la puntuación que se indica a continuación. La puntuación máxima será 10.

- [Actividad 1: Redes Densas](#actividad_1): 5 pts
    - Correcta normalización: máximo de 0.25 pts
    - [Cuestión 1](#1.1): 1.5 pt
    - [Cuestión 2](#1.2): 1.5 pt
    - [Cuestión 3](#1.3): 0.5 pts
    - [Cuestión 4](#1.4): 0.25 pts
    - [Cuestión 5](#1.5): 0.25 pts
    - [Cuestión 6](#1.6): 0.25 pts
    - [Cuestión 7](#1.7): 0.25 pts
    - [Cuestión 8](#1.8): 0.25 pts


- [Actividad 2: Redes Convolucionales](#actividad_2): 5 pts
    - [Cuestión 1](#2.1): 2.5 pt
    - [Cuestión 2](#2.2): 1 pt
    - [Cuestión 3](#2.3): 0.5 pts
    - [Cuestión 4](#2.4): 0.5 pts
    - [Cuestión 5](#2.5): 0.5 pts
    

In [1]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
tf.random.set_seed(0)

<a name='actividad_1'></a>
# Actividad 1: Redes Densas

Para esta primera actividad vamos a utilizar el [wine quality dataset](https://archive.ics.uci.edu/ml/datasets/wine+quality). Con el que trataremos de predecir la calidad del vino.

La calidad del vino puede tomar valores decimales (por ejemplo 7.25), independientemente de que en el dataset de entrenamiento sean números enteros. Por lo tanto, el problema es una `regresión`.

**Puntuación**:

Normalizar las features correctamente (x_train, x_test): 0.25 pts , se pueden normalizar con el [Normalization layer](https://www.tensorflow.org/api_docs/python/tf/keras/layers/experimental/preprocessing/Normalization) de Keras.


- Correcta normalización: máximo de 0.25 pts
- [Cuestión 1](#1.1): 1 pt
- [Cuestión 2](#1.2): 1 pt
- [Cuestión 3](#1.3): 0.5 pts
- [Cuestión 4](#1.4): 0.25 pts
- [Cuestión 5](#1.5): 0.25 pts
- [Cuestión 6](#1.6): 0.25 pts
- [Cuestión 7](#1.7): 0.25 pts
- [Cuestión 8](#1.8): 0.25 pts



In [2]:
# Descargar los datos con pandas
df_red = pd.read_csv(
    'https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv',
    sep=';'
)
df_white = pd.read_csv(
    'https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv',
    sep=';'
)
df = pd.concat([df_red, df_white])

df.head()

Unnamed: 0,fixed acidity,volatile acidity,citric acid,residual sugar,chlorides,free sulfur dioxide,total sulfur dioxide,density,pH,sulphates,alcohol,quality
0,7.4,0.7,0.0,1.9,0.076,11.0,34.0,0.9978,3.51,0.56,9.4,5
1,7.8,0.88,0.0,2.6,0.098,25.0,67.0,0.9968,3.2,0.68,9.8,5
2,7.8,0.76,0.04,2.3,0.092,15.0,54.0,0.997,3.26,0.65,9.8,5
3,11.2,0.28,0.56,1.9,0.075,17.0,60.0,0.998,3.16,0.58,9.8,6
4,7.4,0.7,0.0,1.9,0.076,11.0,34.0,0.9978,3.51,0.56,9.4,5


In [3]:
feature_names = [
    'fixed acidity', 'volatile acidity', 'citric acid', 'residual sugar', 'chlorides',
    'free sulfur dioxide', 'total sulfur dioxide', 'density', 'pH', 'sulphates', 'alcohol'
]


# separar features y target
y = df.pop('quality').values
X = df.copy().values

In [4]:
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=0)

print('x_train, y_train shapes:', x_train.shape, y_train.shape)
print('x_test, y_test shapes:', x_test.shape, y_test.shape)
print('Some qualities: ', y_train[:5])

x_train, y_train shapes: (4872, 11) (4872,)
x_test, y_test shapes: (1625, 11) (1625,)
Some qualities:  [6 7 8 5 6]


In [5]:
## Si quiere, puede normalizar las features
# Las features se normalizan dentro del modelo, como una capa añadida.

<a name='1.1'></a>
## Cuestión 1: Cree un modelo secuencial que contenga 4 capas ocultas(hidden layers), con más de 60 neuronas  por capa, sin regularización y obtenga los resultados.

Puntuación:
- Obtener el modelo correcto: 0.8 pts
- Compilar el modelo: 0.1pts
- Acertar con la función de pérdida: 0.1 pts

In [None]:
model = tf.keras.models.Sequential()

# Hidden layer 1
model.add(keras.layers.Dense(64, input_shape=(x_train.shape[1],), activation='relu'))
model.add(keras.layers.LayerNormalization())

# Hidden layer 2
model.add(keras.layers.Dense(64, activation='relu'))
model.add(keras.layers.LayerNormalization())

# Hidden layer 3
model.add(keras.layers.Dense(64, activation='relu'))
model.add(keras.layers.LayerNormalization())

# Hidden layer 4
model.add(keras.layers.Dense(64, activation='relu'))
model.add(keras.layers.LayerNormalization())

# Output later with 1 neuron for regression
model.add(keras.layers.Dense(1, activation='linear'))

# Print the model summary
model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_10 (Dense)            (None, 64)                768       
                                                                 
 layer_normalization_8 (Lay  (None, 64)                128       
 erNormalization)                                                
                                                                 
 dense_11 (Dense)            (None, 64)                4160      
                                                                 
 layer_normalization_9 (Lay  (None, 64)                128       
 erNormalization)                                                
                                                                 
 dense_12 (Dense)            (None, 64)                4160      
                                                                 
 layer_normalization_10 (La  (None, 64)               

In [None]:
# Compilación del modelo
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.MSE,
    metrics=['mae']
)

In [None]:
# No modifique el código
model.fit(x_train,
          y_train,
          epochs=200,
          batch_size=32,
          validation_split=0.2,
          verbose=1)

Epoch 1/200
Epoch 2/200
Epoch 3/200
Epoch 4/200
Epoch 5/200
Epoch 6/200
Epoch 7/200
Epoch 8/200
Epoch 9/200
Epoch 10/200
Epoch 11/200
Epoch 12/200
Epoch 13/200
Epoch 14/200
Epoch 15/200
Epoch 16/200
Epoch 17/200
Epoch 18/200
Epoch 19/200
Epoch 20/200
Epoch 21/200
Epoch 22/200
Epoch 23/200
Epoch 24/200
Epoch 25/200
Epoch 26/200
Epoch 27/200
Epoch 28/200
Epoch 29/200
Epoch 30/200
Epoch 31/200
Epoch 32/200
Epoch 33/200
Epoch 34/200
Epoch 35/200
Epoch 36/200
Epoch 37/200
Epoch 38/200
Epoch 39/200
Epoch 40/200
Epoch 41/200
Epoch 42/200
Epoch 43/200
Epoch 44/200
Epoch 45/200
Epoch 46/200
Epoch 47/200
Epoch 48/200
Epoch 49/200
Epoch 50/200
Epoch 51/200
Epoch 52/200
Epoch 53/200
Epoch 54/200
Epoch 55/200
Epoch 56/200
Epoch 57/200
Epoch 58/200
Epoch 59/200
Epoch 60/200
Epoch 61/200
Epoch 62/200
Epoch 63/200
Epoch 64/200
Epoch 65/200
Epoch 66/200
Epoch 67/200
Epoch 68/200
Epoch 69/200
Epoch 70/200
Epoch 71/200
Epoch 72/200
Epoch 73/200
Epoch 74/200
Epoch 75/200
Epoch 76/200
Epoch 77/200
Epoch 78

In [None]:
# No modifique el código
results = model.evaluate(x_test, y_test, verbose=1)
print('Test Loss: {}'.format(results))

Test Loss: [0.5575010776519775, 0.5870630145072937]


<a name='1.2'></a>
## Cuestión 2: Utilice el mismo modelo de la cuestión anterior pero añadiendo al menos dos técnicas distinas de regularización.

Ejemplos de regularización: [Prevent_Overfitting.ipynb](https://github.com/ezponda/intro_deep_learning/blob/main/class/Fundamentals/Prevent_Overfitting.ipynb)

Puntuación:

- Obtener el modelo con la regularización: 0.8 pts
- Obtener un `test loss` inferior al anterior: 0.2 pts


In [None]:
reg = keras.regularizers.l2(5e-3)

model = tf.keras.models.Sequential()

# Hidden layer 1
model.add(keras.layers.Dense(64, input_shape=(x_train.shape[1],), activation='relu'))
model.add(keras.layers.LayerNormalization())
model.add(keras.layers.Dropout(0.2))

# Hidden layer 2
model.add(keras.layers.Dense(64, activation='relu', kernel_regularizer=reg))
model.add(keras.layers.LayerNormalization())
model.add(keras.layers.Dropout(0.2))

# Hidden layer 3
model.add(keras.layers.Dense(64, activation='relu', kernel_regularizer=reg))
model.add(keras.layers.LayerNormalization())
model.add(keras.layers.Dropout(0.2))

# Hidden layer 4
model.add(keras.layers.Dense(64, activation='relu', kernel_regularizer=reg))
model.add(keras.layers.LayerNormalization())
model.add(keras.layers.Dropout(0.2))

# Output later with 1 neuron for regression
model.add(keras.layers.Dense(1, activation='linear'))

# Print the model summary
model.summary()

Model: "sequential_5"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_25 (Dense)            (None, 64)                768       
                                                                 
 layer_normalization_20 (La  (None, 64)                128       
 yerNormalization)                                               
                                                                 
 dropout_8 (Dropout)         (None, 64)                0         
                                                                 
 dense_26 (Dense)            (None, 64)                4160      
                                                                 
 layer_normalization_21 (La  (None, 64)                128       
 yerNormalization)                                               
                                                                 
 dropout_9 (Dropout)         (None, 64)               

In [None]:
# Compilación del modelo
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.MSE,
    metrics=['mae']
)

In [None]:
# Reduce batch size to 16
batch_size=16

In [None]:
# No modifique el código
model.fit(x_train,
          y_train,
          epochs=200,
          batch_size=batch_size,
          validation_split=0.2,
          verbose=1)

Epoch 1/200
Epoch 2/200
Epoch 3/200
Epoch 4/200
Epoch 5/200
Epoch 6/200
Epoch 7/200
Epoch 8/200
Epoch 9/200
Epoch 10/200
Epoch 11/200
Epoch 12/200
Epoch 13/200
Epoch 14/200
Epoch 15/200
Epoch 16/200
Epoch 17/200
Epoch 18/200
Epoch 19/200
Epoch 20/200
Epoch 21/200
Epoch 22/200
Epoch 23/200
Epoch 24/200
Epoch 25/200
Epoch 26/200
Epoch 27/200
Epoch 28/200
Epoch 29/200
Epoch 30/200
Epoch 31/200
Epoch 32/200
Epoch 33/200
Epoch 34/200
Epoch 35/200
Epoch 36/200
Epoch 37/200
Epoch 38/200
Epoch 39/200
Epoch 40/200
Epoch 41/200
Epoch 42/200
Epoch 43/200
Epoch 44/200
Epoch 45/200
Epoch 46/200
Epoch 47/200
Epoch 48/200
Epoch 49/200
Epoch 50/200
Epoch 51/200
Epoch 52/200
Epoch 53/200
Epoch 54/200
Epoch 55/200
Epoch 56/200
Epoch 57/200
Epoch 58/200
Epoch 59/200
Epoch 60/200
Epoch 61/200
Epoch 62/200
Epoch 63/200
Epoch 64/200
Epoch 65/200
Epoch 66/200
Epoch 67/200
Epoch 68/200
Epoch 69/200
Epoch 70/200
Epoch 71/200
Epoch 72/200
Epoch 73/200
Epoch 74/200
Epoch 75/200
Epoch 76/200
Epoch 77/200
Epoch 78

<keras.src.callbacks.History at 0x7bef4d1af130>

In [None]:
# No modifique el código
results = model.evaluate(x_test, y_test, verbose=1)
print('Test Loss: {}'.format(results))

Test Loss: [0.5511903762817383, 0.5788275003433228]


<a name='1.3'></a>
## Cuestión 3: Utilice el mismo modelo de la cuestión anterior pero añadiendo un callback de early stopping.

In [None]:
reg = keras.regularizers.l2(5e-3)

model = tf.keras.models.Sequential()

# Hidden layer 1
model.add(keras.layers.Dense(64, input_shape=(x_train.shape[1],), activation='relu'))
model.add(keras.layers.LayerNormalization())
model.add(keras.layers.Dropout(0.2))

# Hidden layer 2
model.add(keras.layers.Dense(64, activation='relu', kernel_regularizer=reg))
model.add(keras.layers.LayerNormalization())
model.add(keras.layers.Dropout(0.2))

# Hidden layer 3
model.add(keras.layers.Dense(64, activation='relu', kernel_regularizer=reg))
model.add(keras.layers.LayerNormalization())
model.add(keras.layers.Dropout(0.2))

# Hidden layer 4
model.add(keras.layers.Dense(64, activation='relu', kernel_regularizer=reg))
model.add(keras.layers.LayerNormalization())
model.add(keras.layers.Dropout(0.2))

# Output later with 1 neuron for regression
model.add(keras.layers.Dense(1, activation='linear'))

# Print the model summary
model.summary()

Model: "sequential_6"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_30 (Dense)            (None, 64)                768       
                                                                 
 layer_normalization_24 (La  (None, 64)                128       
 yerNormalization)                                               
                                                                 
 dropout_12 (Dropout)        (None, 64)                0         
                                                                 
 dense_31 (Dense)            (None, 64)                4160      
                                                                 
 layer_normalization_25 (La  (None, 64)                128       
 yerNormalization)                                               
                                                                 
 dropout_13 (Dropout)        (None, 64)               

In [None]:
# Compilación del modelo
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.MSE,
    metrics=['mae']
)

In [None]:
## definir el early stopping callback
es_callback = keras.callbacks.EarlyStopping(
    monitor='val_loss',
    patience=5,
    verbose=1)

model.fit(x_train,
          y_train,
          epochs=200,
          batch_size=32,
          validation_split=0.2,
          verbose=1,
          callbacks=[es_callback])

Epoch 1/200
Epoch 2/200
Epoch 3/200
Epoch 4/200
Epoch 5/200
Epoch 6/200
Epoch 7/200
Epoch 8/200
Epoch 9/200
Epoch 10/200
Epoch 11/200
Epoch 12/200
Epoch 13/200
Epoch 14/200
Epoch 15/200
Epoch 16/200
Epoch 17/200
Epoch 18/200
Epoch 19/200
Epoch 20/200
Epoch 21/200
Epoch 22/200
Epoch 23/200
Epoch 24/200
Epoch 25/200
Epoch 26/200
Epoch 27/200
Epoch 28/200
Epoch 29/200
Epoch 30/200
Epoch 31/200
Epoch 32/200
Epoch 33/200
Epoch 34/200
Epoch 35/200
Epoch 36/200
Epoch 37/200
Epoch 38/200
Epoch 39/200
Epoch 40/200
Epoch 41/200
Epoch 42/200
Epoch 43/200
Epoch 44/200
Epoch 45/200
Epoch 46/200
Epoch 47/200
Epoch 48/200
Epoch 49/200
Epoch 50/200
Epoch 51/200
Epoch 52/200
Epoch 53/200
Epoch 54/200
Epoch 54: early stopping


<keras.src.callbacks.History at 0x7bef4b0d2260>

In [None]:
# No modifique el código
results = model.evaluate(x_test, y_test, verbose=1)
print('Test Loss: {}'.format(results))

Test Loss: [0.6215519309043884, 0.6183379292488098]


<a name='1.4'></a>
## Cuestión 4: ¿Podría haberse usado otra función de activación de la neurona de salida? En caso afirmativo especifíquela.

Para este ejercicio se ha decidido utilizar la función de activación lineal en la capa de salida, ya que es la más común y recomendada para un problema de regresión, como es la predicción de calidad del vino. Sin embargo, existen alternartivas a considerar, dependiendo de las características y objetivos del modelo, incluyendo:

- **Función Sigmoide**: La función sigmoide permite predecir valores entre 0 y 1. Esta función introduce una restricción innecesaria en el rango de salida, ya que la calidad del vino puede tomar valores fuera de este rango. Por lo tanto, no se considera una opción válida para la función de activación de salida en este modelo.

- **Función Tangente Hiperbólica (tanh)**: Al igual que la sigmoide, la función tanh limita las predicciones a un rango entre -1 y 1, lo que la hace inadecuada para este problema por la misma razón que la sigmoide.

- **Función Cuadrada Rectificada (ReLU)**: Esta función permite que la salida tome valores no negativos, lo que se ajusta al rango posible de la calidad del vino. ReLU puede introducir cierta no linealidad en la salida, lo que podría ser beneficioso si la relación entre las características de entrada y la calidad del vino no es completamente lineal. Sin embargo, es importante tener en cuenta que ReLU puede generar salidas de 0 para algunos valores de entrada, lo que podría ser un problema si se busca una predicción precisa para todos los casos.

En resumen, aunque la función lineal es la más recomendad para la capa de salida en este tipo de modelos, la función ReLU es una alternativa viable, pero se debe considerar la posibilidad de salidas de 0. Por el contrario, las funciones sigmoide y tanh no son ideales debido a la restricción innecesaria en el rango de salida.

<a name='1.5'></a>
## Cuestión 5:  ¿Qué es lo que una neurona calcula?

**a)** Una función de activación seguida de una suma ponderada  de las entradas.

**b)** Una suma ponderada  de las entradas seguida de una función de activación.

**c)** Una función de pérdida, definida sobre el target.

**d)** Ninguna  de las anteriores es correcta

La respuesta correcta es **b)** Una suma ponderada de las entradas seguida de una función de activación.

La función principal de una neurona en una red neuronal artificial es procesar las entradas (inputs, calculando una suma ponderada de las entradas) para producir una salida (output, usando una función de activación).

<a name='1.6'></a>
## Cuestión 6:  ¿Cuál de estas funciones de activación no debería usarse en una capa oculta (hidden layer)?

**a)** `sigmoid`

**b)** `tanh`

**c)** `relu`

**d)** `linear`


La respuesta correcta es **a)** sigmoid.

La función de activación que generalmente no se recomienda para su uso en capas ocultas (hidden layers) de una red neuronal es la función de activación sigmoid, debido a problemas de saturación de gradiente y desvanecimiento del gradiente durante el entrenamiento profundo, lo cual puede ralentizar el proceso de aprendizaje.

<a name='1.7'></a>
## Cuestión 7:  ¿Cuál de estas técnicas es efectiva para combatir el overfitting en una red con varias capas ocultas? Ponga todas las que lo sean.

**a)** Dropout

**b)** Regularización L2.

**c)** Aumentar el tamaño del test set.

**d)** Aumentar el tamaño del validation set.

**e)** Reducir el número de capas de la red.

**f)** Data augmentation.

Para combatir el overfitting en una red neuronal con varias capas ocultas, las técnicas efectivas son:
La respuestas correcta son a) Dropout, b) Regularización L2, e) Reducir el número de capas de la red y f) Data augmentation.

**a)** Dropout: Consiste en "apagar" aleatoriamente neuronas durante el entrenamineto, evitando que la red se ajuste demasiado a los datos de entrenamiento.

**b)** Regularización L2: También conocida como "weight decay", agrega una penalización a los pesos grandes en la función de pérdida, ayudando a prevenir que estos se vuelvan demasiado grandes, y así reducir el overfitting.

**e)** Reducir el número de capas de la red: Reducir la complejidad del modelo, como disminuir el número de capas ocultas, puede ayudar a prevenir el overfitting. Un modelo más sencillo tiene menos capacidad de ajustarse demasiado a los datos de entrenamiento.

**f)** Data augmentation: Implica aumentar el tamaño del conjunto de datos de entrenamiento mediante la generación de nuevas muestras a partir de las existentes, aplicando transformaciones como rotaciones, traslaciones y cambios de escala, generando variaciones adicionales de los datos de entrenamiento.

Las otras opciones no son efectivas para combatir el overfitting:

**c)** Aumentar el tamaño del test set: Esto no afecta el entrenamiento del modelo y, por lo tanto, no combate el overfitting. El test set se utiliza para evaluar el modelo, no para entrenarlo.

**d)** Aumentar el tamaño del validation set: Aunque tener un conjunto de validación más grande puede proporcionar una evaluación más precisa del rendimiento del modelo, no afecta directamente el proceso de entrenamiento ni combate el overfitting.

<a name='1.8'></a>
## Cuestión 8:  Supongamos que queremos entrenar una red para un problema de clasificación de imágenes con las siguientes clases: {'perro','gato','persona'}. ¿Cuántas neuronas y que función de activación debería tener la capa de salida? ¿Qué función de pérdida (loss function) debería usarse?


- **Número de neuronas en la capa de salida**: 3 neuronas. Debe haber una neurona por cada clase que se quiere predecir. En este caso, hay tres clases, por lo que la capa de salida debe tener 3 neuronas.

- **Función de activación de la capa de salida**: Softmax. La función de activación softmax es adecuada para un problema de clasificación multiclase.

- **Función de pérdida**: Entropía cruzada categórica (categorical cross-entropy). La función de pérdida categorical cross-entropy es adecuada para un problema de clasificación multiclase.


<a name='actividad_2'></a>
# Actividad 2: Redes Convolucionales

Vamos a usar el dataset [cifar-10](https://www.cs.toronto.edu/~kriz/cifar.html), que son 60000 imágenes de 32x32 a color  con 10 clases diferentes. Para realizar mejor la práctica puede consultar [Introduction_to_CNN.ipynb](https://github.com/ezponda/intro_deep_learning/blob/main/class/CNN/Introduction_to_CNN.ipynb).



**Puntuación**:

- [Cuestión 1](#2.1): 2.5 pt
- [Cuestión 2](#2.2): 1 pt
- [Cuestión 3](#2.3): 0.5 pts
- [Cuestión 4](#2.4): 0.5 pts
- [Cuestión 5](#2.5): 0.5 pts

Puede normalizar las imágenes al principio o usar la capa [Rescaling](https://www.tensorflow.org/api_docs/python/tf/keras/layers/experimental/preprocessing/Rescaling):

```python
tf.keras.layers.experimental.preprocessing.Rescaling(
    scale, offset=0.0, name=None, **kwargs
)
```

In [None]:
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.cifar10.load_data()
y_train = y_train.flatten()
y_test = y_test.flatten()

In [None]:
class_names = ['airplane', 'automobile', 'bird', 'cat', 'deer',
               'dog', 'frog', 'horse', 'ship', 'truck']

plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(x_train[i])
    plt.xlabel(class_names[y_train[i]])
plt.show()

In [None]:
print('x_train, y_train shapes:', x_train.shape, y_train.shape)
print('x_test, y_test shapes:', x_test.shape, y_test.shape)

<a name='2.1'></a>
## Cuestión 1: Cree una red convolucional con la API funcional con al menos dos capas convolucionales y al menos dos capas de pooling. Debe obtener un `Test accuracy > 0.68`

In [None]:
inputs = tf.keras.Input(shape=..., name='input')
# reescaling = ...

# Convolution + pooling layers
...

# Flattening
...

# Fully-connected
outputs = layers.Dense(...)

model = keras.Model(inputs=..., outputs=...)

In [None]:
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(),
              metrics=['accuracy'])

In [None]:
history = model.fit(x_train, y_train, epochs=25, batch_size=64,
                    validation_split=0.15)

In [None]:
results = model.evaluate(x_test, y_test, verbose=0, batch_size=1000)
print('Test Loss: {}'.format(results[0]))
print('Test Accuracy: {}'.format(results[1]))

<a name='2.2'></a>
## Cuestión 2: Cree el mismo  modelo de manera secuencial. No es necesario compilar ni entrenar el modelo

In [None]:
model_seq = tf.keras.models.Sequential()
# Código aquí
...

<a name='2.3'></a>
## Cuestión 3: Si tenenemos una  una imagen de entrada de 300 x 300 a color (RGB) y queremos usar una red densa. Si la primera capa oculta tiene 100 neuronas, ¿Cuántos parámetros tendrá esa capa (sin incluir el bias) ?


<a name='2.4'></a>
## Cuestión 4   Ponga  las verdaderas ventajas de las redes convolucionales respecto a las densas

**a)** Reducen el número total de parámetros, reduciendo así el overfitting.

**b)** Permiten utilizar una misma 'función'  en varias localizaciones de la imagen de entrada, en lugar de aprender una función diferente para cada pixel.

**c)** Permiten el uso del transfer learning.

**d)** Generalmente son menos profundas, lo que facilita su entrenamiento.



<a name='2.5'></a>
## Cuestión 5: Para el procesamiento de series temporales las redes convolucionales no son efectivas, habrá que usar redes recurrentes.

- **Verdadero**
- **Falso**