# <font style="color:rgb(50, 120, 229);"> Data Augmentation </font>

En este cuaderno, aprenderemos cómo usar el Data Augmentation para mitigar el sobreajuste durante el entrenamiento.


<font style="color:rgb(50, 120, 229);"> Recordemos ¿por qué sucede el sobreajuste? </font>

El sobreajuste es un problema común en el aprendizaje automático, donde un modelo se ajusta demasiado a los datos de entrenamiento y, por lo tanto, no puede generalizar bien a los datos de prueba. 

El sobreajuste ocurre cuando un modelo es demasiado complejo en relación con la cantidad de datos de entrenamiento disponibles. En otras palabras, el modelo memoriza los datos de entrenamiento en lugar de aprender patrones generales.

<font style="color:rgb(50, 120, 229);"> ¿Qué es el Data Augmentation? </font>

Una forma común de mitigar el sobreajuste es incrementando la cantidad de datos de entrenamiento.

En el caso de tareas de visión por computadora, podríamos pensar en tomar más fotos de los objetos que queremos clasificar. Sin embargo, esto no siempre es posible.

**Data Augmentation es una técnica que nos permite aumentar la cantidad de datos de entrenamiento sin necesidad de recolectar más datos.**

Esta técnica consiste en aplicar transformaciones aleatorias a los datos de entrenamiento, como rotaciones, traslaciones, zoom, etc. De esta manera, el modelo ve diferentes versiones de los mismos datos de entrenamiento, lo que le permite generalizar mejor.

<center>
<figure>
    <figcaption>Rotactión:</figcaption>
  <img src="./images/rotacion.png" alt="Data Augmentation" style="width:1000px">
</figure>

<figure>
    <figcaption> Espejado:</figcaption>
  <img src="./images/flip.png" alt="Data Augmentation" style="width:1000px">
</figure>

<figure>
    <figcaption>Zoom:</figcaption>
  <img src="./images/zoom.png" alt="Data Augmentation" style="width:1000px">
</figure>
</center>

## <font style="color:rgb(50, 120, 229);"> Data Augmentation en Keras </font>

Keras proporciona diferentes capas de preprocesamiento de imágenes que se pueden usar para aplicar Data Augmentation.

La lista completa de capas de preprocesamiento de imágenes se puede encontrar en la [documentación oficial de Keras](https://keras.io/api/layers/preprocessing_layers/image_augmentation/).

Vamos a ver cómo usar algunas de estas capas en el siguiente ejemplo.

In [None]:
#Función para visualizar los datos aumentados
import matplotlib.pyplot as plt

def plot_images(dataset, data_augmentation_pipeline, rows, cols):
    for image_batch, _ in dataset.take(1):
        plt.figure(figsize=(15, 8))

        for i in range(rows * cols):
            augmented_images = data_augmentation_pipeline(image_batch)

            # Display just the first augmented image from the batch of augmented images.
            plt.subplot(rows, cols, i + 1)
            plt.imshow(augmented_images[0].numpy().astype("uint8"))
            plt.axis("off")
    plt.show()

In [None]:
from keras.utils import image_dataset_from_directory

dataset = image_dataset_from_directory(
    "./data",
    labels="inferred",
    label_mode="categorical",
    batch_size=1,
    image_size=(224, 224)
)

### <font style="color:rgb(50, 120, 229);"> RandomFlip </font>

La capa `RandomFlip` se puede usar para aplicar aleatoriamente el espejado horizontal o vertical a las imágenes.

```python
keras.layers.experimental.preprocessing.RandomFlip(mode="horizontal")
```

**Parámetros:**

- `mode`: Puede ser "horizontal" o "vertical" o "horizontal_and_vertical".
  

In [None]:
from keras.layers import RandomFlip 
from keras.models import Sequential

data_augmentation_pipeline = Sequential([
    RandomFlip("horizontal_and_vertical"),
])

plot_images(dataset, data_augmentation_pipeline, 3, 3)


### <font style="color:rgb(50, 120, 229);"> RandomRotation </font>

La capa `RandomRotation` se puede usar para aplicar aleatoriamente rotaciones a las imágenes.

```python
from keras.layers import RandomRotation

RandomRotation(
    factor=0.15,
    fill_mode="constant",
    interpolation="bilinear",
    fill_value=0.0,
)
```

**Parámetros:**

- `factor`: Un flotante entre 0 y 1 que representa una fracción de 2pi, es decir, 360 grados. Por ejemplo, un valor de 0.2 significa que las imágenes se rotarán aleatoriamente en el rango de $-0.2 * 2pi$ a $0.2 * 2pi$.

    También puede pasar una tupla de dos flotantes, por ejemplo [a, b], donde la rotación será aleatoria en el rango $[-a * 2pi, b * 2pi]$.

- `fill_mode`: Una cadena que especifica el modo de relleno. Puede ser "constant", "reflect", "wrap" o "nearest".
- `interpolation`: Una cadena que especifica el modo de interpolación. Puede ser "bilinear" o "nearest".
- `fill_value`: Un flotante que representa el valor de relleno si `fill_mode="constant"`.
- 

In [None]:
from keras.layers import RandomRotation

data_augmentation_pipeline = Sequential([
    RandomRotation([-0.5, 0.5]),
])

plot_images(dataset, data_augmentation_pipeline, 5, 5)

### <font style="color:rgb(50, 120, 229);"> RandomZoom </font>

La capa `RandomZoom` se puede usar para aplicar aleatoriamente zoom a las imágenes.

```python
from keras.layers import RandomZoom

RandomZoom(
    height_factor=0.2,
    width_factor=0.2,
    fill_mode="constant",
    interpolation="bilinear",
    fill_value=0.0,
)
```

**Parámetros:**

- `height_factor`: Un flotante que representa la fracción de zoom en la dirección vertical.
- `width_factor`: Un flotante que representa la fracción de zoom en la dirección horizontal.
- `fill_mode`: Una cadena que especifica el modo de relleno. Puede ser "constant", "reflect", "wrap" o "nearest".
- `interpolation`: Una cadena que especifica el modo de interpolación. Puede ser "bilinear" o "nearest".
- `fill_value`: Un flotante que representa el valor de relleno si `fill_mode="constant"`.


In [None]:
from keras.layers import RandomZoom

data_augmentation_pipeline = Sequential([
    RandomZoom(
        height_factor=(-0.5, 0.5),
        width_factor=(-0.5, 0.5),
        fill_mode="constant",
        fill_value=0.0
    ),
])

plot_images(dataset, data_augmentation_pipeline, 5, 5)

## <font style="color:red"> Importante </font>

**Debes elegir cuidadosamente las transformaciones que aplicas a tus datos.** Por ejemplo, si estás trabajando con letras, no tendría sentido aplicar rotaciones a las imágenes, ya que las letras no se ven igual si las rotas.