# Seminario de Invierno. CAPAP-H
# Cáceres. 29-31 Enero 2025

#### Juan Mario Haut Hurtado. Correo: juanmariohaut@unex.es

### Manejo de datos en PyTorch

Para manejar los datos en PyTorch disponemos de dos clases principales:
1. **Dataset**: Clase abstracta que define la interfaz para todos los datasets en PyTorch.
2. **Dataloader** : Clase que nos permite cargar los datos de un dataset en lotes para su procesamiento. Además, nos permite mezclar aleatoriamente los datos y cargarlos en paralelo utilizando múltiples subprocesos. El dataloader es especialmente útil cuando trabajamos con grandes conjuntos de datos que no caben en la memoria RAM de nuestro ordenador. En lugar de cargar todo el conjunto de datos en la memoria RAM, podemos cargar los datos en lotes y procesarlos de forma incremental.

En este notebook nos centraremos en la clase **Dataloader**. Esta clase nos permite realizar muchas operaciones **imprescindibles** para el entrenamiento de una red. Veamos un ejemplo partiendo del ejemplo de **Dataset**. API: https://pytorch.org/docs/stable/data.html

```
DataLoader(dataset, batch_size=1, shuffle=False, sampler=None,
           batch_sampler=None, num_workers=0, collate_fn=None,
           pin_memory=False, drop_last=False, timeout=0,
           worker_init_fn=None, *, prefetch_factor=2,
           persistent_workers=False)
```

In [None]:
# Importamos las librerías necesarias
import torch
from torch.utils.data import Dataset, DataLoader

# Definimos una clase para nuestro dataset
class MiDataset(Dataset):
    def __init__(self, datos):
        self.datos = datos
    
    def __len__(self):
        return len(self.datos)
    
    def __getitem__(self, idx):
        return self.datos[idx]

# Creamos un dataset de ejemplo
datos = [1, 2, 3, 4, 5]
dataset = MiDataset(datos)

# Creamos un dataloader para nuestro dataset
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

# Iteramos sobre el dataloader
for batch in dataloader:
    print(batch)

In [None]:
import torch
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor
import matplotlib.pyplot as plt

labels_map = {
    0: "T-Shirt",
    1: "Trouser",
    2: "Pullover",
    3: "Dress",
    4: "Coat",
    5: "Sandal",
    6: "Shirt",
    7: "Sneaker",
    8: "Bag",
    9: "Ankle Boot",
}


training_data = datasets.FashionMNIST(
    root="/tmp",
    train=True,
    download=True,
    transform=ToTensor()
)

test_data = datasets.FashionMNIST(
    root="/tmp",
    train=False,
    download=True,
    transform=ToTensor()
)

# Creamos un dataloader para nuestro dataset
dataloader = DataLoader(training_data, batch_size=9, shuffle=True)

# Iteramos sobre el dataloader
for idbatch, (X,y) in enumerate(dataloader):
    print(X.shape, y)
    if idbatch == 5: 
        figure = plt.figure(figsize=(8, 8))
        cols, rows = 3, 3
        for i in range(cols * rows):
            img, label = X[i], y[i]
            figure.add_subplot(rows, cols, i+1)
            plt.title(labels_map[int(label)])
            plt.axis("off")
            plt.imshow(img.squeeze(), cmap="gray")
        plt.show()
        break

In [None]:
# Cambiar FashionMNIST por MNIST

# Data augmentation

Data augmentation es una técnica utilizada en el aprendizaje automático para aumentar la cantidad de datos de entrenamiento mediante la creación de nuevas muestras a partir de las muestras existentes. La idea detrás de la data augmentation es que, al aumentar la cantidad de datos de entrenamiento, podemos mejorar la capacidad de generalización del modelo y reducir el sobreajuste.

La data augmentation se aplica típicamente a conjuntos de datos de imágenes y consiste en aplicar transformaciones aleatorias a las imágenes existentes, como rotaciones, traslaciones, zooms, cambios de brillo y contraste, entre otros. Estas transformaciones crean nuevas imágenes que son similares a las originales, pero que presentan variaciones que pueden ayudar al modelo a generalizar mejor.

La data augmentation también se puede aplicar a otros tipos de datos, como audio y texto, mediante técnicas específicas para cada tipo de dato. En general, la data augmentation es una técnica muy útil para mejorar el rendimiento de los modelos de aprendizaje automático, especialmente cuando se dispone de conjuntos de datos pequeños.

In [None]:
import torch
import torchvision
import torchvision.transforms as transforms

# Definimos las transformaciones de data augmentation
transform_train = transforms.Compose([
    transforms.RandomCrop(32, padding=4),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    #transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
])

# Definimos las transformaciones de data augmentation
transform_train2 = transforms.Compose([
    transforms.RandomCrop(32, padding=4),
    transforms.RandomVerticalFlip(),
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
])

# Cargamos el conjunto de datos CIFAR-10
trainset = torchvision.datasets.CIFAR10(
    root='/tmp', train=True, download=True, transform=transform_train)

# Cargamos el conjunto de datos CIFAR-10
trainset2 = torchvision.datasets.CIFAR10(
    root='/tmp', train=True, download=True, transform=transform_train2)

# Creamos un dataloader para cargar los datos en lotes
trainloader = torch.utils.data.DataLoader(
    trainset, batch_size=128, shuffle=True, num_workers=2)

# Iteramos sobre el dataloader y mostramos algunas imágenes generadas por data augmentation
for images, labels in trainloader:
    # Mostramos las primeras 9 imágenes del lote
    for i in range(9):
        plt.subplot(3, 3, i+1)
        plt.imshow(images[i].permute(1, 2, 0))
        plt.title(labels_map[labels[i].item()])
        plt.axis('off')
    plt.show()
    break

# Creamos un dataloader para cargar los datos en lotes
trainloader = torch.utils.data.DataLoader(
    trainset2, batch_size=128, shuffle=True, num_workers=2)

# Iteramos sobre el dataloader y mostramos algunas imágenes generadas por data augmentation
for images, labels in trainloader:
    # Mostramos las primeras 9 imágenes del lote
    for i in range(9):
        plt.subplot(3, 3, i+1)
        plt.imshow(images[i].permute(1, 2, 0))
        plt.title(labels_map[labels[i].item()])
        plt.axis('off')
    plt.show()
    break



En este ejemplo, definimos las transformaciones de data augmentation utilizando la clase `Compose` de `torchvision.transforms`. En este caso, aplicamos una transformación de recorte aleatorio (`RandomCrop`), una transformación de volteo horizontal aleatorio (`RandomHorizontalFlip`), una transformación de conversión a tensor (`ToTensor`) y una transformación de normalización (`Normalize`).

Luego, cargamos el conjunto de datos CIFAR-10 utilizando la clase `CIFAR10` de `torchvision.datasets` y especificamos las transformaciones de data augmentation que queremos aplicar.

Finalmente, creamos un dataloader utilizando la clase `DataLoader` de PyTorch y especificamos el tamaño de lote (`batch_size`), el mezclado aleatorio (`shuffle`) y el número de subprocesos (`num_workers`) que queremos utilizar.

Luego, iteramos sobre el dataloader y mostramos algunas imágenes generadas por data augmentation utilizando la librería `matplotlib`. En este caso, mostramos las primeras 9 imágenes del lote.

Espero que esto te sea útil. Si tienes alguna pregunta, no dudes en preguntar.