# Transformaciones

Los datos no siempre vienen en su forma final procesada que es requerida para
entrenar algoritmos de aprendizaje automático. Usamos **transformaciones** para realizar
alguna manipulación de los datos y hacerlos adecuados para el entrenamiento.

Todas las datasets de TorchVision tienen dos parámetros - ``transform`` para modificar
las características e ``target_transform`` para modificar las etiquetas - que
aceptan callables conteniendo la lógica de transformación.
El módulo [torchvision.transforms](https://pytorch.org/vision/stable/transforms.html) ofrece
varias transformaciones predefinidas comúnmente usadas listas para usar.

Las características de FashionMNIST están en formato de imagen PIL, y las etiquetas son enteros.
Para el entrenamiento, necesitamos las características como tensores normalizados, y las etiquetas
como tensores de one-hot encoded. Para hacer estas transformaciones, usamos ``ToTensor`` e ``Lambda``.

In [1]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

## ToTensor()

[ToTensor](https://pytorch.org/vision/stable/transforms.html#torchvision.transforms.ToTensor)
convierte una imagen PIL o arreglo NumPy a un ``FloatTensor``. y escala
los valores de intensidad de pixel de la imagen en el rango [0., 1.]

## Lambda Transforms

Las transformaciones Lambda aplican cualquier función lambda definida por el usuario. Aquí, definimos una función
para convertir el entero a un tensor one-hot encoded.
Primero crea un tensor zero del tamaño 10 (el número de etiquetas en nuestro conjunto de datos)
y llama a [scatter](https://pytorch.org/docs/stable/generated/torch.Tensor.scatter_.html) el cual asigna un
``value=1`` en el índice dado por la etiqueta ``y``.

In [2]:
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

In [3]:
print(torch.zeros(10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(8), value=1))

tensor([0., 0., 0., 0., 0., 0., 0., 0., 1., 0.])


---

## Lectura Adicional

- [Transformaciones de TorchVision](https://pytorch.org/vision/stable/transforms.html)