Transforms
===================

Данные не всегда поступают в нужном для обучения виде. Мы используем **transforms**, чтобы выполнить некоторые манипуляции с данными и сделать их пригодными для обучения.

Все TorchVision датасеты имеют 2 параметра: 

1. ``transform`` - изменение признаков
2. ``target_transform`` - изменение меток (ответов)

Признаки FashionMNIST представлены в формате PIL картинок, а метки - int. Для обучения нам нужны признаки в виде нормализованных тензоров, и метки в виде one-hot тензоров.

Чтобы сделать данные изменения в данных, нужно использовать ``ToTensor`` и ``Lambda``.

In [1]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

In [2]:
ds = datasets.FashionMNIST(
    root='data',
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

ToTensor()
-------------------------------

Конвертирует PIL картинку или NumPy ``ndarray`` в ``FloatTensor``, и масштабирует интенсивность пикселей в интервале [0; 1]

https://pytorch.org/vision/stable/transforms.html#torchvision.transforms.ToTensor

Lambda Transforms
-------------------------------

``Lambda`` преобразования любую питоновскую lambda-функцию. В нашем случае мы определяем функцию для преобразования int в one-hot тензор.

Сначала он создает нулевой тензор размера 10 (количество разных меток в нашем датасете) и вызывает `scatter_()`, который присваивает `value=1` по индексу, заданному меткой `y`.

In [3]:
target_transform = Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

--------------




Для более глубокого изучения:

`torchvision.transforms API https://pytorch.org/vision/stable/transforms.html

---