## Работа с Dataloader, обучение моделей

Существует два способа, которые можно использовать для обучения моделей в Pytorch с использованием наборов данных Deep Lake:
- Загрузчики данных Deep Lake. Высокооптимизированы и обеспечивают самую быструю потоковую передачу и перетасовку с использованием внутреннего метода перетасовки Deep Lake. Однако они не поддерживают пользовательскую выборку или полностью случайную перетасовку, которая возможна с помощью наборов данных Pitch datasets + загрузчиков данных.
- Наборы данных Pytorch + загрузчики данных. Обеспечивают всю настраиваемость, поддерживаемую Pitch. Однако они имеют крайне неоптимальную потоковую передачу с использованием наборов данных Deep Lake и могут привести к снижению производительности в 5 раз по сравнению с использованием загрузчиков данных Deep Lake.

In [2]:
import deeplake
from torchvision import datasets, transforms, models

### DeepLake DataLoaders

In [3]:
ds = deeplake.load("./deeplake_fer")

./deeplake_fer loaded successfully.


Самая быстрая потоковая передача данных на GPU с использованием Pitch достигается с помощью встроенного в Deep Lake загрузчика данных Pitch ds.pytorch(). Если обучение вашей модели очень чувствительно к рандомизации входных данных, пожалуйста, предварительно перетасуйте данные или ознакомьтесь с документацией о перетасовке в ds.pytorch()

Параметр преобразования в ds.pytorch() представляет собой словарь, где ключом является имя тензора, а значением - функция преобразования, которая должна быть применена к этому тензору. Если данные конкретного тензора возвращать не требуется, их следует исключить из ключей. Если данные тензора не нуждаются в изменении во время предварительной обработки, функции преобразования присваивается значение None.

In [20]:
#Первый вариант для простого преобразования данных 

tform = transforms.Compose([
    transforms.ToPILImage(),
    transforms.RandomRotation(20),
    transforms.ToTensor(),
    transforms.Normalize((0.5) ,(0.5)),
])

dataloader = ds.pytorch(batch_size = 16, num_workers = 2, transform = {'images': tform, 'labels': None}, shuffle = True)

In [21]:
#Второй вариант для сложного преобразования данных

def transform(sample_in):
    return {'images': tform(sample_in['images']), 'labels': sample_in['labels']}

dataloader = ds.pytorch(batch_size = 16, num_workers = 2, transform = transform, shuffle = True)

### PyTorch Datasets + DataLoaders

#### лучший вариант для полной кастомизации

DeepLake-датасеты можно интегрировать в класс PyTorch Dataset, передав объект ds конструктору PyTorch Dataset и извлекая данные в методе __getitem__ с использованием self.ds.image[ids].numpy():

In [23]:
from torch.utils.data import DataLoader, Dataset

class ClassificationDataset(Dataset):
    def __init__(self, ds, transform = None):
        self.ds = ds #!
        self.transform = transform

    def __len__(self):
        return len(self.ds)
    
    def __getitem__(self, idx):
        image = self.ds.images[idx].numpy() #!
        label = self.ds.labels[idx].numpy(fetch_chunks = True).astype(np.int32)#!

        if self.transform is not None:
            image = self.transform(image)

        sample = {"images": image, "labels": label}

        return sample

In [24]:
dataset_pytorch = ClassificationDataset(ds, transform = tform)

dataloader_pytorch = DataLoader(dataset_pytorch, batch_size = 16, num_workers = 2, shuffle = True)

### Tensorflow

In [None]:
ds_tf = ds.tensorflow() # TensorFlow Dataset

### Итерация и обучение

In [34]:
import torch
import time

In [25]:
for data in dataloader:
    print(data)    
    break
    
    # Цикл обучения

Please wait, filling up the shuffle buffer with samples.:   0%| | 47.6k/1.91G [0

Shuffle buffer filling is complete.
{'images': tensor([[[[ 0.4902,  0.4980,  0.5059,  ...,  0.6784,  0.7176,  0.7961],
          [ 0.4980,  0.4980,  0.5059,  ...,  0.7647,  0.6471,  0.8039],
          [ 0.4980,  0.5059,  0.5059,  ...,  0.8745,  0.8431,  0.6314],
          ...,
          [-0.3882, -0.3569, -0.3490,  ..., -0.6000, -0.7882, -0.8431],
          [-0.3725, -0.3412, -0.3255,  ..., -0.7412, -0.8118, -0.8431],
          [-0.3412, -0.3098, -0.3098,  ..., -0.7647, -0.7882, -0.8275]]],


        [[[-1.0000, -1.0000, -1.0000,  ..., -1.0000, -1.0000, -1.0000],
          [-1.0000, -1.0000, -1.0000,  ..., -1.0000, -1.0000, -1.0000],
          [-1.0000, -1.0000, -1.0000,  ..., -1.0000, -1.0000, -1.0000],
          ...,
          [-1.0000, -1.0000, -1.0000,  ..., -1.0000, -1.0000, -1.0000],
          [-1.0000, -1.0000, -1.0000,  ..., -1.0000, -1.0000, -1.0000],
          [-1.0000, -1.0000, -1.0000,  ..., -1.0000, -1.0000, -1.0000]]],


        [[[-1.0000, -1.0000, -1.0000,  ..., -1.0000




In [28]:
device = torch.device('cuda') if torch.cuda.is_available() else torch.device('cpu')
print(device)

cpu


In [30]:
# Предобученная модель ResNet18
model = models.resnet18(pretrained=True)

# Конвертируем модель в ЧБ
model.conv1 = torch.nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3, bias=False)

# Изменим число классов
model.fc = torch.nn.Linear(model.fc.in_features, len(ds.labels.info.class_names))

model.to(device)

criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.001, momentum=0.1)

In [31]:
def train_one_epoch(model, optimizer, data_loader, device):

    model.train()

    # Zero the performance stats for each epoch
    running_loss = 0.0
    start_time = time.time()
    total = 0
    correct = 0
    
    for i, data in enumerate(data_loader):
        inputs = data['images']
        labels = torch.squeeze(data['labels'])

        inputs = inputs.to(device)
        labels = labels.to(device)

        optimizer.zero_grad()

        outputs = model(inputs.float())
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
        accuracy = 100 * correct / total
    
        running_loss += loss.item()
        if i % 10 == 0:    # print every 10 batches
            batch_time = time.time()
            speed = (i+1)/(batch_time-start_time)
            print('[%5d] loss: %.3f, speed: %.2f, accuracy: %.2f %%' %
                  (i, running_loss, speed, accuracy))

            running_loss = 0.0
            total = 0
            correct = 0

    
def test_model(model, data_loader, device):

    model.eval()

    start_time = time.time()
    total = 0
    correct = 0
    with torch.no_grad():
        for i, data in enumerate(data_loader):
            inputs = data['images']
            labels = torch.squeeze(data['labels'])

            inputs = inputs.to(device)
            labels = labels.to(device)

            optimizer.zero_grad()

            outputs = model(inputs.float())

            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
        accuracy = 100 * correct / total
            
        print('Finished Testing')
        print('Testing accuracy: %.1f %%' %(accuracy))

In [35]:
num_epochs = 3
for epoch in range(num_epochs):  # loop over the dataset multiple times
    print("------------------ Training Epoch {} ------------------".format(epoch+1))
    train_one_epoch(model, optimizer, dataloader, device)

    test_model(model, dataloader, device)
  
print('Finished Training')

------------------ Training Epoch 1 ------------------


Please wait, filling up the shuffle buffer with samples.:   0%| | 47.6k/1.91G [0

Shuffle buffer filling is complete.





[    0] loss: 2.511, speed: 3.21, accuracy: 6.25 %


Please wait, filling up the shuffle buffer with samples.:   0%| | 47.6k/1.91G [0

Shuffle buffer filling is complete.





Finished Testing
Testing accuracy: 9.5 %
------------------ Training Epoch 2 ------------------


Please wait, filling up the shuffle buffer with samples.:   0%| | 47.6k/1.91G [0


Shuffle buffer filling is complete.
[    0] loss: 2.197, speed: 3.61, accuracy: 0.00 %


Please wait, filling up the shuffle buffer with samples.:   0%| | 47.6k/1.91G [0

Shuffle buffer filling is complete.





Finished Testing
Testing accuracy: 9.5 %
------------------ Training Epoch 3 ------------------


Please wait, filling up the shuffle buffer with samples.:   0%| | 47.6k/1.91G [0


Shuffle buffer filling is complete.
[    0] loss: 2.139, speed: 3.72, accuracy: 18.75 %


Please wait, filling up the shuffle buffer with samples.:   0%| | 47.6k/1.91G [0

Shuffle buffer filling is complete.
Finished Testing
Testing accuracy: 19.0 %
Finished Training



