<a href="https://colab.research.google.com/github/J0han-ai/fast.ai/blob/main/%D0%BE%D0%B1%D1%89%D0%B5%D0%B5_ru.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Pytorch to fastai, Bridging the Gap
Понимание того, как перенести код Pytorch в пространство fastai 

Feb 14, 2021 - 4 min read




Эта статья также представляет собой Jupyter Notebook, доступный для запуска сверху вниз. В нем будут фрагменты кода, которые вы сможете запустить в любой среде.
Ниже приведены версии fastai, fastcore, torch и torchvision, работающие на момент написания этой статьи:
fastai: 2.2.5
fastcore: 1.3.19
torch: 1.7.0+cu101
torchvision: 0.8.1+cu101

Решение проблемы "слона в комнате
Недавно я опубликовал твит с вопросом о том, с чем люди больше всего сталкиваются в fastai, и самым популярным ответом был вопрос о том, как минимально интегрироваться с Pytorch. Похоже, сложилось впечатление, что для использования fastai нужно использовать только полный fastai API, и ничего больше.
Давайте сейчас развеем это заблуждение:
  Важно: fastai по своей сути - это цикл обучения, разработанный для того, чтобы быть независимым от фреймворка. Вы можете использовать любую версию Pytorch, какую захотите, и использовать fastai только для быстрого и эффективного обучения модели с использованием самых современных методов.
План
Теперь, когда все заблуждения устранены, давайте рассмотрим, как это должно происходить. Мы будем следовать официальному руководству Pytorch CIFAR10 и покажем, что минимально необходимо сделать во фреймворке fastai, чтобы использовать все преимущества Learner. Это будет включать в себя:
Набор данных
Загрузчики данных
Модель
Оптимизатор
Набор данных и загрузчики данных
Следуя руководству, мы загрузим набор данных, используя только torchvision. Сначала мы возьмем наши импорты:


In [4]:
from google.colab import drive
drive.mount('/content/gdrive')

Mounted at /content/gdrive


In [1]:
import torch
import torchvision
import torchvision.transforms as transforms


Далее мы определим некоторые минимальные преобразования:


In [2]:
transform = transforms.Compose(
    [transforms.ToTensor(),
     transforms.Normalize((0.5,0.5,0.5), (0.5,0.5,0.5))])



In [5]:
# необходимо разпаковать датасеты в окружение, делается это так:архивируем каталоги в .zip и потом размещаем для закачки в нашу модель на своем Гугл_диске , в корне,  под названиями test.zip и train.zip.в виртуальной машине разархивированные файлы разместить в каталоге /content/dataset/ соответственно.
import zipfile
with zipfile.ZipFile('/content/gdrive/My Drive/cifar.zip', 'r') as zip_ref:
  zip_ref.extractall('/content/dataset')

  

Перед загрузкой наших обучающего и тестового наборов:
 Примечание: я использую соглашения об именовании, аналогичные тому, как fastai называет вещи, так что вы можете видеть, как они могут быть связаны друг с другом


In [7]:
dset_train = torchvision.datasets.CIFAR10(root='/content/dataset/cifar10', train=True,
                                        download=True, transform=transform)
 dset_test = torchvision.datasets.CIFAR10(root='/content/dataset/cifar10', train=False,
                                       download=True, transform=transform)
 


IndentationError: ignored

Files already downloaded and verified
Next we'll make our Dataloaders:

In [None]:
trainloader = torch.utils.data.DataLoader(dset_train, batch_size=4,
                                          shuffle=True, num_workers=2)
testloader = torch.utils.data.DataLoader(dset_test, batch_size=4,
                                         shuffle=False, num_workers=2)
 

И на этом мы пока остановимся, перейдем к следующей модели
Модель
Мы возьмем архитектуру из учебника и используем ее здесь:


In [4]:
import torch.nn as nn
import torch.nn.functional as F
 
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x


И наконец, мы создадим его экземпляр:


In [5]:
net = Net()


Функция потерь и оптимизатор
Далее мы введем их функцию потерь и оптимизатор.
Функция потерь достаточно проста:


In [8]:
criterion = nn.CrossEntropyLoss()


Однако оптимизатор требует немного магии fastai, в частности, в виде OptimWrapper. Наша функция оптимизатора должна быть определена следующим образом

In [14]:
from fastai.optimizer import OptimWrapper
from torch import optim
 
def opt_func(params, **kwargs): return OptimWrapper(optim.SGD(params, lr=0.001))


Обучение
Теперь у нас есть все необходимое для обучения модели, так что теперь давайте запустим цикл обучения fastai, также известный как Learner.
 Learner fastai ожидает, что будут использоваться DataLoader'ы, а не просто один DataLoader, поэтому давайте сделаем так:
 Примечание: fastai также ожидает присутствия валидационного DataLoader, поэтому мы будем привязывать сюда тестовый загрузчик


In [11]:
import fastai
fastai.__version__

'1.0.61'

In [13]:
 #!pip install -U fastai #скачаем последнюю версию фаст аи 

Collecting fastai
[?25l  Downloading https://files.pythonhosted.org/packages/bd/ca/bc9f4e04adcdfda1357f5c63bc67a7bf4f315883ca544726f3376b1ed068/fastai-2.4-py3-none-any.whl (187kB)
[K     |█▊                              | 10kB 23.9MB/s eta 0:00:01[K     |███▌                            | 20kB 29.8MB/s eta 0:00:01[K     |█████▎                          | 30kB 32.4MB/s eta 0:00:01[K     |███████                         | 40kB 33.2MB/s eta 0:00:01[K     |████████▊                       | 51kB 35.4MB/s eta 0:00:01[K     |██████████▌                     | 61kB 36.9MB/s eta 0:00:01[K     |████████████▏                   | 71kB 36.5MB/s eta 0:00:01[K     |██████████████                  | 81kB 34.8MB/s eta 0:00:01[K     |███████████████▊                | 92kB 35.3MB/s eta 0:00:01[K     |█████████████████▍              | 102kB 35.1MB/s eta 0:00:01[K     |███████████████████▏            | 112kB 35.1MB/s eta 0:00:01[K     |█████████████████████           | 122kB 35.1MB/s

In [15]:
from fastai.data.core import DataLoaders
 
dls = DataLoaders(trainloader, testloader)


NameError: ignored

Наконец, мы собираемся завершить все это в Learner. Как уже упоминалось, Learner - это клей, который соединяет все вместе и позволяет пользователям использовать политику Лесли Смит "Один цикл", поиск скорости обучения и другие преимущества обучения fastai.
Давайте создадим его, передав наши dls, модель, оптимизатор и функцию потерь:


In [None]:
from fastai.learner import Learner

Чтобы получить причудливо выглядящий прогресс-бар fastai, нам нужно импортировать ProgressCallback:


In [None]:
from fastai.callback.progress import ProgressCallback


Нам также нужно передать CudaCallback, чтобы наши пакеты можно было переместить на GPU (DataLoaders в fastai может сделать это автоматически).


In [None]:
from fastai.callback.data import CudaCallback
 
learn = Learner(dls, net, loss_func=criterion, opt_func=opt_func, cbs=[CudaCallback])
 


Наконец, давайте проведем минимальную тренировку.
Теперь у нас есть все необходимое для базовой подгонки:
 Примечание: Поскольку мы уже передали скорость обучения в Learner, нам не нужно передавать ее здесь.


In [None]:
learn.fit(2)

Что дальше?
Отлично, теперь мы обучили нашу модель, но что нам с ней делать? Как ее вывести?
Ваша модель находится в learn.model, и мы уже видели, что ранее мы передали обычную модель Pytorch. Поскольку мы используем базовый класс Learner из fastai, сама модель не была изменена. В результате, это все еще обычная модель Pytorch, которую мы можем сохранить:


In [None]:
torch.save(learn.model.state_dict(), './cifar_net.pth')


И это действительно все! Как вы можете видеть, минимальное, что вы можете получить при использовании фреймворка fastai, это:
Pytorch DataLoader
Pytorch model
fastai Learner
fastai Optimizer
Заключительные замечания
Я надеюсь, что это просветило вас о том, насколько гибким может быть фреймворк fastai для ваших учебных нужд с идеалистической целью просто получить модель.
Поскольку мы убрали большую часть  framework fastai, с этого момента вы должны использовать стандартный Pytorch, так как специфические для fastai функции, такие как test_dl и predict, больше не смогут быть использованы, поскольку вы не использовали fastai DataLoader.
Спасибо, что читаете!
