<a href="https://colab.research.google.com/github/deepds/pytorch/blob/master/Pytroch1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### 1. Сверточные слои
Изображение, три канала, сверточный фильтр, свертка, карта активации

![](https://drive.google.com/uc?export=view&id=12KxN_oIhwNlsTgr-LVKwlnNHwSnzBmeU)

Два способа вычисления свертки в Pytorch

In [0]:
import torch
import torch.nn

image = torch.rand(16,3,32,32)
conv_filter = torch.nn.Conv2d(in_channels=3, out_channels=1, kernel_size=5, stride=1, padding=0)
out_feature = conv_filter(image)

print(out_feature.shape)

torch.Size([16, 1, 28, 28])


In [0]:
import torch
import torch.nn.functional as F

image = torch.rand(16, 3, 32, 32)
filter = torch.rand(1, 3, 5, 5)
out_feat_f = F.conv2d(image, filter, stride=1, padding=0)

print(out_feat_f.shape)


torch.Size([16, 1, 28, 28])


Оператор свертки - путь ООП
Давайте начнем эту главу с помощью оператора свертки из пакета torch.nn. Вы собираетесь создать случайный тензор, который будет представлять ваше изображение, и случайные фильтры для свертывания изображения. Затем вы примените эти изображения.

In [0]:
# Create 10 random images of shape (1, 28, 28)
images = ____.____(____, ____, ____, ____)

# Build 6 conv. filters (out_channels=6)
conv_filters = ____.____.____(____=____, ____=____, ____=____, ____=____, ____=____)

# Convolve the image with the filters 
output_feature = ____(____)
print(output_feature.shape)

Оператор свертки - Функциональный способ
В то время как я и большинство практикующих PyTorch любят пакет torch.nn (ООП), другие практикующие предпочитают строить модели нейронных сетей более функциональным способом, используя torch.nn.functional. Что еще более важно, можно смешивать понятия и использовать обе библиотеки одновременно (мы уже делали это в предыдущей главе). Вы собираетесь построить ту же нейронную сеть, которую вы создали в предыдущем упражнении, но на этот раз, используя функциональный способ.

In [0]:
# Create 10 random images
image = ____.____(____, ____, ____, ____)

# Create 6 filters
filters = ____.____(____, ____, ____, ____)

# Convolve the image with the filters
output_feature = ____.____(____, ____, ____=____, ____=____)
print(output_feature.shape)

### 2. Субдискретизующие слови (Pooling)

Отбор признаков и понижение размерности

![](https://drive.google.com/uc?export=view&id=1iDS9PSxNC7Yzp2QYjed9jW7NxosQfkPU)

In [0]:
import torch
import torch.nn

im = torch.Tensor([[[3,1,3,5],[6,0,7,9],[3,2,1,4],[0,2,4,3]]])

max_pooling = torch.nn.MaxPool2d(2)
output_feature = max_pooling(im)

print(output_feature)

tensor([[[6., 9.],
         [3., 4.]]])


In [0]:
import torch
import torch.nn.functional as F

im = torch.Tensor([[[3,1,3,5],[6,0,7,9],[3,2,1,4],[0,2,4,3]]])

output_feature = F.max_pool2d(im, 2)

print(output_feature)

tensor([[[6., 9.],
         [3., 4.]]])


Оператор Max-pooling
Здесь вы собираетесь попрактиковаться в использовании max-pooling как в ООП, так и функционально, и убедитесь, что полученные результаты одинаковы. Мы уже создали и распечатали изображение для вас, а также импортировали библиотеку torch в дополнение к torch.nn и torch.nn. Функциональные как F-пакеты.

In [0]:
# Build a pooling operator with size `2`.
max_pooling = ____

# Apply the pooling operator
output_feature = ____

# Use pooling operator in the image
output_feature_F = ____

# print the results of both cases
print(____)
print(____)

Оператор среднего пулинга
После кодирования оператора max-pooling вы теперь собираетесь кодировать оператор среднего пула. Вам просто нужно заменить максимальный пул на средний пул.

In [0]:
# Build a pooling operator with size `2`.
avg_pooling = ____

# Apply the pooling operator
output_feature = ____

# Use pooling operator in the image
output_feature_F = ____

# print the results of both cases
print(____)
print(____)

### 3. Convolution Networks

In [0]:
class AlexNet(nn.Module):
  
  def __init__(self, num_classes=1000):
    
    super(AlexNet, self).__init__()
    self.conv1 = nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2)
    self.relu = nn.ReLU(inplace=True) # inplace = True - x будет модифицирован напрямую и переприсвоен
    self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2)
    self.conv2 = nn.Conv2d(64, 192, kernel_size=5, padding=2)
    self.conv3 = nn.Conv2d(192, 384, kernel_size=3, padding=1)
    self.conv4 = nn.Conv2d(384, 256, kernel_size=3, padding=1)
    self.conv5 = nn.Conv2d(256, 256, kernel_size=3, padding=1)
    self.avgpool = nn.AdaptiveAvgPool2D((6,6))
    self.fc1 = nn.Linear(256*6*6, 4096)
    self.fc2 = nn.Linear(4096, 4096)
    self.fc3 = nn.Linear(4096, num_classes) 
    
    
  def forward(self, x):
    
    x = self.relu(self.conv1(x))
    x = self.maxpool(x)
    x = self.relu(self.conv2(x)) # inplace = True - x будет модифицирован напрямую и переприсвоен
    x = self.maxpool(x)
    x = self.relu(self.conv3(x)) 
    x = self.relu(self.conv4(x)) 
    x = self.relu(self.conv5(x))
    x = self.maxpool(x)
    x = self.avgpool(x)
    x = x.view(x.size(0),256*6*6)
    x = self.relu(self.fc1(x))
    x = self.relu(self.fc2(x))
    x = self.fc3(x)
    return x
  
  net = AlexNet()

Ваш первый метод CNN - __init__
Вы собираетесь построить свою первую сверточную нейронную сеть. Вы собираетесь использовать набор данных MNIST в качестве набора данных, который состоит из рукописных цифр от 0 до 9. Сверточная нейронная сеть будет иметь 2 сверточных слоя, каждый из которых сопровождается нелинейностью ReLU, и полностью связанный слой. Мы уже импортировали torch и torch.nn как nn. Помните, что каждый объединяющий слой делит пополам как высоту, так и ширину изображения, поэтому при использовании двух объединяющих слоев высота и ширина составляют 1/4 от первоначальных размеров.

На данный момент вы собираетесь реализовать метод __init__ сети. В следующем упражнении вы реализуете метод .forward ().

NB: не используйте inplace = True в качестве аргумента для ReLU () в строке 10

In [0]:
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        
        # Instantiate two convolutional layers
        self.conv1 = nn.Conv2d(in_channels=____, out_channels=____, kernel_size=____, padding=____)
        self.conv2 = ____
        
        # Instantiate the ReLU nonlinearity
        self.relu = ____
        
        # Instantiate a max pooling layer
        self.pool = nn.MaxPool2d(____, ____)
        
        # Instantiate a fully connected layer
        self.fc = nn.Linear(____, ____)

Ваш первый метод CNN - forward ()
Теперь, когда вы объявили все параметры вашего CNN, все, что вам нужно сделать, это реализовать метод forward () сети, и вуаля, у вас есть ваш самый первый PyTorch CNN.

Примечание: для целей оценки весь код класса должен быть в сценарии. Мы используем метод __init__, как вы его кодировали в предыдущем упражнении, в то время как вы собираетесь кодировать метод .forward () здесь.

In [0]:
class Net(nn.Module):
    def __init__(self, num_classes):
        super(Net, self).__init__()
		
        # Instantiate the ReLU nonlinearity
        self.relu = nn.ReLU()
        
        # Instantiate two convolutional layers
        self.conv1 = nn.Conv2d(in_channels=1, out_channels=5, kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(in_channels=5, out_channels=10, kernel_size=3, padding=1)
        
        # Instantiate a max pooling layer
        self.pool = nn.MaxPool2d(2, 2)
        
        # Instantiate a fully connected layer
        self.fc = nn.Linear(7 * 7 * 10, 10)

    def forward(self, x):

        # Apply conv followd by relu, then in next line pool
        x = self.relu(self.____)
        x = self.pool(____)

        # Apply conv followd by relu, then in next line pool
        x = self.relu(self.____)
        x = self.____(____)

        # Prepare the image for the fully connected layer
        x = x.view(-1, ____)

        # Apply the fully connected layer and return the result
        return self.____

### 4. Инференс 

In [0]:
net  = Net()

criterion = nn.CrossEntropyLoss()

optimizer = optim.Adam(net.parameters(), lr=3e-04)

for epoch in range(10):
  for i, data in enumerate(trainloader, 0):
    #Get the inputs
    inputs, labels = data
    inputs = inputs.view(-1, 32*32*3)
    
    #Zero the parameter gradient 
    optimizer.zero_grad()
    
    # Forward + backward + optimize
    
    outputs = net(inputs)
    loss = criterion(outputs, labels)
    loss.backward()
    optimizer.step()

In [0]:
correct, total = 0, 0
predictions = []
net.eval()
for i, data in enumerate(testloader, 0):
  inputs, data = data
  outputs = net(inputs)
  _, predicted = torch.max(outputs.data, 1)
  predictions.append(outputs)
  total += labels.size(0)
  correct += (predicted == labels).sum().item()
  
print('The testing set accuracy of the network is: %d %%' % (100*correct/total))

Обучение CNNs
Аналогично тому, что вы сделали в главе 2, вы собираетесь обучать нейронную сеть. Однако на этот раз вы будете тренировать CNN, созданный на предыдущем уроке, вместо полностью подключенной сети. Пакеты, которые вам нужны, были импортированы для вас, и создана сеть (называемая сетью). Также доступна функция кросс-энтропийной потери (называемая критерием) и оптимизатор Адама (называемый оптимизатором). Мы произвели субдискретизацию тренировочного набора, чтобы обучение проходило быстрее, и вы собираетесь использовать одну эпоху.

In [0]:
# Iterate over the data in the test_loader
for data in ____:
  
    # Get the image and label from data
    ____, ____ = data
    
    # Make a forward pass in the net with your image
    output = net(____)
    
    # Argmax the results of the net
    _, predicted = torch.max(____.data, 1)
    if predicted == label:
        print("Yipes, your net made the right prediction " + str(predicted))
    else:
        print("Your net prediction was " + str(predicted) + ", but the correct label is: " + str(label))

### 5. Sequential model

Мы должны объявить каждый слой в init класса, а затем в функции forward последовательно применить их в структуре. Можно воспользоваться Sequential layer, чтобы застэкать несколько слоев вместе

In [0]:
class AlexNet(nn.Module):
  
  def __init__(self, num_classes=1000):
    
    super(AlexNet, self).__init__()
    self.conv1 = nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2)
    self.relu = nn.ReLU(inplace=True)
    self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2)
    self.conv2 = nn.Conv2d(64, 192, kernel_size=5, padding=2)
    self.conv3 = nn.Conv2d(192, 384, kernel_size=3, padding=1)
    self.conv4 = nn.Conv2d(384, 256, kernel_size=3, padding=1)
    self.conv5 = nn.Conv2d(256, 256, kernel_size=3, padding=1)
    self.avgpool = nn.AdaptiveAvgPool2D((6,6))
    self.fc1 = nn.Linear(256*6*6, 4096)
    self.fc2 = nn.Linear(4096, 4096)
    self.fc3 = nn.Linear(4096, num_classes) 
    
    
  def forward(self, x):
    
    x = self.relu(self.conv1(x))
    x = self.maxpool(x)
    x = self.relu(self.conv2(x))
    x = self.maxpool(x)
    x = self.relu(self.conv3(x))
    x = self.relu(self.conv4(x))
    x = self.relu(self.conv5(x))
    x = self.maxpool(x)
    x = self.avgpool(x)
    x = x.view(x.size(0),256*6*6)
    x = self.relu(self.fc1(x))
    x = self.relu(self.fc2(x))
    x = self.fc3(x)
    return x
  
  net = AlexNet()

In [0]:
class AlexNet(nn.Module):
  
  def __init__(self, num_classes=1000):
    
    super(AlexNet, self).__init__()
    # feature extraction part
    self.features = nn.Sequential(
    nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2), nn.ReLU(inplace=True), nn.MaxPool2d(kernel_size=3, stride=2), 
        nn.Conv2d(64, 192, kernel_size=5, padding=2), nn.Conv2d(192, 384, kernel_size=3, padding=1), 
        nn.Conv2d(384, 256, kernel_size=3, padding=1), nn.Conv2d(256, 256, kernel_size=3, padding=1))
    # feature selection part
    self.avgpool = nn.AdaptiveAvgPool2D((6,6))
    # classification part
    self.classifier = nn.Sequential(nn.Dropout(), nn.Linear(256*6*6, 4096), nn.ReLU(inplace=True), 
                                    nn.Dropout(), nn.Linear(4096, 4096), nn.ReLU(inplace=True), 
                                    nn.Linear(4096, num_classes) )
    
    def forward(self, x):
      x = self.features(x)
      x = self.avgpool(x)
      x = x.view(-1, 256*6*6)
      x = self.classifier(x)
      return x

Последовательный модуль - метод init

Узнав о последовательном модуле, сейчас самое время посмотреть, как вы можете преобразовать нейронную сеть, которая не использует последовательные модули, в тот, который использует их. Мы даем код для построения сети обычным способом, и вы собираетесь написать код для той же сети, используя последовательные модули.

In [0]:
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        
        # Declare all the layers for feature extraction
        self.features = nn.Sequential(nn.Conv2d(in_channels=1, out_channels=5, kernel_size=3, padding=1), 
                                      nn.ReLU(inplace=True),
                                      nn.Conv2d(in_channels=____, out_channels=____, kernel_size=____, padding=____), 
                                      nn.MaxPool2d(2, 2), nn.ReLU(inplace=True),
                                      nn.Conv2d(____=____, ____=____, ____=____, ____=____), 
                                      nn.ReLU(____=____),
                                      nn.Conv2d(____=____, ____=____, ____=____, ____=____), 
                                      nn.MaxPool2d(____, ____), nn.ReLU(____=____))
        
        def forward(self, x):
      
        # Apply the feature extractor in the input
        x = ____
        
        # Squeeze the three spatial dimensions in one
        x = x.view(-1, ____ * ____ * ____)
        
        # Classify the images
        x = ____
        return x

Валидация

Проблема заключается в том, что наборы данных обычно не разделяются на обучение, проверку и тестирование. Ваша задача как специалиста по данным состоит в том, чтобы разделить набор данных на обучение, тестирование и проверку. Самый простой (и наиболее используемый) способ сделать это - выполнить случайное разбиение набора данных. В PyTorch это можно сделать с помощью объекта SubsetRandomSampler. Вы собираетесь разделить обучающую часть набора данных MNIST на обучение и проверку. После случайного перемешивания набора данных используйте первые 55000 баллов для обучения, а оставшиеся 5000 баллов - для проверки.

In [0]:
# Shuffle the indices
indices = np.arange(60000)
np.random.shuffle(indices)

# Build the train loader
train_loader = torch.utils.data.DataLoader(datasets.MNIST('mnist', download=True, train=True,
                     transform=transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))])),
                     batch_size=64, shuffle=False, sampler=torch.utils.data.SubsetRandomSampler(indices[:55000]))

# Build the validation loader
val_loader = torch.utils.data.DataLoader(datasets.MNIST('mnist', download=True, train=True,
                   transform=transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))])),
                   batch_size=64, shuffle=False, sampler=torch.utilds.data.SubsetRandomSampler(indices[55000:60000]))

### 6. Регуляризация

L2-регуляризация

Вы собираетесь реализовать каждый из методов регуляризации, описанных в предыдущем видео. При этом вы также будете помнить важные понятия, изучаемые на протяжении всего курса. Вы начнете с l2-регуляризации, наиболее важной техники регуляризации в машинном обучении. Как вы видели в видео, l2-регуляризация просто наказывает за большие веса и, таким образом, заставляет сеть использовать только маленькие веса.

![](https://drive.google.com/uc?export=view&id=1IFFVB-2wA9I8T3D3r3S7BvHVXAs9etjC)


![](https://drive.google.com/uc?export=view&id=1Pxhw1mUp9QXIoWp8CXAwwWfvIZCFOWgv)


In [0]:
# Instantiate the network
model = Net()

# Instantiate the cross-entropy loss
criterion = nn.CrossEntropyLoss()

# Instantiate the Adam optimizer
optimizer = optim.Adam(model.parameters(), lr=3e-4, weight_decay=0.001)

![](https://drive.google.com/uc?export=view&id=14_sJ2S2Y-VC8OiSsJjTSYyMhW1QitYyA)

### Dropout

Вы видели, что dropout является эффективной техникой, чтобы избежать переобучения. Обычно дропаут применяется в полносвязанных нейронных сетях или в полносвязанных слоях сверточной нейронной сети. Теперь вы хотите реализовать dropout и использовать его в небольшой полностью подключенной нейронной сети.

Для первого скрытого слоя используйте 200 единиц, для второго скрытого слоя - 500 единиц, а для выходного слоя - 10 единиц (по одному для каждого класса). Для функции активации используйте ReLU. Используйте .Dropout () с силой 0,5, между первым и вторым скрытым слоем. Используйте последовательный модуль в следующем порядке: полностью подключен, активация, выпадение, полностью подключен, активация, полностью подключен.

In [0]:
class Net(nn.Module):
    def __init__(self):
        
        # Define all the parameters of the net
        self.classifier = nn.Sequential(
            nn.Linear(28*28, 200),
            nn.ReLU(inplace=True),
            nn.Dropout(p=0.5),
            nn.Linear(200, 500),
            nn.ReLU(inplace=True),
            nn.Linear(500, 10))
        
    def forward(self, x):
    
    	# Do the forward pass
        return self.classifier(x)

### Бэтч нормализация

Дропаут используется для упорядочения полносвязанных слоев. Пакетная нормализация используется для повышения эффективности обучения сверточных нейронных сетей, в то же время обеспечивая эффект регуляризации. Вы собираетесь реализовать метод __init__ для небольшой сверточной нейронной сети с пакетной нормализацией. Часть извлечения признаков CNN будет содержать следующие модули (по порядку): conv, maxpool, relu, batchnorm, conv, maxpool, relu, batchnorm.

Первый сверточный слой будет содержать 10 выходных каналов, а второй будет содержать 20 выходных каналов. Как всегда, мы собираемся использовать набор данных MNIST с изображениями, имеющими форму (28, 28) в формате градаций серого (1 канал). Во всех случаях размер фильтра должен быть 3, шаг должен быть 1, а отступ - 1.

![](https://drive.google.com/uc?export=view&id=16B6KB2j4Qr7wJrqCEt5HItZuqZjJl-eZ)

In [0]:
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        
        # Implement the sequential module for feature extraction
        self.features = nn.Sequential(
            nn.Conv2d(in_channels=1, out_channels=10, kernel_size=3, stride=1, padding=1),
            nn.MaxPool2d(____, ____), nn.ReLU(inplace=____), nn.BatchNorm2d(____), 
            ____,
            ____, ____, ____)
        
        # Implement the fully connected layer for classification
        self.fc = nn.Linear(in_features=____, out_features=____)

### Transfer Learning (перенос обучения)

![](https://drive.google.com/uc?export=view&id=1NNrBuSAIUzEsTeWeVgMtB9wKI7zZRydL)


![](https://drive.google.com/uc?export=view&id=1m13Y8HjMxwUDg4yZpkVrTlxFqHhswHwN)

In [0]:
# Instantiate model

model = Net()

# Load parameters from the old model

model.load_state_dict(torch.load("cifar10_net.pth"))

# Freeze all the layers except the final one

for param in model.parameters():
  
  param.requires_grad=False
  
# Change the number of output units  

model.fc = nn.Linear(4*4*1024, 100)

# Train the model, training mode
model.train()


### Pretrained model library

In [0]:
import torchvision

model = torchvision.models.resnet18(pretrained=True)

model.fc = Linear(512, num_classes)

Fine-tuning CNN

Ранее вы обучали модель классификации рукописных цифр и сохраняли параметры модели в my_net.pth. Теперь вы собираетесь классифицировать рукописные буквы, но у вас есть меньший тренировочный набор.

На первом этапе вы создадите новую модель, используя этот тренировочный набор, но точность будет низкой. Далее вы проведете то же обучение, но начнете с параметров из вашей модели классификации цифр. Хотя цифры и буквы - две разные проблемы классификации, вы увидите, что использование информации из вашей предыдущей модели значительно улучшит эту.

In [0]:
# Create a new model
model = ____

# Change the number of out channels
model.fc = nn.Linear(7 * 7 * 512, ____)

# Train and evaluate the model
model.train()
train_net(model, optimizer, criterion)
print("Accuracy of the net is: " + str(model.eval()))

In [0]:
# Create a model using
model = Net()

# Load the parameters from the old model
model.____(torch.____('my_net.pth'))

# Change the number of out channels
model.fc = nn.Linear(7 * 7 * 512, 26)

# Train and evaluate the model
model.train()
train_net(model, optimizer, criterion)
print("Accuracy of the net is: " + str(model.eval()))

### Модуль Torchvision

На практике, однако, очень часто можно настроить CNN, которые кто-то другой (обычно разработчики библиотеки) предварительно обучил на ImageNet. Большим сетям все еще требуется много времени для обучения на больших наборах данных, и, возможно, вы не можете позволить себе обучать большую сеть на наборе данных с 1,2 миллиона изображений на вашем ноутбуке.

Вместо этого вы можете просто загрузить сеть и настроить ее в своем наборе данных. Это то, что вы будете делать прямо сейчас. Предполагается, что у вас есть личный набор данных, содержащий изображения всех ваших последних 7 праздников. Вы хотите построить нейронную сеть, которая может классифицировать каждое изображение в зависимости от выходного дня. Однако, поскольку набор данных очень мал, вам необходимо использовать метод fine tuning

In [0]:
# Import the module


# Download resnet18
model = torchvision.models.resnet18(____=____)

# Freeze all the layers bar the last one
for param in model.____:
    param.____ = ____

# Change the number of output units
model.fc = nn.Linear(512, ____)