In [9]:
import numpy as np

import torch 
import torchvision 
import torch.nn as nn 
from torchvision.transforms import ToTensor

In [10]:
# Використовуючи наведений в лекції датасет і код, 
# створюємо на основі двошарової нейромережі тришарову

class ThreeLayersNet(nn.Module):
    def __init__ (self, nX, nH1, nH2, nY):
        super (ThreeLayersNet, self).__init__()
        
        self.fc1 = nn.Linear(nX, nH1)
        self.fc2 = nn.Linear(nH1, nH2)
        self.fc3 = nn.Linear(nH2, nY)
        
    def forward(self, x):
        x = self.fc1(x)
        x = nn.Sigmoid()(x)
        x = self.fc2(x)
        x = nn.Sigmoid()(x)
        x = self.fc3(x)
        x = nn.Sigmoid()(x)
        return x
    
model = ThreeLayersNet(2, 5, 3, 1)

In [11]:
# Створимо дані

X = torch.rand(1200, 2)
Y = (torch.sum((X-0.5)**2, axis=1) < 0.1).float().view(-1, 1)

In [12]:
# Використаємо для оцінки похибки Mean Squared Error, в якості оптимізатора – Adam

loss = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.01)

In [13]:
# Задамо функцію fit

def fit(model, X, Y, batch_size=100, train=True):
    model.train(train)
    sumL, sumA, numB = 0, 0, int(len(X)/batch_size)
    
    for i in range(0, numB*batch_size, batch_size):
        xb = X[i: i+batch_size]
        yb = Y[i: i+batch_size]
        
        y = model(xb)
        L = loss(y, yb)
        
        if train:
            optimizer.zero_grad()
            L.backward()
            optimizer.step()
            
        sumL += L.item()
        sumA += (y.round() == yb).float().mean()
        
        return sumL/numB, sumA/numB     
    

In [14]:
# Виведемо зміну основних параметрів навчання після кожної сотої епохи:

print('before: loss: %.4f accuracy: %.4f' % fit(model, X, Y))

epochs = 1000
for epoch in range(epochs):
      L, A = fit(model, X, Y)
      
      if epoch % 100 == 0 or epoch == epochs-1:
          print(f'epoch: {epoch:5d} loss: {L:.4f} accuracy: {A:.4f}')
      

before: loss: 0.0224 accuracy: 0.0267
epoch:     0 loss: 0.0220 accuracy: 0.0267
epoch:   100 loss: 0.0181 accuracy: 0.0567
epoch:   200 loss: 0.0181 accuracy: 0.0567
epoch:   300 loss: 0.0181 accuracy: 0.0567
epoch:   400 loss: 0.0181 accuracy: 0.0567
epoch:   500 loss: 0.0179 accuracy: 0.0567
epoch:   600 loss: 0.0172 accuracy: 0.0567
epoch:   700 loss: 0.0162 accuracy: 0.0567
epoch:   800 loss: 0.0127 accuracy: 0.0650
epoch:   900 loss: 0.0058 accuracy: 0.0775
epoch:   999 loss: 0.0028 accuracy: 0.0825


In [15]:
# При додаванні ще одного прихованого шару з трьома нейронами та функцією активізації сигмоїдою
# бачимо що похибка зменшилась (0.0028 проти 0.0256 з лекції) та точність зросла (0.0825 проти 0.0725 з лекції)