In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms

# Завантаження MNIST
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
trainset = torchvision.datasets.MNIST(root='./dataset', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)

# Визначення класу спочатку 2-ї нейромережі
class TwoLayerNN(nn.Module):
    def __init__(self):
        super(TwoLayerNN, self).__init__()
        self.fc1 = nn.Linear(28*28, 64)  # шар 1
        self.fc2 = nn.Linear(64, 10)     # шар 2

    def forward(self, x):
        x = x.view(-1, 28*28)
        x = torch.relu(self.fc1(x))
        x = self.fc2(x)
        return x

# Ініціалізація моделі, функції втрат та оптимізатора
net2 = TwoLayerNN()
criterion2 = nn.CrossEntropyLoss()
optimizer2 = optim.SGD(net2.parameters(), lr=0.001, momentum=0.9)

# Тренування
for epoch in range(10):
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data
        optimizer2.zero_grad()
        outputs = net2(inputs)
        loss = criterion2(outputs, labels)
        loss.backward()
        optimizer2.step()
        running_loss += loss.item()
    print(f"Епоха {epoch+1}, Втрати: {running_loss / len(trainloader)}")

print("Кінець тренування 2-х шарової")

# Оцінка точності
correct = 0
total = 0
with torch.no_grad():
    for data in trainloader:
        images, labels = data
        outputs = net2(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f"Точність 2-шарової мережі: {100 * correct / total}%")

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to ./dataset/MNIST/raw/train-images-idx3-ubyte.gz


100%|████████████████████████████| 9912422/9912422 [00:02<00:00, 4928804.30it/s]


Extracting ./dataset/MNIST/raw/train-images-idx3-ubyte.gz to ./dataset/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to ./dataset/MNIST/raw/train-labels-idx1-ubyte.gz


100%|█████████████████████████████████| 28881/28881 [00:00<00:00, 857160.91it/s]


Extracting ./dataset/MNIST/raw/train-labels-idx1-ubyte.gz to ./dataset/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to ./dataset/MNIST/raw/t10k-images-idx3-ubyte.gz


100%|████████████████████████████| 1648877/1648877 [00:00<00:00, 2709775.37it/s]


Extracting ./dataset/MNIST/raw/t10k-images-idx3-ubyte.gz to ./dataset/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to ./dataset/MNIST/raw/t10k-labels-idx1-ubyte.gz


100%|██████████████████████████████████| 4542/4542 [00:00<00:00, 3984632.66it/s]


Extracting ./dataset/MNIST/raw/t10k-labels-idx1-ubyte.gz to ./dataset/MNIST/raw

Епоха 1, Втрати: 0.7764453025959702
Епоха 2, Втрати: 0.3701750437047944
Епоха 3, Втрати: 0.32695345890356786
Епоха 4, Втрати: 0.30357958447100764
Епоха 5, Втрати: 0.28711757082134676
Епоха 6, Втрати: 0.2725509738347042
Епоха 7, Втрати: 0.25890630800555003
Епоха 8, Втрати: 0.24455337774461267
Епоха 9, Втрати: 0.232456151054485
Епоха 10, Втрати: 0.2201272824894327
Кінець тренування 2-х шарової
Точність 2-шарової мережі: 93.97333333333333%


In [2]:
# Визначення класу тришарової нейромережі
class ThreeLayerNN(nn.Module):
    def __init__(self):
        super(ThreeLayerNN, self).__init__()
        self.fc1 = nn.Linear(28*28, 128)  # Повністю з'єднаний шар 1
        self.fc2 = nn.Linear(128, 64)     # Повністю з'єднаний шар 2
        self.fc3 = nn.Linear(64, 10)      # Повністю з'єднаний шар 3

    def forward(self, x):
        x = x.view(-1, 28*28)
        x = torch.relu(self.fc1(x))
        x = torch.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# Ініціалізація моделі, функції втрат та оптимізатора
net3 = ThreeLayerNN()
criterion3 = nn.CrossEntropyLoss()
optimizer3 = optim.SGD(net3.parameters(), lr=0.001, momentum=0.9)

# Тренування моделі
for epoch in range(10):
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data
        optimizer3.zero_grad()
        outputs = net3(inputs)
        loss = criterion3(outputs, labels)
        loss.backward()
        optimizer3.step()
        running_loss += loss.item()
    print(f"Епоха {epoch+1}, Втрати: {running_loss / len(trainloader)}")

print("Кінець тренування 3-х шарової")

# Оцінка точності моделі
correct = 0
total = 0
with torch.no_grad():
    for data in trainloader:
        images, labels = data
        outputs = net3(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f"Точність 3-шарової мережі: {100 * correct / total}%")


Епоха 1, Втрати: 1.0610160054301403
Епоха 2, Втрати: 0.3894066910849197
Епоха 3, Втрати: 0.32894117802953415
Епоха 4, Втрати: 0.29524024571182883
Епоха 5, Втрати: 0.2700586396136454
Епоха 6, Втрати: 0.2476796881158723
Епоха 7, Втрати: 0.22676163100436933
Епоха 8, Втрати: 0.20844834331653392
Епоха 9, Втрати: 0.19288604799459483
Епоха 10, Втрати: 0.17967591350918005
Кінець тренування 3-х шарової
Точність 3-шарової мережі: 95.13166666666666%


In [3]:
# Ініціалізація моделі, функції втрат та оптимізатора
net3_mse = ThreeLayerNN()
criterion3_mse = nn.MSELoss()  # Використовуємо Mean Squared Error для оцінки похибки
optimizer3_mse = optim.Adam(net3_mse.parameters(), lr=0.001)  # Використовуємо оптимізатор Adam

# Тренування моделі
for epoch in range(10):
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data
        # Одне гаряче кодування міток для використання з MSE
        labels_one_hot = torch.nn.functional.one_hot(labels, 10).float()
        optimizer3_mse.zero_grad()
        outputs = net3_mse(inputs)
        loss = criterion3_mse(outputs, labels_one_hot)
        loss.backward()
        optimizer3_mse.step()
        running_loss += loss.item()
    print(f"Епоха {epoch+1}, Втрати: {running_loss / len(trainloader)}")

print("Кінець тренування 3-х шарової з MSE та Adam")

# Оцінка точності моделі
correct = 0
total = 0
with torch.no_grad():
    for data in trainloader:
        images, labels = data
        outputs = net3_mse(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f"Точність 3-шарової мережі з MSE та Adam: {100 * correct / total}%")


Епоха 1, Втрати: 0.019861262782153163
Епоха 2, Втрати: 0.010159035083720647
Епоха 3, Втрати: 0.00807321152184655
Епоха 4, Втрати: 0.00709772091492939
Епоха 5, Втрати: 0.0064312093641742
Епоха 6, Втрати: 0.0059562952375349235
Епоха 7, Втрати: 0.005561459256382758
Епоха 8, Втрати: 0.005044851225114731
Епоха 9, Втрати: 0.0048595261294642955
Епоха 10, Втрати: 0.0044384150600025075
Кінець тренування 3-х шарової з MSE та Adam
Точність 3-шарової мережі з MSE та Adam: 98.22833333333334%


In [None]:
Точність 2-шарової мережі: 93.97333333333333%
Точність 3-шарової мережі: 95.13166666666666%
Точність 3-шарової мережі з MSE та Adam: 98.22833333333334%