In [7]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms

# Определение размеров слоев
input_size = 784  # Размер входных данных (28x28 изображения)
hidden_size = 128
output_size = 10  # Количество классов в наборе данных MNIST

# Загрузка и предобработка данных
transform = transforms.Compose([
    transforms.ToTensor(),  # Преобразование изображения в тензор
    transforms.Normalize((0.5,), (0.5,))  # Нормализация изображений
])

# Загрузка набора данных MNIST
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
# Создание DataLoader для удобного доступа к данным во время обучения
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)

# Определение модели
class MyModel(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(MyModel, self).__init__()
        # Определение слоев нейронной сети
        self.fc1 = nn.Linear(input_size, hidden_size)  # Полносвязный слой с input_size входами и hidden_size выходами
        self.fc2 = nn.Linear(hidden_size, output_size)  # Полносвязный слой с hidden_size входами и output_size выходами

    def forward(self, x):
        # Прямой проход через нейронную сеть
        x = torch.relu(self.fc1(x))  # Применение функции активации ReLU к выходам первого слоя
        x = self.fc2(x)  # Выходные данные после второго слоя
        return x

# Создание экземпляра модели
model = MyModel(input_size, hidden_size, output_size)

# Определение функции потерь и оптимизатора
criterion = nn.CrossEntropyLoss()  # Функция потерь для задачи классификации
optimizer = optim.SGD(model.parameters(), lr=0.01)  # Стохастический градиентный спуск с заданным learning rate

# Обучение модели
num_epochs = 5  # Количество эпох (проходов через весь набор данных)
for epoch in range(num_epochs):
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data  # Получение мини-пакета входных данных и меток
        inputs = inputs.view(inputs.shape[0], -1)  # Преобразование изображений в одномерные тензоры
        optimizer.zero_grad()  # Обнуление градиентов параметров
        outputs = model(inputs)  # Получение выходных данных модели
        loss = criterion(outputs, labels)  # Вычисление значения функции потерь
        loss.backward()  # Обратное распространение ошибки
        optimizer.step()  # Обновление параметров модели на основе градиентов

        running_loss += loss.item()
        if i % 100 == 99:  # Вывод статистики каждые 100 мини-пакетов
            print('[%d, %5d] loss: %.3f' %
                  (epoch + 1, i + 1, running_loss / 100))
            running_loss = 0.0

print('Finished Training')  # Сообщение о завершении обучения


[1,   100] loss: 1.862
[1,   200] loss: 1.139
[1,   300] loss: 0.790
[1,   400] loss: 0.653
[1,   500] loss: 0.547
[1,   600] loss: 0.506
[1,   700] loss: 0.474
[1,   800] loss: 0.424
[1,   900] loss: 0.408
[2,   100] loss: 0.393
[2,   200] loss: 0.385
[2,   300] loss: 0.372
[2,   400] loss: 0.379
[2,   500] loss: 0.363
[2,   600] loss: 0.364
[2,   700] loss: 0.354
[2,   800] loss: 0.361
[2,   900] loss: 0.329
[3,   100] loss: 0.345
[3,   200] loss: 0.321
[3,   300] loss: 0.334
[3,   400] loss: 0.307
[3,   500] loss: 0.309
[3,   600] loss: 0.317
[3,   700] loss: 0.308
[3,   800] loss: 0.299
[3,   900] loss: 0.329
[4,   100] loss: 0.301
[4,   200] loss: 0.309
[4,   300] loss: 0.295
[4,   400] loss: 0.293
[4,   500] loss: 0.305
[4,   600] loss: 0.281
[4,   700] loss: 0.290
[4,   800] loss: 0.297
[4,   900] loss: 0.269
[5,   100] loss: 0.276
[5,   200] loss: 0.278
[5,   300] loss: 0.271
[5,   400] loss: 0.268
[5,   500] loss: 0.257
[5,   600] loss: 0.247
[5,   700] loss: 0.275
[5,   800] 