Этот пример сгенерировала нейросеть Gemini от Google. Я его подшаманила, и получилось вот все, что ниже - кода много и он сумбурный. Но с PyTorch это всегда так. Проще, конечно, работать с Keras.

Простая сеть - SimpleNet:

1. Импорт библиотек: Импортируем необходимые модули PyTorch.
2. Определение архитектуры нейросети:
* Создаем класс SimpleNet, наследующий от nn.Module.
* В конструкторе (__init__) определяем линейный слой (nn.Linear) с одним входом и одним выходом.
* Метод forward описывает прямой проход данных через сеть.
3. Создание экземпляра нейросети: Создаем объект model класса SimpleNet.
4. Определение функции потерь и оптимизатора:
* Используем среднеквадратичную ошибку (nn.MSELoss) в качестве функции потерь.
* Выбираем стохастический градиентный спуск (torch.optim.SGD) в качестве оптимизатора с шагом обучения 0.01.
5. Данные для обучения: Создаем тензоры с обучающими данными (вход x_train и целевые значения y_train).
6. Цикл обучения:
* В цикле for выполняем итерации обучения.
* На каждой итерации:
 * Вычисляем выходные значения модели (outputs).
 * Вычисляем значение функции потерь (loss).
 * Обнуляем градиенты (optimizer.zero_grad()).
 * Вычисляем градиенты (loss.backward()).
 * Обновляем веса модели (optimizer.step()).
 * Выводим значение потерь каждые 100 эпох.
* Тестирование нейросети:
 * Отключаем вычисление градиентов (torch.no_grad()).
 * Создаем тестовый тензор x_test.
 * Получаем прогноз модели (predicted).
 * Выводим результат.

Это самый простой пример нейросети на PyTorch, который демонстрирует основные этапы создания, обучения и использования модели.

In [None]:
import torch
import torch.nn as nn

# Определение архитектуры нейросети
class SimpleNet(nn.Module):
    def __init__(self):
        super(SimpleNet, self).__init__()
        self.linear = nn.Linear(1, 1)  # Один вход, один выход

    def forward(self, x):
        return self.linear(x)

# Создание экземпляра нейросети
model = SimpleNet()

# Определение функции потерь и оптимизатора
criterion = nn.MSELoss()  # Среднеквадратичная ошибка
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)  # Стохастический градиентный спуск

# Данные для обучения
x_train = torch.tensor([[1.0], [2.0], [3.0]])
y_train = torch.tensor([[2.0], [4.0], [6.0]])

# Цикл обучения
epochs = 1000
for epoch in range(epochs):
    # Прямой проход
    outputs = model(x_train)
    loss = criterion(outputs, y_train)

    # Обратный проход и оптимизация
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    if (epoch + 1) % 100 == 0:
        print(f'Epoch [{epoch+1}/{epochs}], Loss: {loss.item():.4f}')

# Тестирование нейросети
with torch.no_grad():
    x_test = torch.tensor([[4.0]])
    predicted = model(x_test)
    print(f'Прогноз для 4.0: {predicted.item():.4f}')

Epoch [100/1000], Loss: 0.2648
Epoch [200/1000], Loss: 0.1636
Epoch [300/1000], Loss: 0.1011
Epoch [400/1000], Loss: 0.0625
Epoch [500/1000], Loss: 0.0386
Epoch [600/1000], Loss: 0.0239
Epoch [700/1000], Loss: 0.0147
Epoch [800/1000], Loss: 0.0091
Epoch [900/1000], Loss: 0.0056
Epoch [1000/1000], Loss: 0.0035
Прогноз для 4.0: 7.8820


Сеть для определения цифр из датасета MNIST:

1. Загрузка данных MNIST: Используем torchvision.datasets.MNIST для загрузки данных. Преобразуем изображения в тензоры и создаем загрузчики данных (DataLoader).
2. Архитектура нейросети:
* Определяем нейросеть с тремя полносвязными слоями (nn.Linear).
* Используем функцию активации ReLU (F.relu) после первых двух слоев.
* Выходной слой имеет 10 нейронов (для 10 классов цифр).
3. Функция потерь и оптимизатор:
* Используем кросс-энтропию (nn.CrossEntropyLoss) в качестве функции потерь для классификации.
* Выбираем оптимизатор Adam (torch.optim.Adam).
4. Цикл обучения:
* Итерируемся по эпохам и батчам обучающих данных.
* Выполняем прямой и обратный проход, обновляем веса модели.
* Выводим значение потерь каждые 100 батчей.
5. Тестирование:
* Вычисляем точность (accuracy).

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision
import torchvision.transforms as transforms

# Гиперпараметры
num_epochs = 5
batch_size = 64
learning_rate = 0.001

# Загрузка данных MNIST
train_dataset = torchvision.datasets.MNIST(
    root='./data',
    train=True,
    transform=transforms.ToTensor(),
    download=True
)
test_dataset = torchvision.datasets.MNIST(
    root='./data',
    train=False,
    transform=transforms.ToTensor()
)

# Создание загрузчиков данных
train_loader = torch.utils.data.DataLoader(
    dataset=train_dataset,
    batch_size=batch_size,
    shuffle=True
)
test_loader = torch.utils.data.DataLoader(
    dataset=test_dataset,
    batch_size=batch_size,
    shuffle=False
)

# Определение архитектуры нейросети
class SimpleMNISTNet(nn.Module):
    def __init__(self):
        super(SimpleMNISTNet, self).__init__()
        self.fc1 = nn.Linear(28 * 28, 128)  # Входной слой
        self.fc2 = nn.Linear(128, 64)  # Скрытый слой
        self.fc3 = nn.Linear(64, 10)  # Выходной слой (10 классов)

    def forward(self, x):
        x = x.view(-1, 28 * 28)  # Преобразование изображения в вектор
        x = F.relu(self.fc1(x))  # Функция активации ReLU
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# Создание экземпляра нейросети
model = SimpleMNISTNet()

# Определение функции потерь и оптимизатора
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# Цикл обучения
for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):
        # Прямой проход
        outputs = model(images)
        loss = criterion(outputs, labels)

        # Обратный проход и оптимизация
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if (i + 1) % 100 == 0:
            print(f'Epoch [{epoch+1}/{num_epochs}], Step [{i+1}/{len(train_loader)}], Loss: {loss.item():.4f}')

# Тестирование нейросети
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print(f'Точность на тестовых данных: {100 * correct / total:.2f}%')

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-images-idx3-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-images-idx3-ubyte.gz to ./data/MNIST/raw/train-images-idx3-ubyte.gz


100%|██████████| 9912422/9912422 [00:00<00:00, 19498214.47it/s]


Extracting ./data/MNIST/raw/train-images-idx3-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-labels-idx1-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-labels-idx1-ubyte.gz to ./data/MNIST/raw/train-labels-idx1-ubyte.gz


100%|██████████| 28881/28881 [00:00<00:00, 640814.32it/s]


Extracting ./data/MNIST/raw/train-labels-idx1-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-images-idx3-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-images-idx3-ubyte.gz to ./data/MNIST/raw/t10k-images-idx3-ubyte.gz


100%|██████████| 1648877/1648877 [00:01<00:00, 1148366.12it/s]


Extracting ./data/MNIST/raw/t10k-images-idx3-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-labels-idx1-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-labels-idx1-ubyte.gz to ./data/MNIST/raw/t10k-labels-idx1-ubyte.gz


100%|██████████| 4542/4542 [00:00<00:00, 5485323.57it/s]

Extracting ./data/MNIST/raw/t10k-labels-idx1-ubyte.gz to ./data/MNIST/raw






Epoch [1/5], Step [100/938], Loss: 0.4349
Epoch [1/5], Step [200/938], Loss: 0.1170
Epoch [1/5], Step [300/938], Loss: 0.2140
Epoch [1/5], Step [400/938], Loss: 0.3913
Epoch [1/5], Step [500/938], Loss: 0.3335
Epoch [1/5], Step [600/938], Loss: 0.2594
Epoch [1/5], Step [700/938], Loss: 0.1397
Epoch [1/5], Step [800/938], Loss: 0.1629
Epoch [1/5], Step [900/938], Loss: 0.1911
Epoch [2/5], Step [100/938], Loss: 0.2317
Epoch [2/5], Step [200/938], Loss: 0.2644
Epoch [2/5], Step [300/938], Loss: 0.1276
Epoch [2/5], Step [400/938], Loss: 0.1841
Epoch [2/5], Step [500/938], Loss: 0.0946
Epoch [2/5], Step [600/938], Loss: 0.1818
Epoch [2/5], Step [700/938], Loss: 0.1495
Epoch [2/5], Step [800/938], Loss: 0.1816
Epoch [2/5], Step [900/938], Loss: 0.0966
Epoch [3/5], Step [100/938], Loss: 0.0949
Epoch [3/5], Step [200/938], Loss: 0.1009
Epoch [3/5], Step [300/938], Loss: 0.1723
Epoch [3/5], Step [400/938], Loss: 0.1659
Epoch [3/5], Step [500/938], Loss: 0.1114
Epoch [3/5], Step [600/938], Loss: