In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import transforms, datasets, models
import os

In [2]:
# Определение класса ResNet наследующий функционал от nn.Module
class ResNetClassifier(nn.Module):
    # Конструктор класса
    def __init__(self, num_classes=10):
        # Конструктор родительского класса 
        super(ResNetClassifier, self).__init__()
        # Экземпляр предварительно обученной модели ResNet-18 из библиотеки torchvision
        self.resnet = models.resnet18(pretrained=True)
        # Получаем количество входных признаков перед последним полносвязным слоем (fc) в ResNet-18
        in_features = self.resnet.fc.in_features
        # Заменяем слой (fc) ResNet-18  новым слоем с количеством выходных классов, соответствующим параметру num_classes
        self.resnet.fc = nn.Linear(in_features, num_classes)
    #Определяем прямой проход (forward pass) модели(передаем входные данные x через архитектуру ResNet и возвращает результат)
    def forward(self, x):
        return self.resnet(x)

In [3]:
# Функция обучения модели
def train_model(model, dataloaders, criterion, optimizer, num_epochs=10):
    # Выбираем на чем будет происходить обучение
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    model.to(device)
    #Сохранение весов
    best_model_wts = model.state_dict()
    #Переменная для отслеживания лучшей точности на тесте
    best_acc = 0.0

    for epoch in range(num_epochs):
        for phase in ['train', 'test']:
            if phase == 'train':
                #Обучаем модель
                model.train()
            else:
                #Тестируем на тестовой выборке модель. Метод eval() является аналогом test() в PyTorch и разницы между ними нет
                model.eval()
            
            running_loss = 0.0
            running_corrects = 0
            
            #Цикл для оптимизации
            for inputs, labels in dataloaders[phase]:
                inputs, labels = inputs.to(device), labels.to(device)

                #Обнуляем градиенты перед обратным распространением.
                optimizer.zero_grad()

                #Расчитываем градиенты в зависимости от фазы
                with torch.set_grad_enabled(phase == 'train'):
                    outputs = model(inputs)
                    loss = criterion(outputs, labels)
                    
                    #Если фаза train, выполняем обратное распространение и оптимизацию весов
                    if phase == 'train':
                        loss.backward()
                        optimizer.step()
                
                #Считаем текущие значения потерь и корректных предсказаний
                running_loss += loss.item() * inputs.size(0)
                _, preds = torch.max(outputs, 1)
                running_corrects += torch.sum(preds == labels.data)
            
            #Средние значения потерь и точности для текущей эпохи
            epoch_loss = running_loss / len(dataloaders[phase].dataset)
            epoch_acc = running_corrects.double() / len(dataloaders[phase].dataset)

            if phase == 'test':
                print(f'{phase} Loss: {epoch_loss:.4f} Acc: {epoch_acc:.4f} Epoch: {epoch+1}')
            
            #Если текущая точность лучше, чем лучшая до этого, обновляем лучшие веса
            if phase == 'test' and epoch_acc > best_acc:
                best_acc = epoch_acc
                best_model_wts = model.state_dict()

    model.load_state_dict(best_model_wts)
    return model

In [8]:
if __name__ == '__main__':
    # Подготовка данных и создание DataLoader
    data_transforms = {
        'train': transforms.Compose([
            transforms.RandomResizedCrop(200),
            transforms.RandomHorizontalFlip(),
            transforms.Grayscale(num_output_channels=3),
            transforms.ToTensor(),
        ]),
        'test': transforms.Compose([
            transforms.Resize(200),
            transforms.Grayscale(num_output_channels=3),
            transforms.ToTensor(),
        ]),
    }

    data_dir = r"C:\Users\bdfpv\Desktop\Task"

    # Cоздание DataLoader с учетом папок "train" и "test"
    # Загружаем изображения из папок, структурированных по классам
    image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x), data_transforms[x]) for x in ['train', 'test']}
    #shuffle=True: Перемешивает данные при каждой эпохе для train
    dataloaders = {
    'train': torch.utils.data.DataLoader(image_datasets['train'], batch_size=46, shuffle=True, num_workers=4),
    'test': torch.utils.data.DataLoader(image_datasets['test'], shuffle=False, num_workers=4)
}
    dataset_sizes = {x: len(image_datasets[x]) for x in ['train', 'test']}

    # Определение модели, критерия и оптимизатора
    model = ResNetClassifier(num_classes=10)
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

    # Обучение модели
    trained_model = train_model(model, dataloaders, criterion, optimizer, num_epochs=10)

test Loss: 2.0625 Acc: 0.2935 Epoch: 1
test Loss: 1.5669 Acc: 0.4761 Epoch: 2
test Loss: 1.0987 Acc: 0.6239 Epoch: 3
test Loss: 0.7041 Acc: 0.7913 Epoch: 4
test Loss: 0.4477 Acc: 0.8935 Epoch: 5
test Loss: 0.3080 Acc: 0.9239 Epoch: 6
test Loss: 0.2628 Acc: 0.9326 Epoch: 7
test Loss: 0.2259 Acc: 0.9500 Epoch: 8
test Loss: 0.1888 Acc: 0.9587 Epoch: 9
test Loss: 0.1886 Acc: 0.9565 Epoch: 10
