In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import transforms, datasets, models
from sklearn.model_selection import KFold
import os

In [2]:
# Определение класса ResNet наследующий функционал от nn.Module
class ResNetClassifier(nn.Module):
    # Конструктор класса
    def __init__(self, num_classes=10):
        # Конструктор родительского класса 
        super(ResNetClassifier, self).__init__()
        # Экземпляр предварительно обученной модели ResNet-18 из библиотеки torchvision
        self.resnet = models.resnet18(pretrained=True)
        # Получаем количество входных признаков перед последним полносвязным слоем (fc) в ResNet-18
        in_features = self.resnet.fc.in_features
        # Заменяем слой (fc) ResNet-18  новым слоем с количеством выходных классов, соответствующим параметру num_classes
        self.resnet.fc = nn.Linear(in_features, num_classes)

    #Определяем прямой проход (forward pass) модели(передаем входные данные x через архитектуру ResNet и возвращает результат)
    def forward(self, x):
        return self.resnet(x)

In [3]:
def train_model(model, data, criterion, optimizer, num_epochs=50, num_folds = 3, patience = 3):
    # Выбираем на чем будет происходить обучение
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    model.to(device)
    # Сохранение весов
    best_model_wts = model.state_dict()
    # Переменная для отслеживания лучшей точности на тесте
    best_acc = 0.0
    val_acc = 0.0
    
    acc_best = 0.0
    
    early_stopping_counter = 0  # Счетчик эпох без улучшения точности
    best_epoch = 0
    
    kf = KFold(n_splits=num_folds, shuffle=True, random_state=42)
    
    for fold, (train_indices, val_indices) in enumerate(kf.split(data)):
        print(f'Fold {fold + 1}/{num_folds}')

        train_dataset = torch.utils.data.Subset(data, train_indices)
        val_dataset = torch.utils.data.Subset(data, val_indices)

        train_dataloader = torch.utils.data.DataLoader(train_dataset, batch_size=46, shuffle=True, num_workers=4)
        val_dataloader = torch.utils.data.DataLoader(val_dataset, batch_size=46, shuffle=False, num_workers=4)
        
        model = ResNetClassifier(num_classes=10)
        criterion = nn.CrossEntropyLoss()
        optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)
        model.to(device)
        
        for epoch in range(num_epochs):
            # Устанавливаем модель в режим обучения
            model.train()
            running_loss = 0.0
            running_corrects = 0

            # Цикл для оптимизации
            for inputs, labels in train_dataloader:
                inputs, labels = inputs.to(device), labels.to(device)

                # Обнуляем градиенты перед обратным распространением.
                optimizer.zero_grad()

                # Рассчитываем градиенты
                outputs = model(inputs)
                loss = criterion(outputs, labels)

                # Выполняем обратное распространение и оптимизацию весов
                loss.backward()
                optimizer.step()

                # Считаем текущие значения потерь и корректных предсказаний
                running_loss += loss.item() * inputs.size(0)
                _, preds = torch.max(outputs, 1)
                running_corrects += torch.sum(preds == labels.data)

            # Средние значения потерь и точности для текущей эпохи
            epoch_loss = running_loss / len(train_dataloader.dataset)
            epoch_acc = running_corrects.double() / len(train_dataloader.dataset)

            print(f'Train Loss: {epoch_loss:.4f} Acc: {epoch_acc:.4f} Epoch: {epoch+1}')
            
            model.eval()
            val_loss = 0.0
            val_corrects = 0

            with torch.no_grad():
                for val_inputs, val_labels in val_dataloader:
                    val_inputs, val_labels = val_inputs.to(device), val_labels.to(device)
           
                    val_outputs = model(val_inputs)
                    loss = criterion(val_outputs, val_labels)
           
                    val_loss += loss.item() * val_inputs.size(0)
                    _, val_preds = torch.max(val_outputs, 1)
                    val_corrects += torch.sum(val_preds == val_labels.data)

            
            val_loss /= len(val_dataloader.dataset)
            val_acc = val_corrects.double() / len(val_dataloader.dataset)
            
            if epoch>8:
                if val_acc > best_acc:
                    best_acc = val_acc
                    best_model_wts = model.state_dict()
                    early_stopping_counter = 0  # Сбрасываем счетчик, так как точность улучшилась
                    best_epoch = epoch + 1
                else:
                    early_stopping_counter += 1

                if early_stopping_counter >= patience:
                    print(f'Ранняя остановка. Никакого улучшения точности {patience} эпох.')
                    break

            print(f'Fold {fold + 1}, Epoch {epoch + 1}, Validation Loss: {val_loss:.4f} Acc: {val_acc:.4f}')
        early_stopping_counter = 0
            

    return model

In [4]:
def test_model(model, dataloader, criterion):
    # Устанавливаем модель в режим оценки (тестирования)
    model.eval()
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    running_loss = 0.0
    running_corrects = 0

    # Отключаем вычисление градиентов для оценки
    with torch.no_grad():
        for inputs, labels in dataloader:
            inputs, labels = inputs.to(device), labels.to(device)

            # Рассчитываем выход модели
            outputs = model(inputs)
            loss = criterion(outputs, labels)

            # Считаем текущие значения потерь и корректных предсказаний
            running_loss += loss.item() * inputs.size(0)
            _, preds = torch.max(outputs, 1)
            running_corrects += torch.sum(preds == labels.data)

    # Средние значения потерь и точности для тестовой фазы
    test_loss = running_loss / len(dataloader.dataset)
    test_acc = running_corrects.double() / len(dataloader.dataset)

    print(f'Test Loss: {test_loss:.4f} Acc: {test_acc:.4f}')

In [5]:
if __name__ == '__main__':
    data_transforms = {
        'train': transforms.Compose([
            transforms.RandomResizedCrop(200),
            transforms.RandomHorizontalFlip(),
            transforms.Grayscale(num_output_channels=3),
            transforms.ToTensor(),
        ]),
        'test': transforms.Compose([
            transforms.Resize(200),
            transforms.Grayscale(num_output_channels=3),
            transforms.ToTensor(),
        ]),
    }

    data_dir = r"C:\Users\bdfpv\Desktop\Task"

    image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x), data_transforms[x]) for x in ['train', 'test']}

    dataloader_train = torch.utils.data.DataLoader(image_datasets['train'], batch_size=46, shuffle=True, num_workers=4)
    dataloader_test = torch.utils.data.DataLoader(image_datasets['test'], shuffle=False, num_workers=4)
    
    dataset_sizes = {x: len(image_datasets[x]) for x in ['train', 'test']}

    model = ResNetClassifier(num_classes=10)
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

    trained_model = train_model(model, image_datasets['train'], criterion, optimizer, num_epochs=50)
    test_model(trained_model, dataloader_test, criterion)



Fold 1/3
Train Loss: 2.3813 Acc: 0.1373 Epoch: 1
Fold 1, Epoch 1, Validation Loss: 2.3398 Acc: 0.0909
Train Loss: 1.7940 Acc: 0.4412 Epoch: 2
Fold 1, Epoch 2, Validation Loss: 2.0527 Acc: 0.2403
Train Loss: 1.2137 Acc: 0.7092 Epoch: 3
Fold 1, Epoch 3, Validation Loss: 1.5592 Acc: 0.5000
Train Loss: 0.8448 Acc: 0.8039 Epoch: 4
Fold 1, Epoch 4, Validation Loss: 1.1345 Acc: 0.6169
Train Loss: 0.5953 Acc: 0.8954 Epoch: 5
Fold 1, Epoch 5, Validation Loss: 0.8170 Acc: 0.7273
Train Loss: 0.4546 Acc: 0.9379 Epoch: 6
Fold 1, Epoch 6, Validation Loss: 0.5510 Acc: 0.8377
Train Loss: 0.2950 Acc: 0.9673 Epoch: 7
Fold 1, Epoch 7, Validation Loss: 0.3633 Acc: 0.9091
Train Loss: 0.2653 Acc: 0.9281 Epoch: 8
Fold 1, Epoch 8, Validation Loss: 0.2546 Acc: 0.9351
Train Loss: 0.2157 Acc: 0.9739 Epoch: 9
Fold 1, Epoch 9, Validation Loss: 0.2264 Acc: 0.9416
Train Loss: 0.1887 Acc: 0.9608 Epoch: 10
Fold 1, Epoch 10, Validation Loss: 0.2053 Acc: 0.9545
Train Loss: 0.1734 Acc: 0.9739 Epoch: 11
Fold 1, Epoch 11, 