In [1]:
import os
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset
from torchvision import transforms, models, datasets
from efficientnet_pytorch import EfficientNet

# Define paths and hyperparameters
BATCH_SIZE = 4
NUM_EPOCHS = 100
LEARNING_RATE = 0.001
DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# define the EfficientNet models to use
# b0 max: 64
# b3 max: 32?
efficientnets = {
#     "b0": EfficientNet.from_pretrained("efficientnet-b0", num_classes=5),
    # "b1": EfficientNet.from_pretrained("efficientnet-b1", num_classes=5),
    # "b2": EfficientNet.from_pretrained("efficientnet-b2", num_classes=5),
    # "b3": EfficientNet.from_pretrained("efficientnet-b3", num_classes=5),
#     "b4": EfficientNet.from_pretrained("efficientnet-b4", num_classes=5),
    # "b5": EfficientNet.from_pretrained("efficientnet-b5", num_classes=5),
#     "b6": EfficientNet.from_pretrained("efficientnet-b6", num_classes=5),
    "b7": EfficientNet.from_pretrained("efficientnet-b7", num_classes=5),
}

efficientnet_sizes = {
    "b0": 224,
    "b1": 240,
    "b2": 260,
    "b3": 300,
    "b4": 380,
    "b5": 456,
    "b6": 528,
    "b7": 600,
}

Loaded pretrained weights for efficientnet-b7


In [None]:
from sklearn.model_selection import train_test_split
import time
from lion_pytorch import Lion
from tqdm import tqdm

def train():
    # train the models and evaluate them on the validation set
    for model_name, model in efficientnets.items():
        # define the transform for data augmentation and resizing
        image_size = efficientnet_sizes[model_name]
        # Define data augmentations and transformations
        train_transforms = transforms.Compose(
            [
                transforms.Resize((image_size, image_size)),
                transforms.RandomHorizontalFlip(),
                transforms.RandomVerticalFlip(),
                transforms.RandomRotation(20),
                transforms.ToTensor(),
                transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),
            ]
        )
        val_transforms = transforms.Compose(
            [
                transforms.Resize((image_size, image_size)),
                # transforms.CenterCrop(224),
                transforms.ToTensor(),
                transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),
            ]
        )

        # Create train and validation datasets
        dataset = datasets.ImageFolder("data_processed", transform=train_transforms)
        dataset_val = datasets.ImageFolder("data_processed", transform=val_transforms)
        print(dataset.classes)

        train_idx, val_idx = train_test_split(
            list(range(len(dataset.targets))), test_size=0.2, stratify=dataset.targets
        )
        train_dataset = torch.utils.data.Subset(dataset, train_idx)
        val_dataset = torch.utils.data.Subset(dataset_val, val_idx)
        train_loader = torch.utils.data.DataLoader(
            train_dataset, batch_size=BATCH_SIZE, shuffle=True, num_workers=8, pin_memory=True
        )
        val_loader = torch.utils.data.DataLoader(
            val_dataset, batch_size=BATCH_SIZE, shuffle=True, num_workers=8, pin_memory=True
        )

        # Define model
        model.to(DEVICE)

        # Define loss function and optimizer
        criterion = nn.CrossEntropyLoss()
        optimizer = Lion(model.parameters(), lr=1e-5, weight_decay=1e-2)
#         optimizer = optim.Adam(model.parameters(), lr=1e-4)
        # Train and validate the model
        for epoch in range(NUM_EPOCHS):
            start = time.time()
            start_total = time.time()
            print(f"Epoch {epoch+1}/{NUM_EPOCHS}")

            # Train the model
            model.train()
            train_loss = 0.0
            train_acc = 0.0
            for images, labels in tqdm(train_loader):
                images, labels = images.to(DEVICE), labels.to(DEVICE)
                outputs = model(images)
                loss = criterion(outputs, labels)
                loss.backward()
                optimizer.step()
                optimizer.zero_grad()
                train_loss += loss.item() * images.size(0)
                _, predictions = torch.max(outputs, 1)
                train_acc += torch.sum(predictions == labels.data)
            train_loss /= len(train_dataset)
            train_acc /= len(train_dataset)
            print(f"Train loss: {train_loss:.4f}, Acc: {train_acc:.4f}")
            print(f"Train time: {time.time() - start}")

            start = time.time()
            # Validate the model
            model.eval()
            val_loss = 0.0
            val_acc = 0.0
            with torch.no_grad():
                for images, labels in tqdm(val_loader):
                    images, labels = images.to(DEVICE), labels.to(DEVICE)
                    outputs = model(images)
                    loss = criterion(outputs, labels)
                    val_loss += loss.item() * images.size(0)
                    _, predictions = torch.max(outputs, 1)
                    val_acc += torch.sum(predictions == labels.data)
            val_loss /= len(val_dataset)
            val_acc /= len(val_dataset)
            print(f"Val   loss: {val_loss:.4f}, Acc: {val_acc:.4f}")

            # Save checkpoint
            checkpoint_path = f"checkpoint_{epoch+1}.pt"
            torch.save(
                {
                    "epoch": epoch + 1,
                    "model_state_dict": model.state_dict(),
                    "optimizer_state_dict": optimizer.state_dict(),
                    "train_loss": train_loss,
                    "train_acc": train_acc,
                    "val_loss": val_loss,
                    "val_acc": val_acc,
                },
                checkpoint_path,
            )
            total_end = time.time() - start_total

            # Save loss and accuracy values to file
            with open("loss_acc.txt", "a") as file:
                file.write(
                    f"{model_name}, {train_loss:.4f}, {train_acc:.4f}, {val_loss:.4f}, {val_acc:.4f}, {epoch}, {BATCH_SIZE}, {total_end}\n"
                )

            print(f"Val and misc time: {time.time() - start}")
            print(f"Total time: {total_end}")


if __name__ == "__main__":
    train()

['0', '1', '2', '3', '4']
Epoch 1/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:12<00:00,  2.59it/s]


Train loss: 0.6018, Acc: 0.8030
Train time: 2712.40247130394


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:38<00:00, 11.06it/s]


Val   loss: 0.5096, Acc: 0.8322
Val and misc time: 159.67230868339539
Total time: 2872.074423313141
Epoch 2/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:08<00:00,  2.59it/s]


Train loss: 0.4854, Acc: 0.8398
Train time: 2708.6631438732147


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:38<00:00, 11.07it/s]


Val   loss: 0.4875, Acc: 0.8367
Val and misc time: 159.42526578903198
Total time: 2868.0880959033966
Epoch 3/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:03<00:00,  2.60it/s]


Train loss: 0.4576, Acc: 0.8485
Train time: 2703.7823071479797


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:38<00:00, 11.08it/s]


Val   loss: 0.4763, Acc: 0.8535
Val and misc time: 159.3474817276001
Total time: 2863.129481315613
Epoch 4/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:07<00:00,  2.60it/s]


Train loss: 0.4386, Acc: 0.8549
Train time: 2707.014908313751


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:38<00:00, 11.08it/s]


Val   loss: 0.4933, Acc: 0.8567
Val and misc time: 159.42261815071106
Total time: 2866.437202692032
Epoch 5/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:00<00:00,  2.60it/s]


Train loss: 0.4204, Acc: 0.8599
Train time: 2700.3893291950226


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:38<00:00, 11.07it/s]


Val   loss: 0.4594, Acc: 0.8567
Val and misc time: 159.4111053943634
Total time: 2859.800119161606
Epoch 6/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:01<00:00,  2.60it/s]


Train loss: 0.4039, Acc: 0.8652
Train time: 2701.3895902633667


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:38<00:00, 11.09it/s]


Val   loss: 0.4504, Acc: 0.8547
Val and misc time: 159.1847472190857
Total time: 2860.5740282535553
Epoch 7/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:26<00:00,  2.58it/s]


Train loss: 0.3937, Acc: 0.8685
Train time: 2726.281975507736


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:39<00:00, 11.05it/s]


Val   loss: 0.4686, Acc: 0.8545
Val and misc time: 159.80732941627502
Total time: 2886.089007616043
Epoch 8/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [46:03<00:00,  2.54it/s]


Train loss: 0.3772, Acc: 0.8741
Train time: 2763.6051001548767


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:39<00:00, 10.99it/s]


Val   loss: 0.5220, Acc: 0.8504
Val and misc time: 160.5673589706421
Total time: 2924.172110080719
Epoch 9/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [46:06<00:00,  2.54it/s]


Train loss: 0.3636, Acc: 0.8806
Train time: 2766.876812696457


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:40<00:00, 10.97it/s]


Val   loss: 0.4788, Acc: 0.8565
Val and misc time: 160.93134140968323
Total time: 2927.8078322410583
Epoch 10/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:13<00:00,  2.59it/s]


Train loss: 0.3523, Acc: 0.8836
Train time: 2713.130135536194


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:40<00:00, 10.97it/s]


Val   loss: 1.7160, Acc: 0.8525
Val and misc time: 160.89043426513672
Total time: 2874.0202584266663
Epoch 11/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:04<00:00,  2.60it/s]


Train loss: 0.3328, Acc: 0.8902
Train time: 2704.0147728919983


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:39<00:00, 10.99it/s]


Val   loss: 0.5697, Acc: 0.8419
Val and misc time: 160.7273383140564
Total time: 2864.7418024539948
Epoch 12/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:12<00:00,  2.59it/s]


Train loss: 0.3242, Acc: 0.8917
Train time: 2712.0592267513275


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:39<00:00, 11.01it/s]


Val   loss: 0.5855, Acc: 0.8572
Val and misc time: 160.30749487876892
Total time: 2872.3663985729218
Epoch 13/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:16<00:00,  2.59it/s]


Train loss: 0.3058, Acc: 0.8973
Train time: 2716.4945738315582


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:39<00:00, 11.03it/s]


Val   loss: 0.5543, Acc: 0.8507
Val and misc time: 160.03031134605408
Total time: 2876.5245957374573
Epoch 14/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:08<00:00,  2.59it/s]


Train loss: 0.2865, Acc: 0.9040
Train time: 2708.664004802704


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:38<00:00, 11.07it/s]


Val   loss: 0.5912, Acc: 0.8456
Val and misc time: 159.4192979335785
Total time: 2868.0829684734344
Epoch 15/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7025/7025 [45:22<00:00,  2.58it/s]


Train loss: 0.2705, Acc: 0.9111
Train time: 2722.1435449123383


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1757/1757 [02:38<00:00, 11.08it/s]


Val   loss: 0.6020, Acc: 0.8376
Val and misc time: 159.37145686149597
Total time: 2881.514685153961
Epoch 16/100


 31%|████████████████████████████████████████████████████████████                                                                                                                                      | 2175/7025 [13:57<30:57,  2.61it/s]