# Pediatric Model With Transfer

Utilizes model computed earlier on pediatric data

Import all needed in this notebook

In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
from transformers import AutoImageProcessor, ResNetForImageClassification
from sklearn.model_selection import StratifiedKFold,train_test_split
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score, roc_curve
from torch.utils.data import DataLoader, TensorDataset, Subset, random_split
from torch.optim.lr_scheduler import CosineAnnealingLR
import numpy as np
from torchvision import datasets, transforms
import matplotlib.pyplot as plt
from tqdm import tqdm
import zipfile
import torch.nn.functional as F
from tabulate import tabulate

## Model Creation

Same code for the model

In [2]:
class CustomCNNModel(nn.Module):
    def __init__(self):
        super(CustomCNNModel, self).__init__()
        
        self.conv1 = nn.Conv2d(3, 32, kernel_size=3, stride=1, padding=1)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1)
        self.conv3 = nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1)
        
        self.pool = nn.MaxPool2d(2, 2)
        
        self.fc1 = nn.Linear(128 * 28 * 28, 512) 
        self.fc2 = nn.Linear(512, 256)  
        self.fc3 = nn.Linear(256, 2)
        
        self.dropout = nn.Dropout(p=0.5) 

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x))) 
        x = self.pool(F.relu(self.conv2(x)))
        x = self.pool(F.relu(self.conv3(x)))
        
        x = x.view(-1, 128 * 28 * 28)
        
        x = F.relu(self.fc1(x))
        x = self.dropout(x)
        x = F.relu(self.fc2(x))
        x = self.dropout(x)
        x = self.fc3(x)
        
        return x

We will freeze convolutional layers and unfreeze fully connected layers to perform the transfer to pediatric data.

In [3]:
def load_pretrained_model(model, model_path):
    model.load_state_dict(torch.load(model_path))
    model.eval()
    return model


def freeze_layers(model):
    for name, param in model.named_parameters():
        if "conv" in name:
            param.requires_grad = False
        else:
            param.requires_grad = True
    return model

## Dataset Retrieval

Retrieve dataset and compute X (data images in tensor format) and y (binary encoded label)

In [4]:
# with zipfile.ZipFile("original_data.zip", 'r') as zip_ref:
#     zip_ref.extractall("")

In [5]:
transform = transforms.Compose([transforms.ToTensor()])

dataset = datasets.ImageFolder(root="../pediatric_dataset/preprocessed_medium", transform=transform)

test_size = 0.75
random_seed = 42

labels = [dataset[i][1] for i in range(len(dataset))]

print(f"Complete Dataset: {len(dataset)} images")

Complete Dataset: 400 images


## Training Methods

In [6]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model_path = "../models/modelv5.1.pth"

In [7]:
def train_model(model, train_loader, test_loader, criterion, optimizer, scheduler, num_epochs=10):
    model.train()
    
    train_losses, train_accuracies = [], []
    test_losses, test_accuracies = [], []
    test_precisions, test_recalls, test_f1s = [], [], []

    print(f"Device using for training: {device}")
    model = model.to(device)

    for epoch in range(num_epochs):
        running_loss = 0.0
        correct = 0
        total = 0

        with tqdm(train_loader, unit="batch", desc=f"Epoch [{epoch+1}/{num_epochs}]") as tbar:
            for inputs, labels in tbar:
                inputs, labels = inputs.to(device), labels.to(device)

                outputs = model(inputs)
                loss = criterion(outputs, labels)

                optimizer.zero_grad()
                loss.backward()
                optimizer.step()

                _, predicted = torch.max(outputs, 1)
                total += labels.size(0)
                correct += (predicted == labels).sum().item()

                running_loss += loss.item()

        epoch_loss = running_loss / len(train_loader)
        epoch_accuracy = 100 * correct / total
        train_losses.append(epoch_loss)
        train_accuracies.append(epoch_accuracy)

        test_loss, test_accuracy, precision, recall, f1 = evaluate_model(model, test_loader, criterion)
        test_losses.append(test_loss)
        test_accuracies.append(test_accuracy)
        test_precisions.append(precision)
        test_recalls.append(recall)
        test_f1s.append(f1)
        
        scheduler.step()

        print(f"Epoch [{epoch+1}/{num_epochs}], Train Loss: {epoch_loss:.4f}, Train Accuracy: {epoch_accuracy:.2f}%, Test Loss: {test_loss:.4f}, Test Accuracy: {test_accuracy:.2f}%")

    return train_losses, train_accuracies, test_losses, test_accuracies, test_precisions, test_recalls, test_f1s


def k_fold_cross_validation_with_split(model_class, dataset, criterion, optimizer_class, scheduler_class, k=5, num_epochs=10, batch_size=32):
    skf = StratifiedKFold(n_splits=k, shuffle=True, random_state=42)

    fold_results = []
    
    labels = [dataset[i][1] for i in range(len(dataset))]

    print(f"Running {k}-Fold Cross-Validation...")

    for fold, (rest_folds_indices, one_fold_indices) in enumerate(skf.split(dataset, labels)):
        print(f"Fold {fold + 1}/{k}: Training on {len(one_fold_indices)} samples, Testing on {len(rest_folds_indices)} samples")

        train_subset = Subset(dataset, one_fold_indices)
        test_subset = Subset(dataset, rest_folds_indices)
        train_loader = DataLoader(train_subset, batch_size=batch_size, shuffle=True)
        test_loader = DataLoader(test_subset, batch_size=batch_size, shuffle=False)

        model = model_class()
        optimizer = optimizer_class(model.parameters())
        scheduler = scheduler_class(optimizer)
        model = load_pretrained_model(model, model_path)
        model = freeze_layers(model)

        train_losses, train_accuracies, test_losses, test_accuracies, test_precisions, test_recalls, test_f1s = train_model(
            model, train_loader, test_loader, criterion, optimizer, scheduler, num_epochs
        )

        fold_results.append({
            'fold': fold + 1,
            'train_losses': train_losses,
            'train_accuracies': train_accuracies,
            'test_losses': test_losses,
            'test_accuracies': test_accuracies,
            'test_precisions': test_precisions,
            'test_recalls': test_recalls,
            'test_f1s': test_f1s
        })
        
    return fold_results

def evaluate_model(model, test_loader, criterion):
    model.eval()
    test_losses, correct, total = [], 0, 0
    all_labels, all_preds = [], []

    with torch.no_grad():
        for inputs, labels in test_loader:
            inputs, labels = inputs.to(device), labels.to(device)

            outputs = model(inputs)
            loss = criterion(outputs, labels)
            test_losses.append(loss.item())

            _, predicted = torch.max(outputs, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()

            all_labels.extend(labels.cpu().numpy())
            all_preds.extend(predicted.cpu().numpy())

    test_loss = sum(test_losses) / len(test_loader)
    test_accuracy = 100 * correct / total

    precision = precision_score(all_labels, all_preds, average="weighted", zero_division=0)
    recall = recall_score(all_labels, all_preds, average="weighted", zero_division=0)
    f1 = f1_score(all_labels, all_preds, average="weighted", zero_division=0)

    return test_loss, test_accuracy, precision, recall, f1

## Transfer Training

In [8]:
criterion = nn.CrossEntropyLoss()
optimizer_class = lambda params: optim.Adam(params, lr=1e-3, weight_decay=1e-2)
scheduler_class = lambda optimizer: CosineAnnealingLR(optimizer, T_max=15)
model_class = CustomCNNModel
num_epochs = 15

results = k_fold_cross_validation_with_split(model_class, dataset, criterion, optimizer_class, scheduler_class, k=4, num_epochs=num_epochs, batch_size=32)

Running 4-Fold Cross-Validation...
Fold 1/4: Training on 100 samples, Testing on 300 samples


  model.load_state_dict(torch.load(model_path))


Device using for training: cuda


Epoch [1/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.20s/batch]


Epoch [1/15], Train Loss: 1.9950, Train Accuracy: 47.00%, Test Loss: 0.7939, Test Accuracy: 50.00%


Epoch [2/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.30batch/s]


Epoch [2/15], Train Loss: 0.8092, Train Accuracy: 49.00%, Test Loss: 1.2364, Test Accuracy: 50.00%


Epoch [3/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.67batch/s]


Epoch [3/15], Train Loss: 0.9414, Train Accuracy: 47.00%, Test Loss: 0.9710, Test Accuracy: 50.00%


Epoch [4/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.75batch/s]


Epoch [4/15], Train Loss: 0.6140, Train Accuracy: 63.00%, Test Loss: 0.8906, Test Accuracy: 50.00%


Epoch [5/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.97batch/s]


Epoch [5/15], Train Loss: 0.7313, Train Accuracy: 57.00%, Test Loss: 0.8818, Test Accuracy: 50.00%


Epoch [6/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.80batch/s]


Epoch [6/15], Train Loss: 0.8125, Train Accuracy: 52.00%, Test Loss: 0.5954, Test Accuracy: 58.33%


Epoch [7/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.96batch/s]


Epoch [7/15], Train Loss: 0.9555, Train Accuracy: 51.00%, Test Loss: 0.4591, Test Accuracy: 79.33%


Epoch [8/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.94batch/s]


Epoch [8/15], Train Loss: 0.5493, Train Accuracy: 70.00%, Test Loss: 0.6062, Test Accuracy: 64.33%


Epoch [9/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.86batch/s]


Epoch [9/15], Train Loss: 0.4683, Train Accuracy: 75.00%, Test Loss: 0.4651, Test Accuracy: 76.33%


Epoch [10/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.92batch/s]


Epoch [10/15], Train Loss: 0.4799, Train Accuracy: 69.00%, Test Loss: 0.4052, Test Accuracy: 84.67%


Epoch [11/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.84batch/s]


Epoch [11/15], Train Loss: 0.5622, Train Accuracy: 82.00%, Test Loss: 0.4248, Test Accuracy: 80.67%


Epoch [12/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.87batch/s]


Epoch [12/15], Train Loss: 0.4384, Train Accuracy: 84.00%, Test Loss: 0.3837, Test Accuracy: 85.67%


Epoch [13/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.34batch/s]


Epoch [13/15], Train Loss: 0.4040, Train Accuracy: 77.00%, Test Loss: 0.3816, Test Accuracy: 86.00%


Epoch [14/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.88batch/s]


Epoch [14/15], Train Loss: 0.5110, Train Accuracy: 77.00%, Test Loss: 0.3777, Test Accuracy: 86.00%


Epoch [15/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.56batch/s]


Epoch [15/15], Train Loss: 0.4217, Train Accuracy: 81.00%, Test Loss: 0.3770, Test Accuracy: 86.67%
Fold 2/4: Training on 100 samples, Testing on 300 samples


  model.load_state_dict(torch.load(model_path))


Device using for training: cuda


Epoch [1/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.89batch/s]


Epoch [1/15], Train Loss: 1.7010, Train Accuracy: 59.00%, Test Loss: 0.7615, Test Accuracy: 50.00%


Epoch [2/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.86batch/s]


Epoch [2/15], Train Loss: 0.9640, Train Accuracy: 46.00%, Test Loss: 1.4071, Test Accuracy: 50.00%


Epoch [3/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.86batch/s]


Epoch [3/15], Train Loss: 0.6497, Train Accuracy: 67.00%, Test Loss: 1.1660, Test Accuracy: 55.67%


Epoch [4/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.91batch/s]


Epoch [4/15], Train Loss: 0.7605, Train Accuracy: 67.00%, Test Loss: 0.7211, Test Accuracy: 61.00%


Epoch [5/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.53batch/s]


Epoch [5/15], Train Loss: 0.4552, Train Accuracy: 71.00%, Test Loss: 0.4785, Test Accuracy: 75.33%


Epoch [6/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.60batch/s]


Epoch [6/15], Train Loss: 0.3338, Train Accuracy: 81.00%, Test Loss: 0.4241, Test Accuracy: 79.67%


Epoch [7/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.86batch/s]


Epoch [7/15], Train Loss: 0.2610, Train Accuracy: 89.00%, Test Loss: 0.4175, Test Accuracy: 80.33%


Epoch [8/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.94batch/s]


Epoch [8/15], Train Loss: 0.2384, Train Accuracy: 89.00%, Test Loss: 0.4243, Test Accuracy: 78.67%


Epoch [9/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.84batch/s]


Epoch [9/15], Train Loss: 0.2933, Train Accuracy: 87.00%, Test Loss: 0.5201, Test Accuracy: 73.67%


Epoch [10/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.79batch/s]


Epoch [10/15], Train Loss: 0.3527, Train Accuracy: 83.00%, Test Loss: 0.3726, Test Accuracy: 82.00%


Epoch [11/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.93batch/s]


Epoch [11/15], Train Loss: 0.2127, Train Accuracy: 90.00%, Test Loss: 0.3886, Test Accuracy: 80.33%


Epoch [12/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.77batch/s]


Epoch [12/15], Train Loss: 0.2366, Train Accuracy: 90.00%, Test Loss: 0.3820, Test Accuracy: 80.67%


Epoch [13/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.82batch/s]


Epoch [13/15], Train Loss: 0.2264, Train Accuracy: 93.00%, Test Loss: 0.3650, Test Accuracy: 81.00%


Epoch [14/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.45batch/s]


Epoch [14/15], Train Loss: 0.1929, Train Accuracy: 92.00%, Test Loss: 0.3555, Test Accuracy: 83.00%


Epoch [15/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.91batch/s]


Epoch [15/15], Train Loss: 0.2047, Train Accuracy: 92.00%, Test Loss: 0.3553, Test Accuracy: 83.00%
Fold 3/4: Training on 100 samples, Testing on 300 samples


  model.load_state_dict(torch.load(model_path))


Device using for training: cuda


Epoch [1/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  6.09batch/s]


Epoch [1/15], Train Loss: 2.7475, Train Accuracy: 46.00%, Test Loss: 0.7018, Test Accuracy: 50.00%


Epoch [2/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.54batch/s]


Epoch [2/15], Train Loss: 0.6304, Train Accuracy: 54.00%, Test Loss: 0.6271, Test Accuracy: 59.00%


Epoch [3/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.89batch/s]


Epoch [3/15], Train Loss: 0.5645, Train Accuracy: 72.00%, Test Loss: 0.4709, Test Accuracy: 81.00%


Epoch [4/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.87batch/s]


Epoch [4/15], Train Loss: 0.5629, Train Accuracy: 78.00%, Test Loss: 0.4878, Test Accuracy: 76.33%


Epoch [5/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.88batch/s]


Epoch [5/15], Train Loss: 0.4075, Train Accuracy: 77.00%, Test Loss: 0.7697, Test Accuracy: 60.33%


Epoch [6/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.84batch/s]


Epoch [6/15], Train Loss: 0.5917, Train Accuracy: 64.00%, Test Loss: 0.5157, Test Accuracy: 73.33%


Epoch [7/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.73batch/s]


Epoch [7/15], Train Loss: 0.5042, Train Accuracy: 74.00%, Test Loss: 0.3849, Test Accuracy: 78.33%


Epoch [8/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.82batch/s]


Epoch [8/15], Train Loss: 0.3377, Train Accuracy: 87.00%, Test Loss: 0.3944, Test Accuracy: 80.00%


Epoch [9/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.90batch/s]


Epoch [9/15], Train Loss: 0.3651, Train Accuracy: 90.00%, Test Loss: 0.3768, Test Accuracy: 83.00%


Epoch [10/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.36batch/s]


Epoch [10/15], Train Loss: 0.3240, Train Accuracy: 89.00%, Test Loss: 0.3848, Test Accuracy: 80.00%


Epoch [11/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.85batch/s]


Epoch [11/15], Train Loss: 0.4577, Train Accuracy: 85.00%, Test Loss: 0.3560, Test Accuracy: 81.67%


Epoch [12/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.78batch/s]


Epoch [12/15], Train Loss: 0.2608, Train Accuracy: 87.00%, Test Loss: 0.4206, Test Accuracy: 78.67%


Epoch [13/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.89batch/s]


Epoch [13/15], Train Loss: 0.3197, Train Accuracy: 85.00%, Test Loss: 0.3826, Test Accuracy: 81.67%


Epoch [14/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.91batch/s]


Epoch [14/15], Train Loss: 0.3177, Train Accuracy: 85.00%, Test Loss: 0.3542, Test Accuracy: 83.00%


Epoch [15/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.90batch/s]


Epoch [15/15], Train Loss: 0.2697, Train Accuracy: 91.00%, Test Loss: 0.3505, Test Accuracy: 83.33%
Fold 4/4: Training on 100 samples, Testing on 300 samples


  model.load_state_dict(torch.load(model_path))


Device using for training: cuda


Epoch [1/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  6.15batch/s]


Epoch [1/15], Train Loss: 3.6068, Train Accuracy: 48.00%, Test Loss: 1.3000, Test Accuracy: 50.00%


Epoch [2/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.79batch/s]


Epoch [2/15], Train Loss: 1.3394, Train Accuracy: 38.00%, Test Loss: 0.6690, Test Accuracy: 50.00%


Epoch [3/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.87batch/s]


Epoch [3/15], Train Loss: 0.7091, Train Accuracy: 41.00%, Test Loss: 0.6454, Test Accuracy: 52.67%


Epoch [4/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.84batch/s]


Epoch [4/15], Train Loss: 0.5746, Train Accuracy: 62.00%, Test Loss: 0.6761, Test Accuracy: 53.00%


Epoch [5/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.87batch/s]


Epoch [5/15], Train Loss: 0.5500, Train Accuracy: 60.00%, Test Loss: 0.5118, Test Accuracy: 80.00%


Epoch [6/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.85batch/s]


Epoch [6/15], Train Loss: 0.4671, Train Accuracy: 77.00%, Test Loss: 0.4931, Test Accuracy: 75.33%


Epoch [7/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.89batch/s]


Epoch [7/15], Train Loss: 0.4096, Train Accuracy: 86.00%, Test Loss: 0.4550, Test Accuracy: 80.00%


Epoch [8/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.75batch/s]


Epoch [8/15], Train Loss: 0.3730, Train Accuracy: 78.00%, Test Loss: 0.4417, Test Accuracy: 80.67%


Epoch [9/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.49batch/s]


Epoch [9/15], Train Loss: 0.3893, Train Accuracy: 84.00%, Test Loss: 0.4314, Test Accuracy: 79.00%


Epoch [10/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.81batch/s]


Epoch [10/15], Train Loss: 0.3148, Train Accuracy: 82.00%, Test Loss: 0.4244, Test Accuracy: 80.00%


Epoch [11/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.72batch/s]


Epoch [11/15], Train Loss: 0.3340, Train Accuracy: 82.00%, Test Loss: 0.4208, Test Accuracy: 79.33%


Epoch [12/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.72batch/s]


Epoch [12/15], Train Loss: 0.3771, Train Accuracy: 86.00%, Test Loss: 0.4265, Test Accuracy: 78.00%


Epoch [13/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.85batch/s]


Epoch [13/15], Train Loss: 0.3212, Train Accuracy: 86.00%, Test Loss: 0.4140, Test Accuracy: 80.33%


Epoch [14/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.85batch/s]


Epoch [14/15], Train Loss: 0.3376, Train Accuracy: 83.00%, Test Loss: 0.4154, Test Accuracy: 81.00%


Epoch [15/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  5.85batch/s]


Epoch [15/15], Train Loss: 0.4217, Train Accuracy: 82.00%, Test Loss: 0.4146, Test Accuracy: 81.00%


## Evaluation

In [9]:
def compute_confidence_interval(data):
    mean_val = np.mean(data)
    std_val = np.std(data)
    n = len(data)
    margin_of_error = 1.96 * (std_val / np.sqrt(n))
    
    lower_bound = mean_val - margin_of_error
    upper_bound = mean_val + margin_of_error
    
    return mean_val, lower_bound, upper_bound

In [13]:
# for result in results:
#     print(f"Fold {result['fold']}:")
#     print(f"  Train Accuracy: {result['train_accuracies'][-1]:.2f}%")
#     print(f"  Test Accuracy: {result['test_accuracies'][-1]:.2f}%")
#     print(f"  Test Precision: {result['test_precisions'][-1] * 100:.2f}%")
#     print(f"  Test Recall: {result['test_recalls'][-1] * 100:.2f}%")
#     print(f"  Test F1-score: {result['test_f1s'][-1] * 100:.2f}%")

train_losses = [fold['train_losses'][-1] for fold in results]
train_accuracies = [fold['train_accuracies'][-1] for fold in results]
test_losses = [fold['test_losses'][-1] for fold in results]
test_accuracies = [fold['test_accuracies'][-1] for fold in results]
test_precisions = [fold['test_precisions'][-1] for fold in results]
test_recalls = [fold['test_recalls'][-1] for fold in results]
test_f1s = [fold['test_f1s'][-1] for fold in results]

print(f"Test Accuracies: {test_accuracies}")
print(f"Test Precisions: {test_precisions}")
print(f"Test Rccuracies: {test_recalls}")
print(f"Test F1s: {test_f1s}")

avg_train_loss, ci_train_loss_low, ci_train_loss_high = compute_confidence_interval(train_losses)
avg_train_accuracy, ci_train_acc_low, ci_train_acc_high = compute_confidence_interval(train_accuracies)
avg_test_loss, ci_test_loss_low, ci_test_loss_high = compute_confidence_interval(test_losses)
avg_test_accuracy, ci_test_acc_low, ci_test_acc_high = compute_confidence_interval(test_accuracies)
avg_test_precision, ci_test_prec_low, ci_test_prec_high = compute_confidence_interval(test_precisions)
avg_test_recall, ci_test_rec_low, ci_test_rec_high = compute_confidence_interval(test_recalls)
avg_test_f1, ci_test_f1_low, ci_test_f1_high = compute_confidence_interval(test_f1s)

headers = ["Metric", "Mean", "95% CI Lower", "95% CI Upper"]
data = [
    ["Training Loss", f"{avg_train_loss:.4f}", f"{ci_train_loss_low:.4f}", f"{ci_train_loss_high:.4f}"],
    ["Test Loss", f"{avg_test_loss:.4f}", f"{ci_test_loss_low:.4f}", f"{ci_test_loss_high:.4f}"],
    ["Training Accuracy (%)", f"{avg_train_accuracy:.2f}", f"{ci_train_acc_low:.2f}", f"{ci_train_acc_high:.2f}"],
    ["Test Accuracy (%)", f"{avg_test_accuracy:.2f}", f"{ci_test_acc_low:.2f}", f"{ci_test_acc_high:.2f}"],
    ["Test Precision (%)", f"{avg_test_precision * 100:.2f}", f"{ci_test_prec_low * 100:.2f}", f"{ci_test_prec_high * 100:.2f}"],
    ["Test Recall (%)", f"{avg_test_recall * 100:.2f}", f"{ci_test_rec_low * 100:.2f}", f"{ci_test_rec_high * 100:.2f}"],
    ["Test F1-score (%)", f"{avg_test_f1 * 100:.2f}", f"{ci_test_f1_low * 100:.2f}", f"{ci_test_f1_high * 100:.2f}"]
]

print("\nOverall Performance with 95% Confidence Intervals:")
print(tabulate(data, headers=headers, tablefmt="grid"))

Test Accuracies: [86.66666666666667, 83.0, 83.33333333333333, 81.0]
Test Precisions: [0.8683035714285715, 0.8300146673185474, 0.8333333333333334, 0.8103448275862069]
Test Rccuracies: [0.8666666666666667, 0.83, 0.8333333333333334, 0.81]
Test F1s: [0.8665183537263627, 0.8299981110901232, 0.8333333333333334, 0.8099472075576549]

Overall Performance with 95% Confidence Intervals:
+-----------------------+---------+----------------+----------------+
| Metric                |    Mean |   95% CI Lower |   95% CI Upper |
| Training Loss         |  0.3295 |         0.2363 |         0.4226 |
+-----------------------+---------+----------------+----------------+
| Test Loss             |  0.3744 |         0.3496 |         0.3991 |
+-----------------------+---------+----------------+----------------+
| Training Accuracy (%) | 86.5    |        81.58   |        91.42   |
+-----------------------+---------+----------------+----------------+
| Test Accuracy (%)     | 83.5    |        81.51   |        8