# Pediatric Model Without Transfer

Utilizes empty model

Import all needed in this notebook

In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
from transformers import AutoImageProcessor, ResNetForImageClassification
from sklearn.model_selection import StratifiedKFold,train_test_split
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score, roc_curve
from torch.utils.data import DataLoader, TensorDataset, Subset, random_split
from torch.optim.lr_scheduler import CosineAnnealingLR
import numpy as np
from torchvision import datasets, transforms
import matplotlib.pyplot as plt
from tqdm import tqdm
import zipfile
import torch.nn.functional as F
from tabulate import tabulate

## Model Creation

Same code for the model

In [2]:
class CustomCNNModel(nn.Module):
    def __init__(self):
        super(CustomCNNModel, self).__init__()
        
        self.conv1 = nn.Conv2d(3, 32, kernel_size=3, stride=1, padding=1)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1)
        self.conv3 = nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1)
        
        self.pool = nn.MaxPool2d(2, 2)
        
        self.fc1 = nn.Linear(128 * 28 * 28, 512) 
        self.fc2 = nn.Linear(512, 256)  
        self.fc3 = nn.Linear(256, 2)
        
        self.dropout = nn.Dropout(p=0.5) 

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x))) 
        x = self.pool(F.relu(self.conv2(x)))
        x = self.pool(F.relu(self.conv3(x)))
        
        x = x.view(-1, 128 * 28 * 28)
        
        x = F.relu(self.fc1(x))
        x = self.dropout(x)
        x = F.relu(self.fc2(x))
        x = self.dropout(x)
        x = self.fc3(x)
        
        return x

All layers will remain trainable since we start from fresh.

## Dataset Retrieval

Retrieve dataset and compute X (data images in tensor format) and y (binary encoded label)

In [3]:
# with zipfile.ZipFile("original_data.zip", 'r') as zip_ref:
#     zip_ref.extractall("")

In [4]:
transform = transforms.Compose([transforms.ToTensor()])

dataset = datasets.ImageFolder(root="../pediatric_dataset/preprocessed_medium", transform=transform)

test_size = 0.75
random_seed = 42

labels = [dataset[i][1] for i in range(len(dataset))]

print(f"Complete Dataset: {len(dataset)} images")

Complete Dataset: 400 images


## Training Methods

In [5]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

In [6]:
def train_model(model, train_loader, test_loader, criterion, optimizer, scheduler, num_epochs=10):
    model.train()
    
    train_losses, train_accuracies = [], []
    test_losses, test_accuracies = [], []
    test_precisions, test_recalls, test_f1s = [], [], []

    print(f"Device using for training: {device}")
    model = model.to(device)

    for epoch in range(num_epochs):
        running_loss = 0.0
        correct = 0
        total = 0

        with tqdm(train_loader, unit="batch", desc=f"Epoch [{epoch+1}/{num_epochs}]") as tbar:
            for inputs, labels in tbar:
                inputs, labels = inputs.to(device), labels.to(device)

                outputs = model(inputs)
                loss = criterion(outputs, labels)

                optimizer.zero_grad()
                loss.backward()
                optimizer.step()

                _, predicted = torch.max(outputs, 1)
                total += labels.size(0)
                correct += (predicted == labels).sum().item()

                running_loss += loss.item()

        epoch_loss = running_loss / len(train_loader)
        epoch_accuracy = 100 * correct / total
        train_losses.append(epoch_loss)
        train_accuracies.append(epoch_accuracy)

        test_loss, test_accuracy, precision, recall, f1 = evaluate_model(model, test_loader, criterion)
        test_losses.append(test_loss)
        test_accuracies.append(test_accuracy)
        test_precisions.append(precision)
        test_recalls.append(recall)
        test_f1s.append(f1)
        
        scheduler.step()

        print(f"Epoch [{epoch+1}/{num_epochs}], Train Loss: {epoch_loss:.4f}, Train Accuracy: {epoch_accuracy:.2f}%, Test Loss: {test_loss:.4f}, Test Accuracy: {test_accuracy:.2f}%")

    return train_losses, train_accuracies, test_losses, test_accuracies, test_precisions, test_recalls, test_f1s


def k_fold_cross_validation_with_split(model_class, dataset, criterion, optimizer_class, scheduler_class, k=5, num_epochs=10, batch_size=32):
    skf = StratifiedKFold(n_splits=k, shuffle=True, random_state=42)

    fold_results = []
    
    labels = [dataset[i][1] for i in range(len(dataset))]

    print(f"Running {k}-Fold Cross-Validation...")

    for fold, (rest_folds_indices, one_fold_indices) in enumerate(skf.split(dataset, labels)):
        print(f"Fold {fold + 1}/{k}: Training on {len(one_fold_indices)} samples, Testing on {len(rest_folds_indices)} samples")

        train_subset = Subset(dataset, one_fold_indices)
        test_subset = Subset(dataset, rest_folds_indices)
        train_loader = DataLoader(train_subset, batch_size=batch_size, shuffle=True)
        test_loader = DataLoader(test_subset, batch_size=batch_size, shuffle=False)

        model = model_class()
        optimizer = optimizer_class(model.parameters())
        scheduler = scheduler_class(optimizer)

        train_losses, train_accuracies, test_losses, test_accuracies, test_precisions, test_recalls, test_f1s = train_model(
            model, train_loader, test_loader, criterion, optimizer, scheduler, num_epochs
        )

        fold_results.append({
            'fold': fold + 1,
            'train_losses': train_losses,
            'train_accuracies': train_accuracies,
            'test_losses': test_losses,
            'test_accuracies': test_accuracies,
            'test_precisions': test_precisions,
            'test_recalls': test_recalls,
            'test_f1s': test_f1s
        })
        
    return fold_results

def evaluate_model(model, test_loader, criterion):
    model.eval()
    test_losses, correct, total = [], 0, 0
    all_labels, all_preds = [], []

    with torch.no_grad():
        for inputs, labels in test_loader:
            inputs, labels = inputs.to(device), labels.to(device)

            outputs = model(inputs)
            loss = criterion(outputs, labels)
            test_losses.append(loss.item())

            _, predicted = torch.max(outputs, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()

            all_labels.extend(labels.cpu().numpy())
            all_preds.extend(predicted.cpu().numpy())

    test_loss = sum(test_losses) / len(test_loader)
    test_accuracy = 100 * correct / total

    precision = precision_score(all_labels, all_preds, average="weighted", zero_division=0)
    recall = recall_score(all_labels, all_preds, average="weighted", zero_division=0)
    f1 = f1_score(all_labels, all_preds, average="weighted", zero_division=0)

    return test_loss, test_accuracy, precision, recall, f1

## Transfer Training

In [7]:
criterion = nn.CrossEntropyLoss()
optimizer_class = lambda params: optim.Adam(params, lr=1e-3, weight_decay=1e-2)
scheduler_class = lambda optimizer: CosineAnnealingLR(optimizer, T_max=15)
model_class = CustomCNNModel
num_epochs = 15

results = k_fold_cross_validation_with_split(model_class, dataset, criterion, optimizer_class, scheduler_class, k=4, num_epochs=num_epochs, batch_size=32)

Running 4-Fold Cross-Validation...
Fold 1/4: Training on 100 samples, Testing on 300 samples
Device using for training: cuda


Epoch [1/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:02<00:00,  1.43batch/s]


Epoch [1/15], Train Loss: 0.7174, Train Accuracy: 51.00%, Test Loss: 0.7030, Test Accuracy: 50.00%


Epoch [2/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.98batch/s]


Epoch [2/15], Train Loss: 0.7004, Train Accuracy: 51.00%, Test Loss: 0.6901, Test Accuracy: 50.00%


Epoch [3/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.95batch/s]


Epoch [3/15], Train Loss: 0.6858, Train Accuracy: 66.00%, Test Loss: 0.6726, Test Accuracy: 50.00%


Epoch [4/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.99batch/s]


Epoch [4/15], Train Loss: 0.6779, Train Accuracy: 51.00%, Test Loss: 0.6555, Test Accuracy: 82.00%


Epoch [5/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.97batch/s]


Epoch [5/15], Train Loss: 0.6545, Train Accuracy: 68.00%, Test Loss: 0.5950, Test Accuracy: 80.33%


Epoch [6/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.98batch/s]


Epoch [6/15], Train Loss: 0.5397, Train Accuracy: 74.00%, Test Loss: 0.4725, Test Accuracy: 77.00%


Epoch [7/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.98batch/s]


Epoch [7/15], Train Loss: 0.5658, Train Accuracy: 69.00%, Test Loss: 0.3840, Test Accuracy: 83.00%


Epoch [8/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.96batch/s]


Epoch [8/15], Train Loss: 0.5265, Train Accuracy: 70.00%, Test Loss: 0.3714, Test Accuracy: 85.67%


Epoch [9/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.99batch/s]


Epoch [9/15], Train Loss: 0.4873, Train Accuracy: 80.00%, Test Loss: 0.3859, Test Accuracy: 82.67%


Epoch [10/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.83batch/s]


Epoch [10/15], Train Loss: 0.4445, Train Accuracy: 80.00%, Test Loss: 0.3482, Test Accuracy: 84.33%


Epoch [11/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.03batch/s]


Epoch [11/15], Train Loss: 0.3161, Train Accuracy: 84.00%, Test Loss: 0.3514, Test Accuracy: 83.67%


Epoch [12/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.90batch/s]


Epoch [12/15], Train Loss: 0.4298, Train Accuracy: 84.00%, Test Loss: 0.3403, Test Accuracy: 85.00%


Epoch [13/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.00batch/s]


Epoch [13/15], Train Loss: 0.2898, Train Accuracy: 83.00%, Test Loss: 0.4088, Test Accuracy: 80.33%


Epoch [14/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.05batch/s]


Epoch [14/15], Train Loss: 0.4225, Train Accuracy: 78.00%, Test Loss: 0.3695, Test Accuracy: 82.00%


Epoch [15/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.91batch/s]


Epoch [15/15], Train Loss: 0.3367, Train Accuracy: 82.00%, Test Loss: 0.3497, Test Accuracy: 83.00%
Fold 2/4: Training on 100 samples, Testing on 300 samples
Device using for training: cuda


Epoch [1/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.67batch/s]


Epoch [1/15], Train Loss: 0.8219, Train Accuracy: 46.00%, Test Loss: 0.6962, Test Accuracy: 50.00%


Epoch [2/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.98batch/s]


Epoch [2/15], Train Loss: 0.6893, Train Accuracy: 49.00%, Test Loss: 0.7037, Test Accuracy: 50.00%


Epoch [3/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.93batch/s]


Epoch [3/15], Train Loss: 0.6842, Train Accuracy: 50.00%, Test Loss: 0.6806, Test Accuracy: 57.67%


Epoch [4/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.02batch/s]


Epoch [4/15], Train Loss: 0.6556, Train Accuracy: 66.00%, Test Loss: 0.6247, Test Accuracy: 68.33%


Epoch [5/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.00batch/s]


Epoch [5/15], Train Loss: 0.5182, Train Accuracy: 79.00%, Test Loss: 0.6265, Test Accuracy: 63.00%


Epoch [6/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.02batch/s]


Epoch [6/15], Train Loss: 0.5495, Train Accuracy: 78.00%, Test Loss: 0.4458, Test Accuracy: 78.33%


Epoch [7/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.82batch/s]


Epoch [7/15], Train Loss: 0.3423, Train Accuracy: 83.00%, Test Loss: 0.4136, Test Accuracy: 79.67%


Epoch [8/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.89batch/s]


Epoch [8/15], Train Loss: 0.2776, Train Accuracy: 86.00%, Test Loss: 0.4397, Test Accuracy: 80.67%


Epoch [9/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.95batch/s]


Epoch [9/15], Train Loss: 0.2566, Train Accuracy: 87.00%, Test Loss: 0.3717, Test Accuracy: 82.33%


Epoch [10/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.00batch/s]


Epoch [10/15], Train Loss: 0.2027, Train Accuracy: 90.00%, Test Loss: 0.3893, Test Accuracy: 81.33%


Epoch [11/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.94batch/s]


Epoch [11/15], Train Loss: 0.1908, Train Accuracy: 91.00%, Test Loss: 0.3739, Test Accuracy: 82.67%


Epoch [12/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  4.00batch/s]


Epoch [12/15], Train Loss: 0.1812, Train Accuracy: 94.00%, Test Loss: 0.3797, Test Accuracy: 83.00%


Epoch [13/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.01batch/s]


Epoch [13/15], Train Loss: 0.1555, Train Accuracy: 94.00%, Test Loss: 0.3729, Test Accuracy: 83.33%


Epoch [14/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.01batch/s]


Epoch [14/15], Train Loss: 0.1569, Train Accuracy: 93.00%, Test Loss: 0.3813, Test Accuracy: 82.33%


Epoch [15/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.91batch/s]


Epoch [15/15], Train Loss: 0.1532, Train Accuracy: 92.00%, Test Loss: 0.3748, Test Accuracy: 82.67%
Fold 3/4: Training on 100 samples, Testing on 300 samples
Device using for training: cuda


Epoch [1/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.91batch/s]


Epoch [1/15], Train Loss: 0.8581, Train Accuracy: 50.00%, Test Loss: 0.7002, Test Accuracy: 50.00%


Epoch [2/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.99batch/s]


Epoch [2/15], Train Loss: 0.7005, Train Accuracy: 48.00%, Test Loss: 0.6922, Test Accuracy: 50.00%


Epoch [3/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.93batch/s]


Epoch [3/15], Train Loss: 0.6984, Train Accuracy: 50.00%, Test Loss: 0.6903, Test Accuracy: 50.00%


Epoch [4/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.93batch/s]


Epoch [4/15], Train Loss: 0.6880, Train Accuracy: 62.00%, Test Loss: 0.6895, Test Accuracy: 50.00%


Epoch [5/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.99batch/s]


Epoch [5/15], Train Loss: 0.6857, Train Accuracy: 50.00%, Test Loss: 0.6874, Test Accuracy: 50.00%


Epoch [6/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.02batch/s]


Epoch [6/15], Train Loss: 0.6840, Train Accuracy: 50.00%, Test Loss: 0.6842, Test Accuracy: 50.00%


Epoch [7/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.97batch/s]


Epoch [7/15], Train Loss: 0.6863, Train Accuracy: 50.00%, Test Loss: 0.6747, Test Accuracy: 67.67%


Epoch [8/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00,  4.02batch/s]


Epoch [8/15], Train Loss: 0.6739, Train Accuracy: 77.00%, Test Loss: 0.6676, Test Accuracy: 52.67%


Epoch [9/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.97batch/s]


Epoch [9/15], Train Loss: 0.6364, Train Accuracy: 62.00%, Test Loss: 0.6254, Test Accuracy: 58.33%


Epoch [10/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.98batch/s]


Epoch [10/15], Train Loss: 0.5878, Train Accuracy: 69.00%, Test Loss: 0.7608, Test Accuracy: 50.00%


Epoch [11/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.98batch/s]


Epoch [11/15], Train Loss: 0.6435, Train Accuracy: 57.00%, Test Loss: 0.6280, Test Accuracy: 57.00%


Epoch [12/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.95batch/s]


Epoch [12/15], Train Loss: 0.5996, Train Accuracy: 58.00%, Test Loss: 0.5575, Test Accuracy: 68.33%


Epoch [13/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.96batch/s]


Epoch [13/15], Train Loss: 0.5196, Train Accuracy: 80.00%, Test Loss: 0.5334, Test Accuracy: 76.33%


Epoch [14/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.96batch/s]


Epoch [14/15], Train Loss: 0.5229, Train Accuracy: 78.00%, Test Loss: 0.5371, Test Accuracy: 76.33%


Epoch [15/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.79batch/s]


Epoch [15/15], Train Loss: 0.5112, Train Accuracy: 81.00%, Test Loss: 0.5300, Test Accuracy: 77.00%
Fold 4/4: Training on 100 samples, Testing on 300 samples
Device using for training: cuda


Epoch [1/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.95batch/s]


Epoch [1/15], Train Loss: 0.7650, Train Accuracy: 44.00%, Test Loss: 0.6930, Test Accuracy: 50.00%


Epoch [2/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  4.00batch/s]


Epoch [2/15], Train Loss: 0.6900, Train Accuracy: 53.00%, Test Loss: 0.6993, Test Accuracy: 50.00%


Epoch [3/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.91batch/s]


Epoch [3/15], Train Loss: 0.6935, Train Accuracy: 50.00%, Test Loss: 0.6889, Test Accuracy: 50.00%


Epoch [4/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.95batch/s]


Epoch [4/15], Train Loss: 0.6791, Train Accuracy: 60.00%, Test Loss: 0.6950, Test Accuracy: 50.00%


Epoch [5/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.94batch/s]


Epoch [5/15], Train Loss: 0.6600, Train Accuracy: 51.00%, Test Loss: 0.6700, Test Accuracy: 51.67%


Epoch [6/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.96batch/s]


Epoch [6/15], Train Loss: 0.5976, Train Accuracy: 65.00%, Test Loss: 0.5630, Test Accuracy: 76.67%


Epoch [7/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.95batch/s]


Epoch [7/15], Train Loss: 0.4574, Train Accuracy: 77.00%, Test Loss: 0.5290, Test Accuracy: 74.00%


Epoch [8/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.97batch/s]


Epoch [8/15], Train Loss: 0.4243, Train Accuracy: 86.00%, Test Loss: 0.5265, Test Accuracy: 76.33%


Epoch [9/15]: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.99batch/s]


Epoch [9/15], Train Loss: 0.4620, Train Accuracy: 84.00%, Test Loss: 0.9444, Test Accuracy: 65.33%


Epoch [10/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.95batch/s]


Epoch [10/15], Train Loss: 0.6924, Train Accuracy: 67.00%, Test Loss: 0.4287, Test Accuracy: 80.00%


Epoch [11/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.96batch/s]


Epoch [11/15], Train Loss: 0.3496, Train Accuracy: 82.00%, Test Loss: 0.5111, Test Accuracy: 71.00%


Epoch [12/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.97batch/s]


Epoch [12/15], Train Loss: 0.4342, Train Accuracy: 80.00%, Test Loss: 0.4828, Test Accuracy: 75.00%


Epoch [13/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.94batch/s]


Epoch [13/15], Train Loss: 0.3677, Train Accuracy: 84.00%, Test Loss: 0.4379, Test Accuracy: 78.00%


Epoch [14/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.94batch/s]


Epoch [14/15], Train Loss: 0.5089, Train Accuracy: 85.00%, Test Loss: 0.4263, Test Accuracy: 80.67%


Epoch [15/15]: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:01<00:00,  3.92batch/s]


Epoch [15/15], Train Loss: 0.3407, Train Accuracy: 84.00%, Test Loss: 0.4245, Test Accuracy: 80.33%


## Evaluation

In [8]:
def compute_confidence_interval(data):
    mean_val = np.mean(data)
    std_val = np.std(data)
    n = len(data)
    margin_of_error = 1.96 * (std_val / np.sqrt(n))
    
    lower_bound = mean_val - margin_of_error
    upper_bound = mean_val + margin_of_error
    
    return mean_val, lower_bound, upper_bound

In [10]:
# for result in results:
#     print(f"Fold {result['fold']}:")
#     print(f"  Train Accuracy: {result['train_accuracies'][-1]:.2f}%")
#     print(f"  Test Accuracy: {result['test_accuracies'][-1]:.2f}%")
#     print(f"  Test Precision: {result['test_precisions'][-1] * 100:.2f}%")
#     print(f"  Test Recall: {result['test_recalls'][-1] * 100:.2f}%")
#     print(f"  Test F1-score: {result['test_f1s'][-1] * 100:.2f}%")

train_losses = [fold['train_losses'][-1] for fold in results]
train_accuracies = [fold['train_accuracies'][-1] for fold in results]
test_losses = [fold['test_losses'][-1] for fold in results]
test_accuracies = [fold['test_accuracies'][-1] for fold in results]
test_precisions = [fold['test_precisions'][-1] for fold in results]
test_recalls = [fold['test_recalls'][-1] for fold in results]
test_f1s = [fold['test_f1s'][-1] for fold in results]

print(f"Test Accuracies: {test_accuracies}")
print(f"Test Precisions: {test_precisions}")
print(f"Test Rccuracies: {test_recalls}")
print(f"Test F1s: {test_f1s}")

avg_train_loss, ci_train_loss_low, ci_train_loss_high = compute_confidence_interval(train_losses)
avg_train_accuracy, ci_train_acc_low, ci_train_acc_high = compute_confidence_interval(train_accuracies)
avg_test_loss, ci_test_loss_low, ci_test_loss_high = compute_confidence_interval(test_losses)
avg_test_accuracy, ci_test_acc_low, ci_test_acc_high = compute_confidence_interval(test_accuracies)
avg_test_precision, ci_test_prec_low, ci_test_prec_high = compute_confidence_interval(test_precisions)
avg_test_recall, ci_test_rec_low, ci_test_rec_high = compute_confidence_interval(test_recalls)
avg_test_f1, ci_test_f1_low, ci_test_f1_high = compute_confidence_interval(test_f1s)

headers = ["Metric", "Mean", "95% CI Lower", "95% CI Upper"]
data = [
    ["Training Loss", f"{avg_train_loss:.4f}", f"{ci_train_loss_low:.4f}", f"{ci_train_loss_high:.4f}"],
    ["Test Loss", f"{avg_test_loss:.4f}", f"{ci_test_loss_low:.4f}", f"{ci_test_loss_high:.4f}"],
    ["Training Accuracy (%)", f"{avg_train_accuracy:.2f}", f"{ci_train_acc_low:.2f}", f"{ci_train_acc_high:.2f}"],
    ["Test Accuracy (%)", f"{avg_test_accuracy:.2f}", f"{ci_test_acc_low:.2f}", f"{ci_test_acc_high:.2f}"],
    ["Test Precision (%)", f"{avg_test_precision * 100:.2f}", f"{ci_test_prec_low * 100:.2f}", f"{ci_test_prec_high * 100:.2f}"],
    ["Test Recall (%)", f"{avg_test_recall * 100:.2f}", f"{ci_test_rec_low * 100:.2f}", f"{ci_test_rec_high * 100:.2f}"],
    ["Test F1-score (%)", f"{avg_test_f1 * 100:.2f}", f"{ci_test_f1_low * 100:.2f}", f"{ci_test_f1_high * 100:.2f}"]
]

print("\nOverall Performance with 95% Confidence Intervals:")
print(tabulate(data, headers=headers, tablefmt="grid"))

Test Accuracies: [83.0, 82.66666666666667, 77.0, 80.33333333333333]
Test Precisions: [0.8490011750881316, 0.8295373027259685, 0.7804838635209381, 0.8063973063973063]
Test Rccuracies: [0.83, 0.8266666666666667, 0.77, 0.8033333333333333]
Test F1s: [0.8276541819205857, 0.8262883613202084, 0.7678305050527708, 0.8028404344193818]

Overall Performance with 95% Confidence Intervals:
+-----------------------+---------+----------------+----------------+
| Metric                |    Mean |   95% CI Lower |   95% CI Upper |
| Training Loss         |  0.3354 |         0.2114 |         0.4595 |
+-----------------------+---------+----------------+----------------+
| Test Loss             |  0.4198 |         0.352  |         0.4875 |
+-----------------------+---------+----------------+----------------+
| Training Accuracy (%) | 84.75   |        80.51   |        88.99   |
+-----------------------+---------+----------------+----------------+
| Test Accuracy (%)     | 80.75   |        78.4    |        8