# 04: experiments

this notebook runs systematic experiments and compares results from the model registry.


In [1]:
import sys
sys.path.append('../src')

import torch
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from src.config import Config
from src.datasets import get_cifar10_loaders
from src.models import create_model
from src.trainer import Trainer
from src.utils import set_seed, calculate_model_size
from src.model_registry import registry

set_seed(42)
config = Config()
print(f"device: {config.device}")


device: cuda


In [2]:
# load data
train_loader, val_loader, test_loader = get_cifar10_loaders(config)
print(f"data loaded: {len(train_loader.dataset)} train, {len(val_loader.dataset)} val, {len(test_loader.dataset)} test")


data loaded: 40000 train, 10000 val, 10000 test


In [3]:
# analyze existing models
models = registry.list_models()
results = []

for model_id, info in models.items():
    model_name = info['model_name']
    history = info['history']
    parameters = info['parameters']
    
    # get best validation accuracy
    best_val_acc = max(history['val_acc'])
    final_train_acc = history['train_acc'][-1]
    final_val_acc = history['val_acc'][-1]
    
    results.append({
        'model_id': model_id,
        'model_name': model_name,
        'parameters': parameters,
        'best_val_acc': best_val_acc,
        'final_train_acc': final_train_acc,
        'final_val_acc': final_val_acc,
        'epochs': len(history['train_acc'])
    })

df = pd.DataFrame(results)
print("model comparison:")
print(df.to_string(index=False))


model comparison:
                   model_id  model_name  parameters  best_val_acc  final_train_acc  final_val_acc  epochs
  SimpleCNN_20251024_171753   SimpleCNN     1147914         83.50          82.7875          83.50      30
ImprovedCNN_20251024_172317 ImprovedCNN     1186826         84.21          86.1900          83.42      30
  SimpleCNN_20251024_174825   SimpleCNN     1147914         83.50          82.7875          83.50      30
ImprovedCNN_20251024_175420 ImprovedCNN     1186826         84.21          86.1900          83.42      30
  SimpleCNN_20251024_180951   SimpleCNN     1147914         81.58          78.7125          81.58      20
  SimpleCNN_20251024_181037   SimpleCNN     1147914         80.59          78.6425          80.59      20


In [5]:
#running new experiments with different hyperparameters
print("running new experiment with different learning rate...")

#creating new config with different lr
new_config = Config()
new_config.lr = 0.01
new_config.epochs = 20
print(f"new config: lr={new_config.lr}, epochs={new_config.epochs}")

#training simple cnn with new config
model = create_model('simple_cnn', new_config).to(new_config.device)
trainer = Trainer(model, new_config)

print("training new model...")
history = trainer.fit(train_loader, val_loader)

print(f"new model best val acc: {max(history['val_acc']):.2f}%")
print(f"new model final train acc: {history['train_acc'][-1]:.2f}%")


running new experiment with different learning rate...
new config: lr=0.01, epochs=20
training new model...
Training on cuda
Model parameters: 1,147,914

Epoch 1/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 161.38it/s, Loss=1.6369, Acc=39.21%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 184.97it/s]


Train Loss: 1.6341, Train Acc: 39.21%
Val Loss: 1.2767, Val Acc: 52.89%
New best validation accuracy: 52.89%

Epoch 2/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 170.68it/s, Loss=0.9815, Acc=51.85%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 212.82it/s]


Train Loss: 1.3216, Train Acc: 51.85%
Val Loss: 1.0962, Val Acc: 59.81%
New best validation accuracy: 59.81%

Epoch 3/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 167.20it/s, Loss=1.2247, Acc=57.80%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 251.01it/s]


Train Loss: 1.1755, Train Acc: 57.80%
Val Loss: 1.0492, Val Acc: 61.63%
New best validation accuracy: 61.63%

Epoch 4/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 182.83it/s, Loss=1.1273, Acc=61.22%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 210.09it/s]


Train Loss: 1.0766, Train Acc: 61.22%
Val Loss: 0.9868, Val Acc: 65.52%
New best validation accuracy: 65.52%

Epoch 5/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 186.77it/s, Loss=0.9305, Acc=64.02%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 223.57it/s]


Train Loss: 1.0145, Train Acc: 64.02%
Val Loss: 0.8783, Val Acc: 68.74%
New best validation accuracy: 68.74%

Epoch 6/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 188.47it/s, Loss=1.1616, Acc=65.97%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 173.12it/s]


Train Loss: 0.9521, Train Acc: 65.97%
Val Loss: 0.8067, Val Acc: 71.38%
New best validation accuracy: 71.38%

Epoch 7/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 172.09it/s, Loss=0.7624, Acc=67.96%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 223.13it/s]


Train Loss: 0.9020, Train Acc: 67.96%
Val Loss: 0.7873, Val Acc: 72.17%
New best validation accuracy: 72.17%

Epoch 8/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 178.06it/s, Loss=0.7456, Acc=69.51%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 205.70it/s]


Train Loss: 0.8646, Train Acc: 69.51%
Val Loss: 0.7488, Val Acc: 73.74%
New best validation accuracy: 73.74%

Epoch 9/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 175.87it/s, Loss=0.7332, Acc=70.67%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 234.51it/s]


Train Loss: 0.8326, Train Acc: 70.67%
Val Loss: 0.7028, Val Acc: 75.29%
New best validation accuracy: 75.29%

Epoch 10/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 175.86it/s, Loss=1.0536, Acc=71.80%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 219.50it/s]


Train Loss: 0.8032, Train Acc: 71.80%
Val Loss: 0.7140, Val Acc: 74.89%

Epoch 11/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 173.38it/s, Loss=0.8363, Acc=72.56%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 226.15it/s]


Train Loss: 0.7785, Train Acc: 72.56%
Val Loss: 0.7061, Val Acc: 75.51%
New best validation accuracy: 75.51%

Epoch 12/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 176.20it/s, Loss=0.6228, Acc=73.57%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 214.28it/s]


Train Loss: 0.7486, Train Acc: 73.57%
Val Loss: 0.6615, Val Acc: 76.69%
New best validation accuracy: 76.69%

Epoch 13/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 182.37it/s, Loss=0.6329, Acc=74.34%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 207.49it/s]


Train Loss: 0.7369, Train Acc: 74.34%
Val Loss: 0.6394, Val Acc: 77.16%
New best validation accuracy: 77.16%

Epoch 14/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 169.97it/s, Loss=0.5903, Acc=75.29%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 240.80it/s]


Train Loss: 0.7101, Train Acc: 75.29%
Val Loss: 0.6534, Val Acc: 76.89%

Epoch 15/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 174.09it/s, Loss=0.7430, Acc=76.08%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 218.17it/s]


Train Loss: 0.6922, Train Acc: 76.08%
Val Loss: 0.6339, Val Acc: 77.86%
New best validation accuracy: 77.86%

Epoch 16/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 171.02it/s, Loss=0.5389, Acc=76.42%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 224.20it/s]


Train Loss: 0.6750, Train Acc: 76.42%
Val Loss: 0.6077, Val Acc: 79.01%
New best validation accuracy: 79.01%

Epoch 17/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 166.46it/s, Loss=0.5622, Acc=76.77%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 213.30it/s]


Train Loss: 0.6601, Train Acc: 76.77%
Val Loss: 0.6060, Val Acc: 78.45%

Epoch 18/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 173.33it/s, Loss=0.5114, Acc=77.58%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 178.49it/s]


Train Loss: 0.6393, Train Acc: 77.58%
Val Loss: 0.6546, Val Acc: 77.60%

Epoch 19/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:01<00:00, 169.24it/s, Loss=0.7219, Acc=78.10%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 217.25it/s]


Train Loss: 0.6321, Train Acc: 78.10%
Val Loss: 0.5808, Val Acc: 79.52%
New best validation accuracy: 79.52%

Epoch 20/20
--------------------------------------------------


Training: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 313/313 [00:02<00:00, 147.10it/s, Loss=0.6963, Acc=78.64%]
Validation: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:00<00:00, 228.61it/s]

Train Loss: 0.6139, Train Acc: 78.64%
Val Loss: 0.5209, Val Acc: 82.04%
New best validation accuracy: 82.04%

Training completed in 44.25s
Best validation accuracy: 82.04%
model registered with id: SimpleCNN_20251024_181723
new model best val acc: 82.04%
new model final train acc: 78.64%





In [6]:
# compare all models
print("final model comparison:")
models = registry.list_models()
for model_id, info in models.items():
    print(f"{info['model_name']}: {max(info['history']['val_acc']):.2f}% val acc, {info['parameters']:,} params")

final model comparison:
SimpleCNN: 83.50% val acc, 1,147,914 params
ImprovedCNN: 84.21% val acc, 1,186,826 params
SimpleCNN: 83.50% val acc, 1,147,914 params
ImprovedCNN: 84.21% val acc, 1,186,826 params
SimpleCNN: 81.58% val acc, 1,147,914 params
SimpleCNN: 80.59% val acc, 1,147,914 params
SimpleCNN: 80.50% val acc, 1,147,914 params
SimpleCNN: 82.04% val acc, 1,147,914 params
