# Columnformer Testing playground on ImageNet-100

## 1 - Getting started

TBD  

## 2 - Cloning the code

Clone your fork of the code from the original repository at : https://github.com/clane9/columnformers  if on colab

In [1]:
# Clone your repository
#!git clone https://github.com/IhabBendidi/columnformers.git

Install all dependencies as needed

In [22]:
!cd .. && python -m pip install .
!cd .. && git checkout -b depth
!pip3 install datasets
!pip3 install torch-summary
!pip3 install timm

[0mLooking in indexes: https://pypi.org/simple, https://pypi.ngc.nvidia.com
Processing /import/pr_biofid/ihab/columnformers
  Installing build dependencies ... [?25ldone
[?25h  Getting requirements to build wheel ... [?25ldone
[?25h  Installing backend dependencies ... [?25ldone
[?25h  Preparing metadata (pyproject.toml) ... [?25ldone
Collecting fvcore
  Downloading fvcore-0.1.5.post20221221.tar.gz (50 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.2/50.2 kB[0m [31m5.4 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25ldone
[31mERROR: Ignored the following versions that require a different python version: 0.1.0 Requires-Python >=3.9; 0.1.1 Requires-Python >=3.9[0m[31m
[0m[31mERROR: Could not find a version that satisfies the requirement hf-argparser (from columnformers) (from versions: none)[0m[31m
[0m[31mERROR: No matching distribution found for hf-argparser[0m[31m
[0m[?25hfatal: Une branche nommée 'depth' exist

In [23]:
!nvidia-smi

Wed Jan  3 11:48:24 2024       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 510.60.02    Driver Version: 510.60.02    CUDA Version: 11.6     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla V100-PCIE...  Off  | 00000000:3B:00.0 Off |                    0 |
| N/A   31C    P0    35W / 250W |  12973MiB / 32768MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   1  Tesla V100-PCIE...  Off  | 00000000:AF:00.0 Off |                    0 |
| N/A   68C    P0   229W / 250W |  10967MiB / 32768MiB |    100%      Default |
|       

Import packages

In [24]:
from torch.utils.data import DataLoader,Dataset
from datasets import load_dataset, load_from_disk
import torch.nn.functional as F
from torchvision import transforms
import torch
import torch.nn as nn
import torch.optim as optim
import os
import tqdm

Define gpus to use. For now only on one gpu

In [25]:
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

Importing the dataset from Hugging Face if not already available. If available, read from disk

In [26]:
if os.path.isdir("../../imagenet100.hf"):
    dataset = load_from_disk("../../imagenet100.hf")
else:
    dataset = load_dataset("clane9/imagenet-100")
    dataset.save_to_disk("../../imagenet100.hf")

#### Preparing datasets

In [27]:
from torch.utils.data import Subset
from sklearn.model_selection import StratifiedShuffleSplit
import numpy as np

Define the type of training you will have.

"full" : Using the full ImageNet-100 for training. Not recommended on Colab unless you have a paid account

"debug" : Using a small subset of ImageNet-100 containing 6k images in training, sampled in a balanced manner from the 100 classes, used for debugging and testing the architecture. (AKA Micro-ImageNet-100)

In [28]:
training_type = "full" # "debug" for a small 6k training subset of imagenet100, or "full" for the full imagenet100
batch_size = 512

Extracting Micro-ImageNet-100

In [29]:
import os
import numpy as np

# Function to load or extract labels
def load_or_extract_labels(dataset):
    labels = [dataset[i]['label'] for i in range(len(dataset))]
    return labels

In [30]:


# Define the custom dataset class
class CustomImageDataset(Dataset):
    def __init__(self, dataset, transform=None):
        self.dataset = dataset
        self.transform = transform

    def __len__(self):
        return len(self.dataset)

    def __getitem__(self, idx):
        item = self.dataset[idx]
        image = item['image']
        label = item['label']
        if self.transform:
            image = self.transform(image)
        return {'image': image, 'label': label}

# Updated transformations for the images
transform = transforms.Compose([
    transforms.Lambda(lambda img: img.convert('RGB') if img.mode != 'RGB' else img),  # Convert all images to RGB
    transforms.ColorJitter(0.4,0.4,0.2,0.1),
    transforms.RandomResizedCrop(size=(128, 128)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

test_transform = transforms.Compose([
    transforms.Lambda(lambda img: img.convert('RGB') if img.mode != 'RGB' else img),  # Convert all images to RGB
    transforms.Resize((128, 128)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])


# Create instances of the custom dataset with transformations
train_dataset = CustomImageDataset(dataset['train'], transform=transform)
val_dataset = CustomImageDataset(dataset['validation'], transform=test_transform)

In [31]:
if training_type == "debug" :
    # Load or extract labels for training and test datasets
    train_labels = load_or_extract_labels(dataset['train'])
    test_labels = load_or_extract_labels(dataset['validation'])


In [32]:
if training_type == "debug" :
    # Stratified split
    sss_train = StratifiedShuffleSplit(n_splits=1, train_size=0.05, random_state=1)
    sss_test = StratifiedShuffleSplit(n_splits=1, test_size=0.10, random_state=0)
    
    train_indices, _ = next(sss_train.split(np.zeros(len(train_labels)), train_labels))
    _, test_indices = next(sss_test.split(np.zeros(len(test_labels)), test_labels))
    
    # Convert indices to Python integers
    train_indices = [int(i) for i in train_indices]
    test_indices = [int(i) for i in test_indices]
    
    # Create subset datasets
    train_subset = Subset(train_dataset, train_indices)
    test_subset = Subset(val_dataset, test_indices)  # Use val_dataset for test subset
    
    # Create data loaders for subsets
    train_subset_dataloader = DataLoader(train_subset, batch_size=batch_size, shuffle=True,num_workers=4)
    test_subset_dataloader = DataLoader(test_subset, batch_size=batch_size, shuffle=False,num_workers=4)

In [33]:
if training_type == "debug" :
    # Assuming train_subset and test_subset are your final subset datasets
    
    train_subset_size = len(train_subset)
    test_subset_size = len(test_subset)
    
    print(f"Size of Training Subset: {train_subset_size}")
    print(f"Size of Testing Subset: {test_subset_size}")


In [34]:
if training_type == "debug" :
    train_dataloader = train_subset_dataloader
    val_dataloader = test_subset_dataloader
elif training_type == "full" :
    # Create data loaders
    train_dataloader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True,num_workers=4)
    val_dataloader = DataLoader(val_dataset, batch_size=batch_size,num_workers=4)

## Training the model

Importing the model architecture

In [35]:
import sys
import os

# Assuming your notebook is in the 'notebooks' directory
# and you want to import modules from the 'column' directory

# Get the current working directory
notebook_dir = os.getcwd()

# Get the parent directory (columnformers)
parent_dir = os.path.dirname(notebook_dir)

# Add the parent directory to sys.path
if parent_dir not in sys.path:
    sys.path.append(parent_dir)

In [36]:
from columnformers.models.model_v1 import Columnformer, columnformer_v1_patch16_128
from columnformers.models import create_model
from columnformers.models.classification import ImageClassification

In [37]:
torch.cuda.empty_cache()

Initializing the model

In [38]:
columnformer = create_model("columnformer_v1_patch16_128")
model = ImageClassification(
        encoder=columnformer,
        img_size=128,
        patch_size=16,
        output_len=256,
        num_classes=100,
        global_pool="avg",
    ).to(device)

In [39]:
optimizer = optim.Adam(model.parameters(), lr=0.0001)

In [40]:
#scheduler = optim.lr_scheduler.ExponentialLR(optimizer, gamma = 0.99)

In [41]:
from torchsummary import summary
summary(model)

Layer (type:depth-idx)                   Param #
├─Rearrange: 1-1                         --
├─Linear: 1-2                            295,296
├─ZeroPad2d: 1-3                         --
├─Columnformer: 1-4                      --
|    └─Sheet: 2-1                        --
|    |    └─ColumnNorm: 3-1              356,352
|    |    └─ColumnAttention: 3-2         23,051,520
|    |    └─ColumnNorm: 3-3              356,352
|    |    └─ColumnMlp: 3-4               22,836,224
├─GlobalAveragePool: 1-5                 --
├─LayerNorm: 1-6                         768
├─Dropout: 1-7                           --
├─Linear: 1-8                            38,500
Total params: 46,935,012
Trainable params: 46,935,012
Non-trainable params: 0


Layer (type:depth-idx)                   Param #
├─Rearrange: 1-1                         --
├─Linear: 1-2                            295,296
├─ZeroPad2d: 1-3                         --
├─Columnformer: 1-4                      --
|    └─Sheet: 2-1                        --
|    |    └─ColumnNorm: 3-1              356,352
|    |    └─ColumnAttention: 3-2         23,051,520
|    |    └─ColumnNorm: 3-3              356,352
|    |    └─ColumnMlp: 3-4               22,836,224
├─GlobalAveragePool: 1-5                 --
├─LayerNorm: 1-6                         768
├─Dropout: 1-7                           --
├─Linear: 1-8                            38,500
Total params: 46,935,012
Trainable params: 46,935,012
Non-trainable params: 0

Training the model for 100 epochs

In [42]:
for epoch in range(100):  # 100 epochs
    model.train()  # Set the model to training mode
    total_loss = 0
    correct = 0
    total = 0
    for batch in tqdm.tqdm(train_dataloader):
        optimizer.zero_grad()  # Zero the gradients

        # Move each tensor in the batch to the GPU
        images = batch["image"].to(device)
        labels = batch["label"].to(device)

        # Forward pass: Compute loss and state by passing the processed batch through the model
        loss, state = model({"image": images, "label": labels})

        outputs = state["output"]
        # Calculate training accuracy
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

        # Backward pass: Compute gradient of the loss with respect to model parameters
        loss.backward()

        # Perform a single optimization step (parameter update)
        optimizer.step()
        total_loss += loss.item()

        # Optional: Print loss, you might want to accumulate and print every few iterations
    #scheduler.step()
    train_accuracy = 100 * correct / total
    avg_loss = total_loss / len(train_dataloader)
    print(f"Epoch {epoch}, Training Loss: {avg_loss}, Training Accuracy: {train_accuracy}%")


    # Validation phase
    model.eval()  # Set the model to evaluation mode
    val_loss = 0
    correct = 0
    total = 0

    with torch.no_grad():
        for batch in val_dataloader:
            images = batch["image"].to(device)
            labels = batch["label"].to(device)

            loss, state = model({"image": images, "label": labels})
            val_loss += loss.item()
            outputs = state["output"]

            # Calculate validation accuracy
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()

    val_accuracy = 100 * correct / total
    avg_val_loss = val_loss / len(val_dataloader)
    print(f"Validation Epoch {epoch}, Validation Loss: {avg_val_loss}, Validation Accuracy: {val_accuracy}%")

100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:38<00:00,  1.49it/s]

Epoch 0, Training Loss: 4.697567320884542, Training Accuracy: 4.277385496976804%





Validation Epoch 0, Validation Loss: 4.716021633148193, Validation Accuracy: 5.72%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 1, Training Loss: 4.463440000249984, Training Accuracy: 5.602268852349942%





Validation Epoch 1, Validation Loss: 4.638910579681396, Validation Accuracy: 6.82%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.48it/s]

Epoch 2, Training Loss: 4.377948006163252, Training Accuracy: 6.66683300481549%





Validation Epoch 2, Validation Loss: 4.548684740066529, Validation Accuracy: 8.12%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 3, Training Loss: 4.305537223815918, Training Accuracy: 7.811239468715953%





Validation Epoch 3, Validation Loss: 4.505592727661133, Validation Accuracy: 9.26%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]


Epoch 4, Training Loss: 4.245729691931542, Training Accuracy: 8.747723246587988%
Validation Epoch 4, Validation Loss: 4.461097764968872, Validation Accuracy: 9.68%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 5, Training Loss: 4.202836375540875, Training Accuracy: 9.58440413516638%





Validation Epoch 5, Validation Loss: 4.392071986198426, Validation Accuracy: 11.06%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 6, Training Loss: 4.160774525175703, Training Accuracy: 10.129993263304973%





Validation Epoch 6, Validation Loss: 4.377557921409607, Validation Accuracy: 11.42%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:36<00:00,  1.50it/s]


Epoch 7, Training Loss: 4.1215636902667105, Training Accuracy: 10.66976055623477%
Validation Epoch 7, Validation Loss: 4.339803409576416, Validation Accuracy: 12.42%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 8, Training Loss: 4.072665412375268, Training Accuracy: 11.476500578025068%





Validation Epoch 8, Validation Loss: 4.300107789039612, Validation Accuracy: 12.88%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]


Epoch 9, Training Loss: 4.029144032458041, Training Accuracy: 12.328983590741618%
Validation Epoch 9, Validation Loss: 4.261281895637512, Validation Accuracy: 12.96%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.45it/s]

Epoch 10, Training Loss: 3.9801351141422354, Training Accuracy: 13.003484784217836%





Validation Epoch 10, Validation Loss: 4.216655945777893, Validation Accuracy: 13.9%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:38<00:00,  1.48it/s]

Epoch 11, Training Loss: 3.9431749820709228, Training Accuracy: 13.601470429235594%





Validation Epoch 11, Validation Loss: 4.185281991958618, Validation Accuracy: 14.66%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.44it/s]


Epoch 12, Training Loss: 3.901517291779214, Training Accuracy: 14.216921579879738%
Validation Epoch 12, Validation Loss: 4.161313271522522, Validation Accuracy: 15.58%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.45it/s]

Epoch 13, Training Loss: 3.8608448718456514, Training Accuracy: 14.928848856841073%





Validation Epoch 13, Validation Loss: 4.153817296028137, Validation Accuracy: 15.4%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.48it/s]

Epoch 14, Training Loss: 3.8289456986366432, Training Accuracy: 15.480259820188461%





Validation Epoch 14, Validation Loss: 4.111017870903015, Validation Accuracy: 16.7%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 15, Training Loss: 3.796849766183407, Training Accuracy: 16.09238420785615%





Validation Epoch 15, Validation Loss: 4.099099969863891, Validation Accuracy: 16.92%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 16, Training Loss: 3.7660865611218393, Training Accuracy: 16.733617771567822%





Validation Epoch 16, Validation Loss: 4.0783535718917845, Validation Accuracy: 16.62%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 17, Training Loss: 3.733040357143321, Training Accuracy: 17.12451242130126%





Validation Epoch 17, Validation Loss: 4.021410632133484, Validation Accuracy: 17.8%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.48it/s]

Epoch 18, Training Loss: 3.7080542249882473, Training Accuracy: 17.67925014762511%





Validation Epoch 18, Validation Loss: 4.064139485359192, Validation Accuracy: 17.54%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.45it/s]

Epoch 19, Training Loss: 3.677861759510446, Training Accuracy: 18.048520838011594%





Validation Epoch 19, Validation Loss: 4.044907474517823, Validation Accuracy: 17.92%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 20, Training Loss: 3.657749744171792, Training Accuracy: 18.38119713565708%





Validation Epoch 20, Validation Loss: 3.9920890092849732, Validation Accuracy: 18.38%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:38<00:00,  1.49it/s]

Epoch 21, Training Loss: 3.6364698592652664, Training Accuracy: 18.879379891381188%





Validation Epoch 21, Validation Loss: 3.9595518112182617, Validation Accuracy: 19.4%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 22, Training Loss: 3.6134617288061914, Training Accuracy: 19.356770378502457%





Validation Epoch 22, Validation Loss: 3.9796687364578247, Validation Accuracy: 18.56%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 23, Training Loss: 3.5910080422746375, Training Accuracy: 19.78592280246513%





Validation Epoch 23, Validation Loss: 3.9665252208709716, Validation Accuracy: 19.58%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 24, Training Loss: 3.57382122709396, Training Accuracy: 20.220897061636602%





Validation Epoch 24, Validation Loss: 3.947070097923279, Validation Accuracy: 19.54%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]


Epoch 25, Training Loss: 3.5535517651984034, Training Accuracy: 20.443790181059075%
Validation Epoch 25, Validation Loss: 3.9168774127960204, Validation Accuracy: 20.1%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 26, Training Loss: 3.5326283485331436, Training Accuracy: 20.805575654748537%





Validation Epoch 26, Validation Loss: 3.9454559803009035, Validation Accuracy: 20.12%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 27, Training Loss: 3.5147846637888156, Training Accuracy: 21.23223300647887%





Validation Epoch 27, Validation Loss: 3.910852789878845, Validation Accuracy: 20.38%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.45it/s]

Epoch 28, Training Loss: 3.50466049174045, Training Accuracy: 21.33369927726074%





Validation Epoch 28, Validation Loss: 3.945970344543457, Validation Accuracy: 20.64%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 29, Training Loss: 3.4882155469123353, Training Accuracy: 21.732910834435323%





Validation Epoch 29, Validation Loss: 3.922678828239441, Validation Accuracy: 20.74%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.45it/s]

Epoch 30, Training Loss: 3.466432098632163, Training Accuracy: 22.212796393788935%





Validation Epoch 30, Validation Loss: 3.9265923500061035, Validation Accuracy: 21.3%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 31, Training Loss: 3.445940530046504, Training Accuracy: 22.428204296514384%





Validation Epoch 31, Validation Loss: 3.8594619035720825, Validation Accuracy: 21.88%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 32, Training Loss: 3.4302818176594188, Training Accuracy: 22.72345451067475%





Validation Epoch 32, Validation Loss: 3.8651091337203978, Validation Accuracy: 22.08%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 33, Training Loss: 3.423145263753039, Training Accuracy: 22.857356720477057%





Validation Epoch 33, Validation Loss: 3.885558271408081, Validation Accuracy: 21.94%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 34, Training Loss: 3.405993088255537, Training Accuracy: 23.22829079235177%





Validation Epoch 34, Validation Loss: 3.8596364974975588, Validation Accuracy: 21.66%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 35, Training Loss: 3.3929062001248624, Training Accuracy: 23.64912630887331%





Validation Epoch 35, Validation Loss: 3.8857561588287353, Validation Accuracy: 22.08%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:36<00:00,  1.50it/s]

Epoch 36, Training Loss: 3.3874421708127285, Training Accuracy: 23.620848823573443%





Validation Epoch 36, Validation Loss: 3.8503626108169557, Validation Accuracy: 22.64%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 37, Training Loss: 3.3721049876923255, Training Accuracy: 24.063308299441935%





Validation Epoch 37, Validation Loss: 3.8592451572418214, Validation Accuracy: 22.62%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 38, Training Loss: 3.357964011456104, Training Accuracy: 24.085763949533007%





Validation Epoch 38, Validation Loss: 3.8412213563919066, Validation Accuracy: 23.44%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 39, Training Loss: 3.3536899657959633, Training Accuracy: 24.01756530851568%





Validation Epoch 39, Validation Loss: 3.8408005475997924, Validation Accuracy: 23.64%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.48it/s]

Epoch 40, Training Loss: 3.33911593011085, Training Accuracy: 24.367707111787553%





Validation Epoch 40, Validation Loss: 3.82043035030365, Validation Accuracy: 24.4%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 41, Training Loss: 3.3243869862657913, Training Accuracy: 24.73281934845347%





Validation Epoch 41, Validation Loss: 3.8349231719970702, Validation Accuracy: 23.42%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.45it/s]

Epoch 42, Training Loss: 3.311715728678602, Training Accuracy: 24.864226486023437%





Validation Epoch 42, Validation Loss: 3.8603008508682253, Validation Accuracy: 23.98%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 43, Training Loss: 3.3011934747087195, Training Accuracy: 25.25512113575688%





Validation Epoch 43, Validation Loss: 3.835621404647827, Validation Accuracy: 23.38%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:38<00:00,  1.49it/s]

Epoch 44, Training Loss: 3.291052321170239, Training Accuracy: 25.42395435681196%





Validation Epoch 44, Validation Loss: 3.8394420623779295, Validation Accuracy: 24.54%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:38<00:00,  1.48it/s]

Epoch 45, Training Loss: 3.2736031278650812, Training Accuracy: 25.821502532498315%





Validation Epoch 45, Validation Loss: 3.8344810009002686, Validation Accuracy: 24.12%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 46, Training Loss: 3.2678001322644823, Training Accuracy: 25.880552575330388%





Validation Epoch 46, Validation Loss: 3.8204936027526855, Validation Accuracy: 24.92%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:35<00:00,  1.51it/s]

Epoch 47, Training Loss: 3.2599057004806844, Training Accuracy: 25.987840681321057%





Validation Epoch 47, Validation Loss: 3.8133328437805174, Validation Accuracy: 25.1%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:38<00:00,  1.48it/s]

Epoch 48, Training Loss: 3.2470435041062373, Training Accuracy: 26.336319103104703%





Validation Epoch 48, Validation Loss: 3.7962538242340087, Validation Accuracy: 25.28%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:36<00:00,  1.50it/s]

Epoch 49, Training Loss: 3.2396257329494396, Training Accuracy: 26.419488177516072%





Validation Epoch 49, Validation Loss: 3.7822265625, Validation Accuracy: 25.24%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:38<00:00,  1.49it/s]

Epoch 50, Training Loss: 3.226563695136537, Training Accuracy: 26.62990593577684%





Validation Epoch 50, Validation Loss: 3.7672506093978884, Validation Accuracy: 25.7%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 51, Training Loss: 3.218527435749135, Training Accuracy: 26.64154960619443%





Validation Epoch 51, Validation Loss: 3.7997266054153442, Validation Accuracy: 25.58%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.45it/s]

Epoch 52, Training Loss: 3.2114702194295033, Training Accuracy: 26.891056829428546%





Validation Epoch 52, Validation Loss: 3.7829070568084715, Validation Accuracy: 25.66%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]


Epoch 53, Training Loss: 3.1966345249338355, Training Accuracy: 27.164683084241954%
Validation Epoch 53, Validation Loss: 3.81802761554718, Validation Accuracy: 25.82%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 54, Training Loss: 3.1889873666966215, Training Accuracy: 27.40337832780259%





Validation Epoch 54, Validation Loss: 3.7982276678085327, Validation Accuracy: 25.52%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.44it/s]

Epoch 55, Training Loss: 3.182051030625688, Training Accuracy: 27.405041709290817%





Validation Epoch 55, Validation Loss: 3.8415165901184083, Validation Accuracy: 26.64%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:37<00:00,  1.49it/s]

Epoch 56, Training Loss: 3.1699997587406887, Training Accuracy: 27.50650798007269%





Validation Epoch 56, Validation Loss: 3.7984822273254393, Validation Accuracy: 25.72%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.48it/s]

Epoch 57, Training Loss: 3.1602756510389614, Training Accuracy: 27.932333641058907%





Validation Epoch 57, Validation Loss: 3.770370292663574, Validation Accuracy: 26.24%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 58, Training Loss: 3.1496492304700485, Training Accuracy: 28.074552758302353%





Validation Epoch 58, Validation Loss: 3.783678913116455, Validation Accuracy: 26.78%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.45it/s]

Epoch 59, Training Loss: 3.148452133828021, Training Accuracy: 28.07205768607001%





Validation Epoch 59, Validation Loss: 3.794862461090088, Validation Accuracy: 26.1%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 60, Training Loss: 3.1414344696288414, Training Accuracy: 28.19514791619884%





Validation Epoch 60, Validation Loss: 3.813981771469116, Validation Accuracy: 26.34%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.44it/s]

Epoch 61, Training Loss: 3.1245496658568688, Training Accuracy: 28.595191164117534%





Validation Epoch 61, Validation Loss: 3.7986966133117677, Validation Accuracy: 26.86%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 62, Training Loss: 3.1268587447227314, Training Accuracy: 28.481249532173955%





Validation Epoch 62, Validation Loss: 3.785196876525879, Validation Accuracy: 26.68%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.45it/s]

Epoch 63, Training Loss: 3.114751281129553, Training Accuracy: 28.71744970350225%





Validation Epoch 63, Validation Loss: 3.7820513248443604, Validation Accuracy: 27.16%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.45it/s]

Epoch 64, Training Loss: 3.112166011079829, Training Accuracy: 28.862163892978035%





Validation Epoch 64, Validation Loss: 3.8061055183410644, Validation Accuracy: 27.44%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 65, Training Loss: 3.1082913672670407, Training Accuracy: 28.86299558372215%





Validation Epoch 65, Validation Loss: 3.757023048400879, Validation Accuracy: 27.44%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 66, Training Loss: 3.098967506530437, Training Accuracy: 29.26969235759375%





Validation Epoch 66, Validation Loss: 3.777893137931824, Validation Accuracy: 26.94%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.44it/s]

Epoch 67, Training Loss: 3.0909967645685725, Training Accuracy: 29.33373254489051%





Validation Epoch 67, Validation Loss: 3.8190385341644286, Validation Accuracy: 27.46%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 68, Training Loss: 3.0747234872046936, Training Accuracy: 29.59488343854221%





Validation Epoch 68, Validation Loss: 3.8321122884750367, Validation Accuracy: 27.96%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 69, Training Loss: 3.074662809169039, Training Accuracy: 29.423555145254788%





Validation Epoch 69, Validation Loss: 3.7864553928375244, Validation Accuracy: 27.98%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.45it/s]

Epoch 70, Training Loss: 3.0639179422500287, Training Accuracy: 29.76704342257375%





Validation Epoch 70, Validation Loss: 3.7976033210754396, Validation Accuracy: 27.8%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.48it/s]

Epoch 71, Training Loss: 3.05996285296501, Training Accuracy: 29.945025241814083%





Validation Epoch 71, Validation Loss: 3.7515050172805786, Validation Accuracy: 27.96%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 72, Training Loss: 3.049744597901689, Training Accuracy: 29.988273160507998%





Validation Epoch 72, Validation Loss: 3.7824854612350465, Validation Accuracy: 27.72%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 73, Training Loss: 3.0415459196618264, Training Accuracy: 30.200354300256993%





Validation Epoch 73, Validation Loss: 3.7815956354141234, Validation Accuracy: 27.46%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.44it/s]

Epoch 74, Training Loss: 3.0398469204598286, Training Accuracy: 30.120511988822077%





Validation Epoch 74, Validation Loss: 3.830008625984192, Validation Accuracy: 27.78%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 75, Training Loss: 3.029566463511041, Training Accuracy: 30.510574947811406%





Validation Epoch 75, Validation Loss: 3.7967760801315307, Validation Accuracy: 28.28%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:38<00:00,  1.48it/s]


Epoch 76, Training Loss: 3.0273325473704236, Training Accuracy: 30.459010121676357%
Validation Epoch 76, Validation Loss: 3.757798457145691, Validation Accuracy: 28.42%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 77, Training Loss: 3.016310969819414, Training Accuracy: 30.646972229846053%





Validation Epoch 77, Validation Loss: 3.779920530319214, Validation Accuracy: 28.42%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 78, Training Loss: 3.013020760962304, Training Accuracy: 30.651130683566624%





Validation Epoch 78, Validation Loss: 3.718078112602234, Validation Accuracy: 28.46%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 79, Training Loss: 2.999288027337257, Training Accuracy: 30.948044279215218%





Validation Epoch 79, Validation Loss: 3.7633776903152465, Validation Accuracy: 28.94%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 80, Training Loss: 2.9961040192462027, Training Accuracy: 31.12103595399087%





Validation Epoch 80, Validation Loss: 3.776159644126892, Validation Accuracy: 29.22%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 81, Training Loss: 2.989204579211296, Training Accuracy: 31.26741352495488%





Validation Epoch 81, Validation Loss: 3.794772148132324, Validation Accuracy: 28.9%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 82, Training Loss: 2.9829132282987554, Training Accuracy: 31.169274017149462%





Validation Epoch 82, Validation Loss: 3.780480074882507, Validation Accuracy: 29.34%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 83, Training Loss: 2.977744902955725, Training Accuracy: 31.531059490838928%





Validation Epoch 83, Validation Loss: 3.7758165121078493, Validation Accuracy: 29.58%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.45it/s]

Epoch 84, Training Loss: 2.9674474006003524, Training Accuracy: 31.721516671240966%





Validation Epoch 84, Validation Loss: 3.7878827333450316, Validation Accuracy: 29.62%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 85, Training Loss: 2.966204672671379, Training Accuracy: 31.566822192835815%





Validation Epoch 85, Validation Loss: 3.7651508331298826, Validation Accuracy: 29.6%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.45it/s]

Epoch 86, Training Loss: 2.9613390212363386, Training Accuracy: 31.70405116561458%





Validation Epoch 86, Validation Loss: 3.772690033912659, Validation Accuracy: 29.62%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.45it/s]

Epoch 87, Training Loss: 2.9525954155211753, Training Accuracy: 32.04088591698063%





Validation Epoch 87, Validation Loss: 3.778560662269592, Validation Accuracy: 29.8%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 88, Training Loss: 2.947416429316744, Training Accuracy: 32.035064081771836%





Validation Epoch 88, Validation Loss: 3.763174843788147, Validation Accuracy: 29.52%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 89, Training Loss: 2.939254526381797, Training Accuracy: 32.28290792351772%





Validation Epoch 89, Validation Loss: 3.8034311056137087, Validation Accuracy: 29.14%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:42<00:00,  1.45it/s]

Epoch 90, Training Loss: 2.9350634006743737, Training Accuracy: 32.160649384133%





Validation Epoch 90, Validation Loss: 3.6966511011123657, Validation Accuracy: 30.06%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:38<00:00,  1.49it/s]

Epoch 91, Training Loss: 2.9311091047652225, Training Accuracy: 32.28124454202949%





Validation Epoch 91, Validation Loss: 3.7703217267990112, Validation Accuracy: 29.8%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 92, Training Loss: 2.9260635548449576, Training Accuracy: 32.29621497542354%





Validation Epoch 92, Validation Loss: 3.8139644861221313, Validation Accuracy: 29.34%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 93, Training Loss: 2.918855632619655, Training Accuracy: 32.61225745818675%





Validation Epoch 93, Validation Loss: 3.77026424407959, Validation Accuracy: 29.48%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.47it/s]

Epoch 95, Training Loss: 2.91364045650401, Training Accuracy: 32.6762976454835%





Validation Epoch 95, Validation Loss: 3.78410267829895, Validation Accuracy: 29.72%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:41<00:00,  1.46it/s]

Epoch 96, Training Loss: 2.9029801926714307, Training Accuracy: 32.7553082661743%





Validation Epoch 96, Validation Loss: 3.758249831199646, Validation Accuracy: 29.8%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.47it/s]

Epoch 97, Training Loss: 2.9003801193643124, Training Accuracy: 32.93162670392641%





Validation Epoch 97, Validation Loss: 3.7537444591522218, Validation Accuracy: 30.06%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:39<00:00,  1.48it/s]

Epoch 98, Training Loss: 2.8905743142391773, Training Accuracy: 33.158678277069455%





Validation Epoch 98, Validation Loss: 3.782669949531555, Validation Accuracy: 29.98%


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 235/235 [02:40<00:00,  1.46it/s]

Epoch 99, Training Loss: 2.8947095079624905, Training Accuracy: 33.085489491587445%





Validation Epoch 99, Validation Loss: 3.7545466661453246, Validation Accuracy: 29.48%
