In [None]:
import os
import sqlite3
import time
import torch
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import logging
import warnings

from sklearn.model_selection import StratifiedKFold
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_curve, auc

from transformers import (
    AutoTokenizer,
    AutoModelForSequenceClassification
)
from transformers.data.data_collator import DataCollatorWithPadding
from transformers.trainer_callback import EarlyStoppingCallback
from transformers.training_args import TrainingArguments
from transformers.trainer import Trainer

from datasets import Dataset
from tqdm.auto import tqdm

# === Silence warnings/logging ===
warnings.filterwarnings("ignore", message=".*pin_memory.*")
logging.getLogger("transformers").setLevel(logging.ERROR)

# === Model list ===
MODELS = [
    "distilroberta-base",
    "distilbert-base-uncased",
    "nreimers/MiniLM-L6-H384-uncased",
    "google/electra-small-discriminator",
    "huawei-noah/TinyBERT_General_4L_312D"
]

# === Dataset info ===
DATASETS = {
    "news": "data/news.db",
    "reddit": "data/reddit_discussions.db",
    "twitter": "data/twitter.db"
}

# === Metric computation ===
def compute_metrics(eval_pred):
    logits, labels = eval_pred
    preds = np.argmax(logits, axis=1)
    return {
        "accuracy": accuracy_score(labels, preds),
        "f1": f1_score(labels, preds, zero_division=0),
        "precision": precision_score(labels, preds, zero_division=0),
        "recall": recall_score(labels, preds)
    }

# === Benchmark loop over datasets ===
all_results = []

for source_name, db_path in tqdm(DATASETS.items(), desc="🔬 Benchmarking Datasets"):
    print(f"\n📂 Benchmarking on dataset: {source_name}")
    con = sqlite3.connect(db_path)
    df = pd.read_sql("SELECT summary AS text, label FROM labeled_data", con)
    con.close()
    df.dropna(subset=["text", "label"], inplace=True)
    df["label"] = df["label"].astype(int)

    skf = StratifiedKFold(n_splits=5, shuffle=True, random_state=42)

    for model_name in tqdm(MODELS, desc=f"🔬 Benchmarking Models on {source_name}"):
        print(f"\n🔍 Model: {model_name}")
        fold_scores, all_probs, all_labels = [], [], []

        for fold, (train_idx, val_idx) in enumerate(skf.split(df["text"], df["label"])):
            print(f" ↪ Fold {fold+1}/5")
            train_df, val_df = df.iloc[train_idx], df.iloc[val_idx]

            tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=True)
            safe_model_name = model_name.replace("/", "_").replace("-", "_")
            model_dir = f"./results/{source_name}_{safe_model_name}_fold{fold+1}"

            if os.path.exists(model_dir):
                model = AutoModelForSequenceClassification.from_pretrained(model_dir)
            else:
                model = AutoModelForSequenceClassification.from_pretrained(model_name, num_labels=2)

            train_ds = Dataset.from_pandas(train_df).map(lambda x: tokenizer(x["text"], truncation=True, max_length=512), batched=True)
            val_ds = Dataset.from_pandas(val_df).map(lambda x: tokenizer(x["text"], truncation=True, max_length=512), batched=True)

            train_ds = train_ds.rename_column("label", "labels")
            val_ds = val_ds.rename_column("label", "labels")
            train_ds.set_format(type='torch', columns=['input_ids', 'attention_mask', 'labels'])
            val_ds.set_format(type='torch', columns=['input_ids', 'attention_mask', 'labels'])

            args = TrainingArguments(
                output_dir=model_dir,
                per_device_train_batch_size=8,
                per_device_eval_batch_size=16,
                num_train_epochs=5,
                eval_strategy="epoch",
                save_strategy="epoch",
                save_total_limit=1,
                load_best_model_at_end=True,
                logging_steps=50,
                report_to="none",
                disable_tqdm=True,
                fp16=False,
                learning_rate=2e-5,
                no_cuda=True,
            )

            checkpoint_path = os.path.join(model_dir, "pytorch_model.bin")
            if os.path.exists(checkpoint_path):
                model = AutoModelForSequenceClassification.from_pretrained(model_dir)
                model.to("cpu")
                train_time = 0.0
            else:
                trainer = Trainer(
                    model=model,
                    args=args,
                    train_dataset=train_ds,
                    eval_dataset=val_ds,
                    compute_metrics=compute_metrics,
                    data_collator=DataCollatorWithPadding(tokenizer),
                    callbacks=[EarlyStoppingCallback(early_stopping_patience=1)]
                )
                start = time.time()
                trainer.train()
                trainer.save_model(model_dir)
                train_time = round(time.time() - start, 2)

            trainer = Trainer(
                model=model,
                args=args,
                train_dataset=train_ds,
                eval_dataset=val_ds,
                compute_metrics=compute_metrics,
                data_collator=DataCollatorWithPadding(tokenizer),
                callbacks=[EarlyStoppingCallback(early_stopping_patience=1)]
            )

            metrics = trainer.evaluate()
            metrics["training_time"] = train_time

            preds = trainer.predict(val_ds)
            probs = torch.nn.functional.softmax(torch.tensor(preds.predictions), dim=1).numpy()
            true_labels = preds.label_ids

            all_probs.append(probs[:, 1])
            all_labels.append(true_labels)

            fpr, tpr, _ = roc_curve(true_labels, probs[:, 1])
            roc_auc = auc(fpr, tpr)
            metrics["auc"] = roc_auc

            os.makedirs("roc_curves", exist_ok=True)
            plt.figure()
            plt.plot(fpr, tpr, color='darkorange', lw=2, label=f"AUC={roc_auc:.2f}")
            plt.plot([0, 1], [0, 1], linestyle='--', color='navy')
            plt.xlabel("False Positive Rate")
            plt.ylabel("True Positive Rate")
            plt.title(f"{model_name} Fold {fold+1} ROC ({source_name})")
            plt.legend(loc="lower right")
            plt.savefig(f"roc_curves/{source_name}_{safe_model_name}_fold{fold+1}.png")
            plt.close()

            fold_scores.append({k.replace("eval_", ""): v for k, v in metrics.items()})

        # Overall ROC curve
        if fold_scores:
            all_probs_flat = np.concatenate(all_probs)
            all_labels_flat = np.concatenate(all_labels)
            fpr, tpr, _ = roc_curve(all_labels_flat, all_probs_flat)
            overall_auc = auc(fpr, tpr)

            plt.figure()
            plt.plot(fpr, tpr, color='green', lw=2, label=f"AUC={overall_auc:.2f}")
            plt.plot([0, 1], [0, 1], linestyle='--', color='gray')
            plt.xlabel("False Positive Rate")
            plt.ylabel("True Positive Rate")
            plt.title(f"{model_name} Overall ROC ({source_name})")
            plt.legend(loc="lower right")
            os.makedirs("roc_overall", exist_ok=True)
            plt.savefig(f"roc_overall/{source_name}_{safe_model_name}_overall.png")
            plt.close()

            avg = pd.DataFrame(fold_scores).mean().to_dict()
            avg.update({"model": model_name, "auc": overall_auc, "source": source_name})
            all_results.append(avg)

# === Save Final Results ===
results_df = pd.DataFrame(all_results)
required_cols = ["source", "model", "accuracy", "f1", "precision", "recall", "auc", "training_time"]
results_df = results_df[[col for col in required_cols if col in results_df.columns]]
results_df.to_csv("multimodal_results.csv", index=False)
print("\n✅ Multimodal Benchmarking complete. Results saved to multimodal_results.csv")


🔬 Benchmarking Datasets:   0%|          | 0/3 [00:00<?, ?it/s]


📂 Benchmarking on dataset: news


🔬 Benchmarking Models on news:   0%|          | 0/5 [00:00<?, ?it/s]


🔍 Model: distilroberta-base
 ↪ Fold 1/5




Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.5104106664657593, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.046, 'eval_samples_per_second': 86.934, 'eval_steps_per_second': 21.733, 'epoch': 1.0}
{'eval_loss': 0.43783479928970337, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0478, 'eval_samples_per_second': 83.724, 'eval_steps_per_second': 20.931, 'epoch': 2.0}
{'eval_loss': 0.3775639832019806, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0475, 'eval_samples_per_second': 84.212, 'eval_steps_per_second': 21.053, 'epoch': 3.0}
{'eval_loss': 0.33523350954055786, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0509, 'eval_samples_per_second': 78.576, 'eval_steps_per_second': 19.644, 'epoch': 4.0}
{'eval_loss': 0.31555527448654175, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0,



 ↪ Fold 2/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.5129880309104919, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0436, 'eval_samples_per_second': 91.802, 'eval_steps_per_second': 22.951, 'epoch': 1.0}
{'eval_loss': 0.441173791885376, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0514, 'eval_samples_per_second': 77.884, 'eval_steps_per_second': 19.471, 'epoch': 2.0}
{'eval_loss': 0.38261696696281433, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0431, 'eval_samples_per_second': 92.734, 'eval_steps_per_second': 23.184, 'epoch': 3.0}
{'eval_loss': 0.3402680456638336, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.045, 'eval_samples_per_second': 88.932, 'eval_steps_per_second': 22.233, 'epoch': 4.0}
{'eval_loss': 0.3208633065223694, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'e



 ↪ Fold 3/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.5095083117485046, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0535, 'eval_samples_per_second': 74.745, 'eval_steps_per_second': 18.686, 'epoch': 1.0}
{'eval_loss': 0.4344220459461212, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0508, 'eval_samples_per_second': 78.704, 'eval_steps_per_second': 19.676, 'epoch': 2.0}
{'eval_loss': 0.37284398078918457, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0504, 'eval_samples_per_second': 79.363, 'eval_steps_per_second': 19.841, 'epoch': 3.0}
{'eval_loss': 0.3286250829696655, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0471, 'eval_samples_per_second': 84.915, 'eval_steps_per_second': 21.229, 'epoch': 4.0}
{'eval_loss': 0.3083650767803192, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 



 ↪ Fold 4/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.5157418251037598, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0515, 'eval_samples_per_second': 77.667, 'eval_steps_per_second': 19.417, 'epoch': 1.0}
{'eval_loss': 0.44534122943878174, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0551, 'eval_samples_per_second': 72.633, 'eval_steps_per_second': 18.158, 'epoch': 2.0}
{'eval_loss': 0.38738515973091125, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0544, 'eval_samples_per_second': 73.505, 'eval_steps_per_second': 18.376, 'epoch': 3.0}
{'eval_loss': 0.3457464873790741, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0542, 'eval_samples_per_second': 73.779, 'eval_steps_per_second': 18.445, 'epoch': 4.0}
{'eval_loss': 0.3266436755657196, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0,



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6097471117973328, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0384, 'eval_samples_per_second': 104.226, 'eval_steps_per_second': 26.057, 'epoch': 1.0}
{'eval_loss': 0.5834760069847107, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.044, 'eval_samples_per_second': 90.998, 'eval_steps_per_second': 22.749, 'epoch': 2.0}
{'eval_loss': 0.5668638944625854, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0372, 'eval_samples_per_second': 107.409, 'eval_steps_per_second': 26.852, 'epoch': 3.0}
{'eval_loss': 0.5592674612998962, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.041, 'eval_samples_per_second': 97.484, 'eval_steps_per_second': 24.371, 'epoch': 4.0}
{'eval_loss': 0.5573137998580933, 'eval_accuracy



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.5682563781738281, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0514, 'eval_samples_per_second': 77.842, 'eval_steps_per_second': 19.461, 'epoch': 1.0}
{'eval_loss': 0.45573580265045166, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.047, 'eval_samples_per_second': 85.079, 'eval_steps_per_second': 21.27, 'epoch': 2.0}
{'eval_loss': 0.37585723400115967, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0505, 'eval_samples_per_second': 79.149, 'eval_steps_per_second': 19.787, 'epoch': 3.0}
{'eval_loss': 0.3291619122028351, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0459, 'eval_samples_per_second': 87.064, 'eval_steps_per_second': 21.766, 'epoch': 4.0}
{'eval_loss': 0.3104778528213501, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, '



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.5733491778373718, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0422, 'eval_samples_per_second': 94.72, 'eval_steps_per_second': 23.68, 'epoch': 1.0}
{'eval_loss': 0.46325135231018066, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0454, 'eval_samples_per_second': 88.109, 'eval_steps_per_second': 22.027, 'epoch': 2.0}
{'eval_loss': 0.38677626848220825, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0466, 'eval_samples_per_second': 85.798, 'eval_steps_per_second': 21.45, 'epoch': 3.0}
{'eval_loss': 0.3402654528617859, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0486, 'eval_samples_per_second': 82.296, 'eval_steps_per_second': 20.574, 'epoch': 4.0}
{'eval_loss': 0.32178327441215515, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, '



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.5862260460853577, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0483, 'eval_samples_per_second': 82.733, 'eval_steps_per_second': 20.683, 'epoch': 1.0}
{'eval_loss': 0.4746074080467224, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.046, 'eval_samples_per_second': 87.045, 'eval_steps_per_second': 21.761, 'epoch': 2.0}
{'eval_loss': 0.3934471607208252, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0445, 'eval_samples_per_second': 89.973, 'eval_steps_per_second': 22.493, 'epoch': 3.0}
{'eval_loss': 0.3443710207939148, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0459, 'eval_samples_per_second': 87.06, 'eval_steps_per_second': 21.765, 'epoch': 4.0}
{'eval_loss': 0.32438212633132935, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'e



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.5984178781509399, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0445, 'eval_samples_per_second': 89.922, 'eval_steps_per_second': 22.48, 'epoch': 1.0}
{'eval_loss': 0.49153566360473633, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0515, 'eval_samples_per_second': 77.709, 'eval_steps_per_second': 19.427, 'epoch': 2.0}
{'eval_loss': 0.4127868413925171, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0522, 'eval_samples_per_second': 76.59, 'eval_steps_per_second': 19.148, 'epoch': 3.0}
{'eval_loss': 0.3632453382015228, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0491, 'eval_samples_per_second': 81.438, 'eval_steps_per_second': 20.36, 'epoch': 4.0}
{'eval_loss': 0.34284111857414246, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'e



 ↪ Fold 5/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6352851390838623, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0451, 'eval_samples_per_second': 88.617, 'eval_steps_per_second': 22.154, 'epoch': 1.0}
{'eval_loss': 0.5835099816322327, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0441, 'eval_samples_per_second': 90.697, 'eval_steps_per_second': 22.674, 'epoch': 2.0}
{'eval_loss': 0.5575036406517029, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0473, 'eval_samples_per_second': 84.601, 'eval_steps_per_second': 21.15, 'epoch': 3.0}
{'eval_loss': 0.5500603318214417, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0375, 'eval_samples_per_second': 106.559, 'eval_steps_per_second': 26.64, 'epoch': 4.0}
{'eval_loss': 0.5499261617660522, 'eval_accuracy'



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6413271427154541, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0253, 'eval_samples_per_second': 158.109, 'eval_steps_per_second': 39.527, 'epoch': 1.0}
{'eval_loss': 0.6247813701629639, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0239, 'eval_samples_per_second': 167.182, 'eval_steps_per_second': 41.796, 'epoch': 2.0}




{'eval_loss': 0.6118291616439819, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0304, 'eval_samples_per_second': 131.385, 'eval_steps_per_second': 32.846, 'epoch': 3.0}
{'eval_loss': 0.6031471490859985, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0294, 'eval_samples_per_second': 136.061, 'eval_steps_per_second': 34.015, 'epoch': 4.0}
{'eval_loss': 0.5992786884307861, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0296, 'eval_samples_per_second': 135.346, 'eval_steps_per_second': 33.836, 'epoch': 5.0}
{'train_runtime': 3.385, 'train_samples_per_second': 23.633, 'train_steps_per_second': 2.954, 'train_loss': 0.6344058990478516, 'epoch': 5.0}
{'eval_loss': 0.5992786884307861, 'eval_model_preparation_time': 0.0004, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.034, 'eval_samples_p



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6415010094642639, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0232, 'eval_samples_per_second': 172.52, 'eval_steps_per_second': 43.13, 'epoch': 1.0}
{'eval_loss': 0.6242043375968933, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0268, 'eval_samples_per_second': 149.076, 'eval_steps_per_second': 37.269, 'epoch': 2.0}




{'eval_loss': 0.6110087037086487, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0237, 'eval_samples_per_second': 168.498, 'eval_steps_per_second': 42.125, 'epoch': 3.0}
{'eval_loss': 0.6021733283996582, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0229, 'eval_samples_per_second': 174.338, 'eval_steps_per_second': 43.584, 'epoch': 4.0}
{'eval_loss': 0.5982338190078735, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0246, 'eval_samples_per_second': 162.886, 'eval_steps_per_second': 40.721, 'epoch': 5.0}
{'train_runtime': 3.0684, 'train_samples_per_second': 26.073, 'train_steps_per_second': 3.259, 'train_loss': 0.633378267288208, 'epoch': 5.0}
{'eval_loss': 0.5982338190078735, 'eval_model_preparation_time': 0.0004, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0244, 'eval_samples_



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.641278862953186, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0349, 'eval_samples_per_second': 114.509, 'eval_steps_per_second': 28.627, 'epoch': 1.0}
{'eval_loss': 0.6238588094711304, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0265, 'eval_samples_per_second': 151.035, 'eval_steps_per_second': 37.759, 'epoch': 2.0}




{'eval_loss': 0.6104609370231628, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0265, 'eval_samples_per_second': 150.71, 'eval_steps_per_second': 37.678, 'epoch': 3.0}
{'eval_loss': 0.6014566421508789, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0283, 'eval_samples_per_second': 141.249, 'eval_steps_per_second': 35.312, 'epoch': 4.0}
{'eval_loss': 0.5974432826042175, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0287, 'eval_samples_per_second': 139.471, 'eval_steps_per_second': 34.868, 'epoch': 5.0}
{'train_runtime': 3.1737, 'train_samples_per_second': 25.207, 'train_steps_per_second': 3.151, 'train_loss': 0.6315218448638916, 'epoch': 5.0}
{'eval_loss': 0.5974432826042175, 'eval_model_preparation_time': 0.0004, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0288, 'eval_samples_



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6411703824996948, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0268, 'eval_samples_per_second': 148.998, 'eval_steps_per_second': 37.25, 'epoch': 1.0}
{'eval_loss': 0.6236487030982971, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0269, 'eval_samples_per_second': 148.96, 'eval_steps_per_second': 37.24, 'epoch': 2.0}




{'eval_loss': 0.6102192401885986, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0266, 'eval_samples_per_second': 150.358, 'eval_steps_per_second': 37.589, 'epoch': 3.0}
{'eval_loss': 0.6012459993362427, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0284, 'eval_samples_per_second': 140.636, 'eval_steps_per_second': 35.159, 'epoch': 4.0}
{'eval_loss': 0.5972380638122559, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0303, 'eval_samples_per_second': 132.017, 'eval_steps_per_second': 33.004, 'epoch': 5.0}
{'train_runtime': 3.1601, 'train_samples_per_second': 25.316, 'train_steps_per_second': 3.164, 'train_loss': 0.6330025672912598, 'epoch': 5.0}
{'eval_loss': 0.5972380638122559, 'eval_model_preparation_time': 0.0004, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0259, 'eval_samples



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6676132678985596, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0236, 'eval_samples_per_second': 169.19, 'eval_steps_per_second': 42.297, 'epoch': 1.0}
{'eval_loss': 0.6593160629272461, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.021, 'eval_samples_per_second': 190.477, 'eval_steps_per_second': 47.619, 'epoch': 2.0}




{'eval_loss': 0.653051495552063, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0222, 'eval_samples_per_second': 179.911, 'eval_steps_per_second': 44.978, 'epoch': 3.0}
{'eval_loss': 0.648930013179779, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.022, 'eval_samples_per_second': 181.818, 'eval_steps_per_second': 45.454, 'epoch': 4.0}
{'eval_loss': 0.647109866142273, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0248, 'eval_samples_per_second': 161.459, 'eval_steps_per_second': 40.365, 'epoch': 5.0}
{'train_runtime': 3.1765, 'train_samples_per_second': 25.185, 'train_steps_per_second': 3.148, 'train_loss': 0.6233575344085693, 'epoch': 5.0}
{'eval_loss': 0.647109866142273, 'eval_model_preparation_time': 0.0004, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6384766101837158, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0351, 'eval_samples_per_second': 113.863, 'eval_steps_per_second': 28.466, 'epoch': 1.0}
{'eval_loss': 0.6120104193687439, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0384, 'eval_samples_per_second': 104.194, 'eval_steps_per_second': 26.049, 'epoch': 2.0}




{'eval_loss': 0.594028651714325, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0392, 'eval_samples_per_second': 102.093, 'eval_steps_per_second': 25.523, 'epoch': 3.0}
{'eval_loss': 0.5834106206893921, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0343, 'eval_samples_per_second': 116.452, 'eval_steps_per_second': 29.113, 'epoch': 4.0}
{'eval_loss': 0.5788293480873108, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0349, 'eval_samples_per_second': 114.518, 'eval_steps_per_second': 28.629, 'epoch': 5.0}
{'train_runtime': 2.6886, 'train_samples_per_second': 29.755, 'train_steps_per_second': 3.719, 'train_loss': 0.6218463897705078, 'epoch': 5.0}
{'eval_loss': 0.5788293480873108, 'eval_model_preparation_time': 0.0008, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0484, 'eval_samples_



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.640403151512146, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0403, 'eval_samples_per_second': 99.239, 'eval_steps_per_second': 24.81, 'epoch': 1.0}
{'eval_loss': 0.6142677664756775, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0392, 'eval_samples_per_second': 102.105, 'eval_steps_per_second': 25.526, 'epoch': 2.0}




{'eval_loss': 0.5961129665374756, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0359, 'eval_samples_per_second': 111.389, 'eval_steps_per_second': 27.847, 'epoch': 3.0}
{'eval_loss': 0.5846660733222961, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0385, 'eval_samples_per_second': 103.78, 'eval_steps_per_second': 25.945, 'epoch': 4.0}
{'eval_loss': 0.5798133015632629, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0348, 'eval_samples_per_second': 115.078, 'eval_steps_per_second': 28.769, 'epoch': 5.0}
{'train_runtime': 2.7658, 'train_samples_per_second': 28.925, 'train_steps_per_second': 3.616, 'train_loss': 0.6211355209350586, 'epoch': 5.0}
{'eval_loss': 0.5798133015632629, 'eval_model_preparation_time': 0.0007, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0384, 'eval_samples_



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6284337043762207, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0461, 'eval_samples_per_second': 86.685, 'eval_steps_per_second': 21.671, 'epoch': 1.0}
{'eval_loss': 0.6026598811149597, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0316, 'eval_samples_per_second': 126.562, 'eval_steps_per_second': 31.641, 'epoch': 2.0}




{'eval_loss': 0.5845935344696045, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0424, 'eval_samples_per_second': 94.435, 'eval_steps_per_second': 23.609, 'epoch': 3.0}
{'eval_loss': 0.5733273029327393, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0396, 'eval_samples_per_second': 101.074, 'eval_steps_per_second': 25.268, 'epoch': 4.0}
{'eval_loss': 0.5686826705932617, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0489, 'eval_samples_per_second': 81.741, 'eval_steps_per_second': 20.435, 'epoch': 5.0}
{'train_runtime': 2.7498, 'train_samples_per_second': 29.093, 'train_steps_per_second': 3.637, 'train_loss': 0.626883602142334, 'epoch': 5.0}
{'eval_loss': 0.5686826705932617, 'eval_model_preparation_time': 0.0007, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0525, 'eval_samples_pe



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6284909248352051, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.032, 'eval_samples_per_second': 125.133, 'eval_steps_per_second': 31.283, 'epoch': 1.0}
{'eval_loss': 0.6009376049041748, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0387, 'eval_samples_per_second': 103.289, 'eval_steps_per_second': 25.822, 'epoch': 2.0}




{'eval_loss': 0.5822533369064331, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0421, 'eval_samples_per_second': 94.942, 'eval_steps_per_second': 23.736, 'epoch': 3.0}
{'eval_loss': 0.5710343718528748, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0454, 'eval_samples_per_second': 88.092, 'eval_steps_per_second': 22.023, 'epoch': 4.0}
{'eval_loss': 0.566364049911499, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0411, 'eval_samples_per_second': 97.25, 'eval_steps_per_second': 24.313, 'epoch': 5.0}
{'train_runtime': 2.798, 'train_samples_per_second': 28.591, 'train_steps_per_second': 3.574, 'train_loss': 0.6242022514343262, 'epoch': 5.0}
{'eval_loss': 0.566364049911499, 'eval_model_preparation_time': 0.0007, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0394, 'eval_samples_per_se



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.667129397392273, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0402, 'eval_samples_per_second': 99.456, 'eval_steps_per_second': 24.864, 'epoch': 1.0}
{'eval_loss': 0.6537655591964722, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0369, 'eval_samples_per_second': 108.412, 'eval_steps_per_second': 27.103, 'epoch': 2.0}




{'eval_loss': 0.645092248916626, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0431, 'eval_samples_per_second': 92.84, 'eval_steps_per_second': 23.21, 'epoch': 3.0}
{'eval_loss': 0.6399703025817871, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0457, 'eval_samples_per_second': 87.609, 'eval_steps_per_second': 21.902, 'epoch': 4.0}
{'eval_loss': 0.6378117799758911, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0456, 'eval_samples_per_second': 87.814, 'eval_steps_per_second': 21.953, 'epoch': 5.0}
{'train_runtime': 2.7941, 'train_samples_per_second': 28.632, 'train_steps_per_second': 3.579, 'train_loss': 0.6060432434082031, 'epoch': 5.0}
{'eval_loss': 0.6378117799758911, 'eval_model_preparation_time': 0.0007, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6735574007034302, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0149, 'eval_samples_per_second': 268.187, 'eval_steps_per_second': 67.047, 'epoch': 1.0}
{'eval_loss': 0.6580131649971008, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0151, 'eval_samples_per_second': 265.202, 'eval_steps_per_second': 66.301, 'epoch': 2.0}




{'eval_loss': 0.6467887163162231, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.015, 'eval_samples_per_second': 266.542, 'eval_steps_per_second': 66.635, 'epoch': 3.0}




{'eval_loss': 0.6394584774971008, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0186, 'eval_samples_per_second': 215.446, 'eval_steps_per_second': 53.862, 'epoch': 4.0}




{'eval_loss': 0.6362018585205078, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0146, 'eval_samples_per_second': 273.053, 'eval_steps_per_second': 68.263, 'epoch': 5.0}
{'train_runtime': 1.9293, 'train_samples_per_second': 41.466, 'train_steps_per_second': 5.183, 'train_loss': 0.6637040615081787, 'epoch': 5.0}
{'eval_loss': 0.6362018585205078, 'eval_model_preparation_time': 0.0003, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0166, 'eval_samples_per_second': 241.691, 'eval_steps_per_second': 60.423}




 ↪ Fold 2/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6743131875991821, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0172, 'eval_samples_per_second': 232.352, 'eval_steps_per_second': 58.088, 'epoch': 1.0}
{'eval_loss': 0.6597821116447449, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.017, 'eval_samples_per_second': 235.173, 'eval_steps_per_second': 58.793, 'epoch': 2.0}




{'eval_loss': 0.6489158868789673, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0172, 'eval_samples_per_second': 232.313, 'eval_steps_per_second': 58.078, 'epoch': 3.0}




{'eval_loss': 0.641653299331665, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0175, 'eval_samples_per_second': 228.862, 'eval_steps_per_second': 57.216, 'epoch': 4.0}




{'eval_loss': 0.6384150385856628, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0192, 'eval_samples_per_second': 208.418, 'eval_steps_per_second': 52.104, 'epoch': 5.0}
{'train_runtime': 1.96, 'train_samples_per_second': 40.816, 'train_steps_per_second': 5.102, 'train_loss': 0.6647652149200439, 'epoch': 5.0}




{'eval_loss': 0.6384150385856628, 'eval_model_preparation_time': 0.0003, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0184, 'eval_samples_per_second': 217.06, 'eval_steps_per_second': 54.265}
 ↪ Fold 3/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6731956601142883, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0152, 'eval_samples_per_second': 263.905, 'eval_steps_per_second': 65.976, 'epoch': 1.0}
{'eval_loss': 0.6573101282119751, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0173, 'eval_samples_per_second': 231.883, 'eval_steps_per_second': 57.971, 'epoch': 2.0}




{'eval_loss': 0.6458633542060852, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0196, 'eval_samples_per_second': 203.976, 'eval_steps_per_second': 50.994, 'epoch': 3.0}




{'eval_loss': 0.6384623646736145, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.018, 'eval_samples_per_second': 221.704, 'eval_steps_per_second': 55.426, 'epoch': 4.0}




{'eval_loss': 0.6352106928825378, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0177, 'eval_samples_per_second': 226.209, 'eval_steps_per_second': 56.552, 'epoch': 5.0}
{'train_runtime': 1.9162, 'train_samples_per_second': 41.75, 'train_steps_per_second': 5.219, 'train_loss': 0.6638826847076416, 'epoch': 5.0}
{'eval_loss': 0.6352106928825378, 'eval_model_preparation_time': 0.0003, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.017, 'eval_samples_per_second': 235.864, 'eval_steps_per_second': 58.966}




 ↪ Fold 4/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6732776165008545, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0151, 'eval_samples_per_second': 265.185, 'eval_steps_per_second': 66.296, 'epoch': 1.0}
{'eval_loss': 0.6580018997192383, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0169, 'eval_samples_per_second': 236.156, 'eval_steps_per_second': 59.039, 'epoch': 2.0}




{'eval_loss': 0.6465921401977539, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0174, 'eval_samples_per_second': 230.266, 'eval_steps_per_second': 57.567, 'epoch': 3.0}




{'eval_loss': 0.6390236616134644, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.016, 'eval_samples_per_second': 249.527, 'eval_steps_per_second': 62.382, 'epoch': 4.0}




{'eval_loss': 0.6356635093688965, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0174, 'eval_samples_per_second': 229.501, 'eval_steps_per_second': 57.375, 'epoch': 5.0}
{'train_runtime': 1.9021, 'train_samples_per_second': 42.058, 'train_steps_per_second': 5.257, 'train_loss': 0.6641981601715088, 'epoch': 5.0}
{'eval_loss': 0.6356635093688965, 'eval_model_preparation_time': 0.0003, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0163, 'eval_samples_per_second': 244.734, 'eval_steps_per_second': 61.183}




 ↪ Fold 5/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6843529939651489, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0156, 'eval_samples_per_second': 256.674, 'eval_steps_per_second': 64.168, 'epoch': 1.0}
{'eval_loss': 0.6767174005508423, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.016, 'eval_samples_per_second': 249.639, 'eval_steps_per_second': 62.41, 'epoch': 2.0}




{'eval_loss': 0.6711568236351013, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0176, 'eval_samples_per_second': 227.494, 'eval_steps_per_second': 56.873, 'epoch': 3.0}




{'eval_loss': 0.6675578355789185, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.018, 'eval_samples_per_second': 221.631, 'eval_steps_per_second': 55.408, 'epoch': 4.0}




{'eval_loss': 0.6659827828407288, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0162, 'eval_samples_per_second': 246.822, 'eval_steps_per_second': 61.705, 'epoch': 5.0}
{'train_runtime': 1.9326, 'train_samples_per_second': 41.394, 'train_steps_per_second': 5.174, 'train_loss': 0.6598307609558105, 'epoch': 5.0}
{'eval_loss': 0.6659827828407288, 'eval_model_preparation_time': 0.0003, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0176, 'eval_samples_per_second': 227.623, 'eval_steps_per_second': 56.906}

📂 Benchmarking on dataset: reddit




🔬 Benchmarking Models on reddit:   0%|          | 0/5 [00:00<?, ?it/s]




🔍 Model: distilroberta-base
 ↪ Fold 1/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.539257287979126, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0983, 'eval_samples_per_second': 40.691, 'eval_steps_per_second': 10.173, 'epoch': 1.0}
{'eval_loss': 0.48676425218582153, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.1011, 'eval_samples_per_second': 39.566, 'eval_steps_per_second': 9.892, 'epoch': 2.0}
{'eval_loss': 0.4603368043899536, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.092, 'eval_samples_per_second': 43.468, 'eval_steps_per_second': 10.867, 'epoch': 3.0}
{'eval_loss': 0.43837225437164307, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0935, 'eval_samples_per_second': 42.758, 'eval_steps_per_second': 10.69, 'epoch': 4.0}
{'eval_loss': 0.4295467734336853, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'ev



 ↪ Fold 2/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6118143796920776, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1505, 'eval_samples_per_second': 26.576, 'eval_steps_per_second': 6.644, 'epoch': 1.0}
{'eval_loss': 0.5893929600715637, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1658, 'eval_samples_per_second': 24.132, 'eval_steps_per_second': 6.033, 'epoch': 2.0}
{'eval_loss': 0.5749375224113464, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1464, 'eval_samples_per_second': 27.318, 'eval_steps_per_second': 6.829, 'epoch': 3.0}
{'eval_loss': 0.5672343969345093, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1506, 'eval_samples_per_second': 26.564, 'eval_steps_per_second': 6.641, 'epoch': 4.0}
{'eval_loss': 0.5640168190002441, 'eval_accuracy': 0

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6178035736083984, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1257, 'eval_samples_per_second': 31.834, 'eval_steps_per_second': 7.958, 'epoch': 1.0}
{'eval_loss': 0.5912039875984192, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1497, 'eval_samples_per_second': 26.721, 'eval_steps_per_second': 6.68, 'epoch': 2.0}
{'eval_loss': 0.5684667229652405, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1447, 'eval_samples_per_second': 27.639, 'eval_steps_per_second': 6.91, 'epoch': 3.0}
{'eval_loss': 0.551744818687439, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1318, 'eval_samples_per_second': 30.359, 'eval_steps_per_second': 7.59, 'epoch': 4.0}
{'eval_loss': 0.5435188412666321, 'eval_accuracy': 0.75,

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6207406520843506, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1706, 'eval_samples_per_second': 23.443, 'eval_steps_per_second': 5.861, 'epoch': 1.0}
{'eval_loss': 0.5973737239837646, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1602, 'eval_samples_per_second': 24.962, 'eval_steps_per_second': 6.241, 'epoch': 2.0}
{'eval_loss': 0.5809913873672485, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1645, 'eval_samples_per_second': 24.321, 'eval_steps_per_second': 6.08, 'epoch': 3.0}
{'eval_loss': 0.5706949234008789, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1598, 'eval_samples_per_second': 25.027, 'eval_steps_per_second': 6.257, 'epoch': 4.0}
{'eval_loss': 0.5661813616752625, 'eval_accuracy': 0.

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.614187479019165, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.181, 'eval_samples_per_second': 22.097, 'eval_steps_per_second': 5.524, 'epoch': 1.0}
{'eval_loss': 0.5890219807624817, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1671, 'eval_samples_per_second': 23.939, 'eval_steps_per_second': 5.985, 'epoch': 2.0}
{'eval_loss': 0.572587788105011, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1808, 'eval_samples_per_second': 22.122, 'eval_steps_per_second': 5.531, 'epoch': 3.0}
{'eval_loss': 0.5632528066635132, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1674, 'eval_samples_per_second': 23.888, 'eval_steps_per_second': 5.972, 'epoch': 4.0}
{'eval_loss': 0.5597004890441895, 'eval_accuracy': 0.75



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6235290765762329, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.1102, 'eval_samples_per_second': 36.301, 'eval_steps_per_second': 9.075, 'epoch': 1.0}
{'eval_loss': 0.5353173613548279, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0983, 'eval_samples_per_second': 40.692, 'eval_steps_per_second': 10.173, 'epoch': 2.0}
{'eval_loss': 0.4860836863517761, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.1069, 'eval_samples_per_second': 37.425, 'eval_steps_per_second': 9.356, 'epoch': 3.0}
{'eval_loss': 0.44753125309944153, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.1104, 'eval_samples_per_second': 36.216, 'eval_steps_per_second': 9.054, 'epoch': 4.0}
{'eval_loss': 0.43188953399658203, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'e



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6594066619873047, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1606, 'eval_samples_per_second': 24.905, 'eval_steps_per_second': 6.226, 'epoch': 1.0}
{'eval_loss': 0.6290724277496338, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1648, 'eval_samples_per_second': 24.274, 'eval_steps_per_second': 6.068, 'epoch': 2.0}
{'eval_loss': 0.6164340376853943, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1513, 'eval_samples_per_second': 26.43, 'eval_steps_per_second': 6.608, 'epoch': 3.0}
{'eval_loss': 0.6124850511550903, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.2016, 'eval_samples_per_second': 19.84, 'eval_steps_per_second': 4.96, 'epoch': 4.0}
{'eval_loss': 0.6115872859954834, 'eval_accuracy': 0.75

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6155502200126648, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1372, 'eval_samples_per_second': 29.148, 'eval_steps_per_second': 7.287, 'epoch': 1.0}
{'eval_loss': 0.5507047176361084, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1473, 'eval_samples_per_second': 27.153, 'eval_steps_per_second': 6.788, 'epoch': 2.0}
{'eval_loss': 0.5077622532844543, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1229, 'eval_samples_per_second': 32.557, 'eval_steps_per_second': 8.139, 'epoch': 3.0}
{'eval_loss': 0.47948044538497925, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1315, 'eval_samples_per_second': 30.426, 'eval_steps_per_second': 7.607, 'epoch': 4.0}
{'eval_loss': 0.46697181463241577, 'eval_accuracy':

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6345193386077881, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1509, 'eval_samples_per_second': 26.513, 'eval_steps_per_second': 6.628, 'epoch': 1.0}
{'eval_loss': 0.5912578105926514, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1616, 'eval_samples_per_second': 24.748, 'eval_steps_per_second': 6.187, 'epoch': 2.0}
{'eval_loss': 0.5692252516746521, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1632, 'eval_samples_per_second': 24.504, 'eval_steps_per_second': 6.126, 'epoch': 3.0}
{'eval_loss': 0.5593551993370056, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1731, 'eval_samples_per_second': 23.108, 'eval_steps_per_second': 5.777, 'epoch': 4.0}
{'eval_loss': 0.5564700365066528, 'eval_accuracy': 0

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6341328620910645, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.2009, 'eval_samples_per_second': 19.908, 'eval_steps_per_second': 4.977, 'epoch': 1.0}
{'eval_loss': 0.5932652354240417, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1881, 'eval_samples_per_second': 21.263, 'eval_steps_per_second': 5.316, 'epoch': 2.0}
{'eval_loss': 0.5782069563865662, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.2181, 'eval_samples_per_second': 18.337, 'eval_steps_per_second': 4.584, 'epoch': 3.0}
{'eval_loss': 0.574523389339447, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1845, 'eval_samples_per_second': 21.68, 'eval_steps_per_second': 5.42, 'epoch': 4.0}
{'eval_loss': 0.57354336977005, 'eval_accuracy': 0.75, 



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6455641984939575, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0656, 'eval_samples_per_second': 60.977, 'eval_steps_per_second': 15.244, 'epoch': 1.0}
{'eval_loss': 0.6311683058738708, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0607, 'eval_samples_per_second': 65.87, 'eval_steps_per_second': 16.467, 'epoch': 2.0}
{'eval_loss': 0.6224883794784546, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0599, 'eval_samples_per_second': 66.747, 'eval_steps_per_second': 16.687, 'epoch': 3.0}
{'eval_loss': 0.6159212589263916, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0563, 'eval_samples_per_second': 70.998, 'eval_steps_per_second': 17.749, 'epoch': 4.0}
{'eval_loss': 0.6130396127700806, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'e



 ↪ Fold 2/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6681438684463501, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.09, 'eval_samples_per_second': 44.455, 'eval_steps_per_second': 11.114, 'epoch': 1.0}
{'eval_loss': 0.6609697341918945, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.087, 'eval_samples_per_second': 45.964, 'eval_steps_per_second': 11.491, 'epoch': 2.0}
{'eval_loss': 0.6556004285812378, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0901, 'eval_samples_per_second': 44.416, 'eval_steps_per_second': 11.104, 'epoch': 3.0}
{'eval_loss': 0.6520875692367554, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1137, 'eval_samples_per_second': 35.182, 'eval_steps_per_second': 8.796, 'epoch': 4.0}
{'eval_loss': 0.6505592465400696, 'eval_accuracy': 0

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6695309281349182, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.082, 'eval_samples_per_second': 48.809, 'eval_steps_per_second': 12.202, 'epoch': 1.0}
{'eval_loss': 0.6611194610595703, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0731, 'eval_samples_per_second': 54.695, 'eval_steps_per_second': 13.674, 'epoch': 2.0}
{'eval_loss': 0.6546191573143005, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0892, 'eval_samples_per_second': 44.838, 'eval_steps_per_second': 11.21, 'epoch': 3.0}
{'eval_loss': 0.6501821875572205, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0811, 'eval_samples_per_second': 49.297, 'eval_steps_per_second': 12.324, 'epoch': 4.0}
{'eval_loss': 0.6481719613075256, 'eval_accuracy':

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6683667898178101, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1123, 'eval_samples_per_second': 35.608, 'eval_steps_per_second': 8.902, 'epoch': 1.0}
{'eval_loss': 0.6605175137519836, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0919, 'eval_samples_per_second': 43.542, 'eval_steps_per_second': 10.885, 'epoch': 2.0}
{'eval_loss': 0.6547857522964478, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0993, 'eval_samples_per_second': 40.291, 'eval_steps_per_second': 10.073, 'epoch': 3.0}
{'eval_loss': 0.6510190367698669, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0884, 'eval_samples_per_second': 45.265, 'eval_steps_per_second': 11.316, 'epoch': 4.0}
{'eval_loss': 0.6493492722511292, 'eval_accuracy'

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6685416102409363, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0971, 'eval_samples_per_second': 41.194, 'eval_steps_per_second': 10.298, 'epoch': 1.0}
{'eval_loss': 0.6605151891708374, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1109, 'eval_samples_per_second': 36.057, 'eval_steps_per_second': 9.014, 'epoch': 2.0}
{'eval_loss': 0.6546041965484619, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0967, 'eval_samples_per_second': 41.348, 'eval_steps_per_second': 10.337, 'epoch': 3.0}
{'eval_loss': 0.6507070064544678, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1055, 'eval_samples_per_second': 37.913, 'eval_steps_per_second': 9.478, 'epoch': 4.0}
{'eval_loss': 0.6490011811256409, 'eval_accuracy':



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6409376263618469, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.1196, 'eval_samples_per_second': 33.448, 'eval_steps_per_second': 8.362, 'epoch': 1.0}
{'eval_loss': 0.6187633872032166, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.1355, 'eval_samples_per_second': 29.523, 'eval_steps_per_second': 7.381, 'epoch': 2.0}
{'eval_loss': 0.605980634689331, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.1118, 'eval_samples_per_second': 35.775, 'eval_steps_per_second': 8.944, 'epoch': 3.0}
{'eval_loss': 0.5965158939361572, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.1213, 'eval_samples_per_second': 32.973, 'eval_steps_per_second': 8.243, 'epoch': 4.0}
{'eval_loss': 0.5924912095069885, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_



 ↪ Fold 2/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6627445220947266, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1351, 'eval_samples_per_second': 29.609, 'eval_steps_per_second': 7.402, 'epoch': 1.0}
{'eval_loss': 0.6511543989181519, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1587, 'eval_samples_per_second': 25.206, 'eval_steps_per_second': 6.302, 'epoch': 2.0}
{'eval_loss': 0.6434566974639893, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1524, 'eval_samples_per_second': 26.241, 'eval_steps_per_second': 6.56, 'epoch': 3.0}
{'eval_loss': 0.6386456489562988, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.162, 'eval_samples_per_second': 24.696, 'eval_steps_per_second': 6.174, 'epoch': 4.0}
{'eval_loss': 0.636580228805542, 'eval_accuracy': 0.75

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6511027216911316, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.142, 'eval_samples_per_second': 28.177, 'eval_steps_per_second': 7.044, 'epoch': 1.0}
{'eval_loss': 0.6339695453643799, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1106, 'eval_samples_per_second': 36.18, 'eval_steps_per_second': 9.045, 'epoch': 2.0}
{'eval_loss': 0.6223067045211792, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1144, 'eval_samples_per_second': 34.955, 'eval_steps_per_second': 8.739, 'epoch': 3.0}
{'eval_loss': 0.6150287985801697, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1401, 'eval_samples_per_second': 28.542, 'eval_steps_per_second': 7.136, 'epoch': 4.0}
{'eval_loss': 0.6119179129600525, 'eval_accuracy': 0.7

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6658302545547485, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1662, 'eval_samples_per_second': 24.073, 'eval_steps_per_second': 6.018, 'epoch': 1.0}
{'eval_loss': 0.6531170606613159, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1783, 'eval_samples_per_second': 22.431, 'eval_steps_per_second': 5.608, 'epoch': 2.0}
{'eval_loss': 0.6449429988861084, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1376, 'eval_samples_per_second': 29.067, 'eval_steps_per_second': 7.267, 'epoch': 3.0}
{'eval_loss': 0.6401558518409729, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1682, 'eval_samples_per_second': 23.776, 'eval_steps_per_second': 5.944, 'epoch': 4.0}
{'eval_loss': 0.6381183862686157, 'eval_accuracy': 0

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6654702425003052, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1825, 'eval_samples_per_second': 21.92, 'eval_steps_per_second': 5.48, 'epoch': 1.0}
{'eval_loss': 0.6514838933944702, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.219, 'eval_samples_per_second': 18.264, 'eval_steps_per_second': 4.566, 'epoch': 2.0}
{'eval_loss': 0.6422924995422363, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.1751, 'eval_samples_per_second': 22.838, 'eval_steps_per_second': 5.709, 'epoch': 3.0}
{'eval_loss': 0.6369060277938843, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.2403, 'eval_samples_per_second': 16.646, 'eval_steps_per_second': 4.162, 'epoch': 4.0}
{'eval_loss': 0.6346965432167053, 'eval_accuracy': 0.75



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6765722632408142, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0416, 'eval_samples_per_second': 96.059, 'eval_steps_per_second': 24.015, 'epoch': 1.0}
{'eval_loss': 0.6623191833496094, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0432, 'eval_samples_per_second': 92.691, 'eval_steps_per_second': 23.173, 'epoch': 2.0}
{'eval_loss': 0.6528578996658325, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0385, 'eval_samples_per_second': 103.977, 'eval_steps_per_second': 25.994, 'epoch': 3.0}
{'eval_loss': 0.645822286605835, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0316, 'eval_samples_per_second': 126.53, 'eval_steps_per_second': 31.632, 'epoch': 4.0}
{'eval_loss': 0.642722487449646, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'e



Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6826850175857544, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0485, 'eval_samples_per_second': 82.525, 'eval_steps_per_second': 20.631, 'epoch': 1.0}
{'eval_loss': 0.6759343147277832, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0555, 'eval_samples_per_second': 72.04, 'eval_steps_per_second': 18.01, 'epoch': 2.0}
{'eval_loss': 0.6711297035217285, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0528, 'eval_samples_per_second': 75.704, 'eval_steps_per_second': 18.926, 'epoch': 3.0}
{'eval_loss': 0.6681992411613464, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0551, 'eval_samples_per_second': 72.541, 'eval_steps_per_second': 18.135, 'epoch': 4.0}
{'eval_loss': 0.6669667363166809, 'eval_accuracy':

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6813135147094727, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0401, 'eval_samples_per_second': 99.728, 'eval_steps_per_second': 24.932, 'epoch': 1.0}
{'eval_loss': 0.6713181734085083, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0404, 'eval_samples_per_second': 98.963, 'eval_steps_per_second': 24.741, 'epoch': 2.0}
{'eval_loss': 0.6636497974395752, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0413, 'eval_samples_per_second': 96.79, 'eval_steps_per_second': 24.197, 'epoch': 3.0}
{'eval_loss': 0.6582880616188049, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.042, 'eval_samples_per_second': 95.227, 'eval_steps_per_second': 23.807, 'epoch': 4.0}
{'eval_loss': 0.6558429598808289, 'eval_accuracy':

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6839367151260376, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0527, 'eval_samples_per_second': 75.843, 'eval_steps_per_second': 18.961, 'epoch': 1.0}
{'eval_loss': 0.6762882471084595, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0592, 'eval_samples_per_second': 67.603, 'eval_steps_per_second': 16.901, 'epoch': 2.0}
{'eval_loss': 0.6705631017684937, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.063, 'eval_samples_per_second': 63.48, 'eval_steps_per_second': 15.87, 'epoch': 3.0}
{'eval_loss': 0.6669127941131592, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0611, 'eval_samples_per_second': 65.518, 'eval_steps_per_second': 16.379, 'epoch': 4.0}
{'eval_loss': 0.6653029918670654, 'eval_accuracy': 

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6828752160072327, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.066, 'eval_samples_per_second': 60.584, 'eval_steps_per_second': 15.146, 'epoch': 1.0}
{'eval_loss': 0.6744048595428467, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0748, 'eval_samples_per_second': 53.495, 'eval_steps_per_second': 13.374, 'epoch': 2.0}
{'eval_loss': 0.6681180000305176, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0544, 'eval_samples_per_second': 73.494, 'eval_steps_per_second': 18.374, 'epoch': 3.0}
{'eval_loss': 0.6640872955322266, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0541, 'eval_samples_per_second': 73.923, 'eval_steps_per_second': 18.481, 'epoch': 4.0}
{'eval_loss': 0.6623872518539429, 'eval_accuracy'

🔬 Benchmarking Models on twitter:   0%|          | 0/5 [00:00<?, ?it/s]


🔍 Model: distilroberta-base
 ↪ Fold 1/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6375545263290405, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0213, 'eval_samples_per_second': 187.969, 'eval_steps_per_second': 46.992, 'epoch': 1.0}
{'eval_loss': 0.6226673126220703, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0265, 'eval_samples_per_second': 150.739, 'eval_steps_per_second': 37.685, 'epoch': 2.0}
{'eval_loss': 0.6173903346061707, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0263, 'eval_samples_per_second': 152.165, 'eval_steps_per_second': 38.041, 'epoch': 3.0}
{'eval_loss': 0.6121329069137573, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0282, 'eval_samples_per_second': 142.035, 'eval_steps_per_second': 35.509, 'epoch': 4.0}
{'eval_loss': 0.6102513074874878, 'eval_accu

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6295619010925293, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0329, 'eval_samples_per_second': 121.535, 'eval_steps_per_second': 30.384, 'epoch': 1.0}
{'eval_loss': 0.6168073415756226, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0392, 'eval_samples_per_second': 102.036, 'eval_steps_per_second': 25.509, 'epoch': 2.0}
{'eval_loss': 0.6069017648696899, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0362, 'eval_samples_per_second': 110.603, 'eval_steps_per_second': 27.651, 'epoch': 3.0}
{'eval_loss': 0.6007013916969299, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0332, 'eval_samples_per_second': 120.369, 'eval_steps_per_second': 30.092, 'epoch': 4.0}
{'eval_loss': 0.5976586937904358, 'eval_accu

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6252326965332031, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0288, 'eval_samples_per_second': 138.874, 'eval_steps_per_second': 34.718, 'epoch': 1.0}
{'eval_loss': 0.6135870218276978, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0285, 'eval_samples_per_second': 140.307, 'eval_steps_per_second': 35.077, 'epoch': 2.0}
{'eval_loss': 0.6042007803916931, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0265, 'eval_samples_per_second': 151.126, 'eval_steps_per_second': 37.781, 'epoch': 3.0}
{'eval_loss': 0.5995711088180542, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.029, 'eval_samples_per_second': 138.141, 'eval_steps_per_second': 34.535, 'epoch': 4.0}
{'eval_loss': 0.5973080396652222, 'eval_accur

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.624990701675415, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0261, 'eval_samples_per_second': 153.098, 'eval_steps_per_second': 38.274, 'epoch': 1.0}
{'eval_loss': 0.6036316752433777, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0286, 'eval_samples_per_second': 140.007, 'eval_steps_per_second': 35.002, 'epoch': 2.0}
{'eval_loss': 0.588154673576355, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0308, 'eval_samples_per_second': 129.849, 'eval_steps_per_second': 32.462, 'epoch': 3.0}
{'eval_loss': 0.5775407552719116, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0336, 'eval_samples_per_second': 118.881, 'eval_steps_per_second': 29.72, 'epoch': 4.0}
{'eval_loss': 0.573698878288269, 'eval_accuracy

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.7027778625488281, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0305, 'eval_samples_per_second': 131.217, 'eval_steps_per_second': 32.804, 'epoch': 1.0}
{'eval_loss': 0.7044596672058105, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0313, 'eval_samples_per_second': 127.894, 'eval_steps_per_second': 31.973, 'epoch': 2.0}
{'train_runtime': 3.723, 'train_samples_per_second': 21.488, 'train_steps_per_second': 2.686, 'train_loss': 0.6443831920623779, 'epoch': 2.0}
{'eval_loss': 0.7027778625488281, 'eval_model_preparation_time': 0.0005, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0294, 'eval_samples_per_second': 135.831, 'eval_steps_per_second': 33.958}

🔍 Model: distilbert-base-uncased
 ↪ Fold 1/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6896657347679138, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0161, 'eval_samples_per_second': 248.338, 'eval_steps_per_second': 62.084, 'epoch': 1.0}
{'eval_loss': 0.6710739731788635, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0164, 'eval_samples_per_second': 244.125, 'eval_steps_per_second': 61.031, 'epoch': 2.0}
{'eval_loss': 0.6610960960388184, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0218, 'eval_samples_per_second': 183.091, 'eval_steps_per_second': 45.773, 'epoch': 3.0}
{'eval_loss': 0.6542702317237854, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.024, 'eval_samples_per_second': 166.474, 'eval_steps_per_second': 41.618, 'epoch': 4.0}
{'eval_loss': 0.651724636554718, 'eval_accura

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6811559200286865, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0384, 'eval_samples_per_second': 104.289, 'eval_steps_per_second': 26.072, 'epoch': 1.0}
{'eval_loss': 0.6541446447372437, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0418, 'eval_samples_per_second': 95.749, 'eval_steps_per_second': 23.937, 'epoch': 2.0}
{'eval_loss': 0.6339324116706848, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0396, 'eval_samples_per_second': 100.885, 'eval_steps_per_second': 25.221, 'epoch': 3.0}
{'eval_loss': 0.6212049126625061, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0345, 'eval_samples_per_second': 115.864, 'eval_steps_per_second': 28.966, 'epoch': 4.0}
{'eval_loss': 0.6159260272979736, 'eval_accur

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6632278561592102, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0248, 'eval_samples_per_second': 161.472, 'eval_steps_per_second': 40.368, 'epoch': 1.0}
{'eval_loss': 0.6339207887649536, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0308, 'eval_samples_per_second': 129.946, 'eval_steps_per_second': 32.487, 'epoch': 2.0}
{'eval_loss': 0.6119203567504883, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.029, 'eval_samples_per_second': 137.813, 'eval_steps_per_second': 34.453, 'epoch': 3.0}
{'eval_loss': 0.5985212326049805, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0315, 'eval_samples_per_second': 127.144, 'eval_steps_per_second': 31.786, 'epoch': 4.0}
{'eval_loss': 0.592315137386322, 'eval_accura

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6495920419692993, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0297, 'eval_samples_per_second': 134.689, 'eval_steps_per_second': 33.672, 'epoch': 1.0}
{'eval_loss': 0.6045960783958435, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0539, 'eval_samples_per_second': 74.202, 'eval_steps_per_second': 18.55, 'epoch': 2.0}
{'eval_loss': 0.5711188316345215, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.031, 'eval_samples_per_second': 128.948, 'eval_steps_per_second': 32.237, 'epoch': 3.0}
{'eval_loss': 0.5513963103294373, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0336, 'eval_samples_per_second': 118.899, 'eval_steps_per_second': 29.725, 'epoch': 4.0}
{'eval_loss': 0.5439140796661377, 'eval_accurac

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6740739345550537, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0274, 'eval_samples_per_second': 146.246, 'eval_steps_per_second': 36.562, 'epoch': 1.0}
{'eval_loss': 0.6580407619476318, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0286, 'eval_samples_per_second': 139.885, 'eval_steps_per_second': 34.971, 'epoch': 2.0}
{'eval_loss': 0.6436421871185303, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0319, 'eval_samples_per_second': 125.212, 'eval_steps_per_second': 31.303, 'epoch': 3.0}
{'eval_loss': 0.6357109546661377, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0299, 'eval_samples_per_second': 133.926, 'eval_steps_per_second': 33.482, 'epoch': 4.0}
{'eval_loss': 0.6321200728416443, 'eval_accuracy': 0

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6711275577545166, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0109, 'eval_samples_per_second': 368.196, 'eval_steps_per_second': 92.049, 'epoch': 1.0}
{'eval_loss': 0.6659420728683472, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0115, 'eval_samples_per_second': 348.126, 'eval_steps_per_second': 87.031, 'epoch': 2.0}




{'eval_loss': 0.663774847984314, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0089, 'eval_samples_per_second': 451.474, 'eval_steps_per_second': 112.868, 'epoch': 3.0}
{'eval_loss': 0.6617461442947388, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0117, 'eval_samples_per_second': 342.029, 'eval_steps_per_second': 85.507, 'epoch': 4.0}
{'eval_loss': 0.6608476638793945, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0135, 'eval_samples_per_second': 296.763, 'eval_steps_per_second': 74.191, 'epoch': 5.0}
{'train_runtime': 2.8945, 'train_samples_per_second': 27.638, 'train_steps_per_second': 3.455, 'train_loss': 0.6701401710510254, 'epoch': 5.0}
{'eval_loss': 0.6608476638793945, 'eval_model_preparation_time': 0.0006, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precisi

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6689113974571228, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0167, 'eval_samples_per_second': 238.893, 'eval_steps_per_second': 59.723, 'epoch': 1.0}
{'eval_loss': 0.6642026901245117, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0164, 'eval_samples_per_second': 244.452, 'eval_steps_per_second': 61.113, 'epoch': 2.0}




{'eval_loss': 0.6607333421707153, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0186, 'eval_samples_per_second': 215.04, 'eval_steps_per_second': 53.76, 'epoch': 3.0}
{'eval_loss': 0.6587000489234924, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0193, 'eval_samples_per_second': 207.587, 'eval_steps_per_second': 51.897, 'epoch': 4.0}
{'eval_loss': 0.6576870679855347, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0197, 'eval_samples_per_second': 203.479, 'eval_steps_per_second': 50.87, 'epoch': 5.0}
{'train_runtime': 2.9998, 'train_samples_per_second': 26.668, 'train_steps_per_second': 3.334, 'train_loss': 0.6730785846710206, 'epoch': 5.0}
{'eval_loss': 0.6576870679855347, 'eval_model_preparation_time': 0.0005, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision'

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6710930466651917, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0194, 'eval_samples_per_second': 205.762, 'eval_steps_per_second': 51.44, 'epoch': 1.0}
{'eval_loss': 0.6664543151855469, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0232, 'eval_samples_per_second': 172.056, 'eval_steps_per_second': 43.014, 'epoch': 2.0}




{'eval_loss': 0.6628516316413879, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0184, 'eval_samples_per_second': 217.807, 'eval_steps_per_second': 54.452, 'epoch': 3.0}
{'eval_loss': 0.6612101197242737, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0266, 'eval_samples_per_second': 150.172, 'eval_steps_per_second': 37.543, 'epoch': 4.0}
{'eval_loss': 0.6605267524719238, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0272, 'eval_samples_per_second': 147.243, 'eval_steps_per_second': 36.811, 'epoch': 5.0}
{'train_runtime': 3.2789, 'train_samples_per_second': 24.399, 'train_steps_per_second': 3.05, 'train_loss': 0.6742732524871826, 'epoch': 5.0}
{'eval_loss': 0.6605267524719238, 'eval_model_preparation_time': 0.0006, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precisio

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6701566576957703, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0168, 'eval_samples_per_second': 238.039, 'eval_steps_per_second': 59.51, 'epoch': 1.0}
{'eval_loss': 0.6631861329078674, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0176, 'eval_samples_per_second': 227.855, 'eval_steps_per_second': 56.964, 'epoch': 2.0}




{'eval_loss': 0.658109724521637, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0757, 'eval_samples_per_second': 52.832, 'eval_steps_per_second': 13.208, 'epoch': 3.0}
{'eval_loss': 0.6548885107040405, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0175, 'eval_samples_per_second': 228.607, 'eval_steps_per_second': 57.152, 'epoch': 4.0}
{'eval_loss': 0.6536555886268616, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0184, 'eval_samples_per_second': 217.863, 'eval_steps_per_second': 54.466, 'epoch': 5.0}
{'train_runtime': 3.2549, 'train_samples_per_second': 24.578, 'train_steps_per_second': 3.072, 'train_loss': 0.6724155426025391, 'epoch': 5.0}
{'eval_loss': 0.6536555886268616, 'eval_model_preparation_time': 0.0006, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6955184936523438, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0179, 'eval_samples_per_second': 223.666, 'eval_steps_per_second': 55.917, 'epoch': 1.0}
{'eval_loss': 0.69614177942276, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0212, 'eval_samples_per_second': 188.546, 'eval_steps_per_second': 47.137, 'epoch': 2.0}




{'train_runtime': 1.6344, 'train_samples_per_second': 48.947, 'train_steps_per_second': 6.118, 'train_loss': 0.6703445315361023, 'epoch': 2.0}
{'eval_loss': 0.6955184936523438, 'eval_model_preparation_time': 0.0007, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0422, 'eval_samples_per_second': 94.872, 'eval_steps_per_second': 23.718}

🔍 Model: google/electra-small-discriminator
 ↪ Fold 1/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.7025275230407715, 'eval_accuracy': 0.25, 'eval_f1': 0.4, 'eval_precision': 0.5, 'eval_recall': 0.3333333333333333, 'eval_runtime': 0.0195, 'eval_samples_per_second': 204.633, 'eval_steps_per_second': 51.158, 'epoch': 1.0}
{'eval_loss': 0.6975865364074707, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.6666666666666666, 'eval_recall': 0.6666666666666666, 'eval_runtime': 0.0308, 'eval_samples_per_second': 130.064, 'eval_steps_per_second': 32.516, 'epoch': 2.0}




{'eval_loss': 0.6954387426376343, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.6666666666666666, 'eval_recall': 0.6666666666666666, 'eval_runtime': 0.0192, 'eval_samples_per_second': 208.768, 'eval_steps_per_second': 52.192, 'epoch': 3.0}
{'eval_loss': 0.6939518451690674, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.6666666666666666, 'eval_recall': 0.6666666666666666, 'eval_runtime': 0.0158, 'eval_samples_per_second': 253.134, 'eval_steps_per_second': 63.284, 'epoch': 4.0}
{'eval_loss': 0.6934602856636047, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.6666666666666666, 'eval_recall': 0.6666666666666666, 'eval_runtime': 0.014, 'eval_samples_per_second': 285.652, 'eval_steps_per_second': 71.413, 'epoch': 5.0}
{'train_runtime': 3.0424, 'train_samples_per_second': 26.295, 'train_steps_per_second': 3.287, 'train_loss': 0.6654580593109131, 'epoch': 5.0}
{'eval_loss': 0.6934602856636047, 'eval_model_preparation

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6826788783073425, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0303, 'eval_samples_per_second': 132.073, 'eval_steps_per_second': 33.018, 'epoch': 1.0}
{'eval_loss': 0.676508903503418, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0262, 'eval_samples_per_second': 152.695, 'eval_steps_per_second': 38.174, 'epoch': 2.0}




{'eval_loss': 0.6725218296051025, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0263, 'eval_samples_per_second': 152.311, 'eval_steps_per_second': 38.078, 'epoch': 3.0}
{'eval_loss': 0.6702821254730225, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0272, 'eval_samples_per_second': 147.302, 'eval_steps_per_second': 36.825, 'epoch': 4.0}




{'eval_loss': 0.6692520976066589, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0306, 'eval_samples_per_second': 130.912, 'eval_steps_per_second': 32.728, 'epoch': 5.0}




{'train_runtime': 2.5641, 'train_samples_per_second': 31.201, 'train_steps_per_second': 3.9, 'train_loss': 0.669638729095459, 'epoch': 5.0}
{'eval_loss': 0.6692520976066589, 'eval_model_preparation_time': 0.001, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0257, 'eval_samples_per_second': 155.654, 'eval_steps_per_second': 38.914}
 ↪ Fold 3/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.66196608543396, 'eval_accuracy': 1.0, 'eval_f1': 1.0, 'eval_precision': 1.0, 'eval_recall': 1.0, 'eval_runtime': 0.0289, 'eval_samples_per_second': 138.327, 'eval_steps_per_second': 34.582, 'epoch': 1.0}
{'eval_loss': 0.6555244326591492, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0247, 'eval_samples_per_second': 161.838, 'eval_steps_per_second': 40.459, 'epoch': 2.0}




{'eval_loss': 0.651301383972168, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0269, 'eval_samples_per_second': 148.474, 'eval_steps_per_second': 37.118, 'epoch': 3.0}
{'eval_loss': 0.6488347053527832, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0335, 'eval_samples_per_second': 119.407, 'eval_steps_per_second': 29.852, 'epoch': 4.0}
{'eval_loss': 0.647770881652832, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0279, 'eval_samples_per_second': 143.308, 'eval_steps_per_second': 35.827, 'epoch': 5.0}
{'train_runtime': 2.7464, 'train_samples_per_second': 29.129, 'train_steps_per_second': 3.641, 'train_loss': 0.6762292861938477, 'epoch': 5.0}
{'eval_loss': 0.647770881652832, 'eval_model_preparation_time': 0.001, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision':

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6679656505584717, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0241, 'eval_samples_per_second': 165.743, 'eval_steps_per_second': 41.436, 'epoch': 1.0}
{'eval_loss': 0.6604020595550537, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0264, 'eval_samples_per_second': 151.479, 'eval_steps_per_second': 37.87, 'epoch': 2.0}




{'eval_loss': 0.6551768183708191, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0235, 'eval_samples_per_second': 170.502, 'eval_steps_per_second': 42.625, 'epoch': 3.0}




{'eval_loss': 0.6520535945892334, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0265, 'eval_samples_per_second': 150.829, 'eval_steps_per_second': 37.707, 'epoch': 4.0}




{'eval_loss': 0.6508297920227051, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0289, 'eval_samples_per_second': 138.466, 'eval_steps_per_second': 34.616, 'epoch': 5.0}
{'train_runtime': 2.6177, 'train_samples_per_second': 30.561, 'train_steps_per_second': 3.82, 'train_loss': 0.6733861923217773, 'epoch': 5.0}
{'eval_loss': 0.6508297920227051, 'eval_model_preparation_time': 0.001, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0274, 'eval_samples_per_second': 145.851, 'eval_steps_per_second': 36.463}
 ↪ Fold 5/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6813454627990723, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0304, 'eval_samples_per_second': 131.514, 'eval_steps_per_second': 32.878, 'epoch': 1.0}
{'eval_loss': 0.6779568195343018, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0243, 'eval_samples_per_second': 164.616, 'eval_steps_per_second': 41.154, 'epoch': 2.0}




{'eval_loss': 0.6756519079208374, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0266, 'eval_samples_per_second': 150.234, 'eval_steps_per_second': 37.558, 'epoch': 3.0}




{'eval_loss': 0.6741756200790405, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0275, 'eval_samples_per_second': 145.412, 'eval_steps_per_second': 36.353, 'epoch': 4.0}
{'eval_loss': 0.6735413074493408, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0236, 'eval_samples_per_second': 169.234, 'eval_steps_per_second': 42.309, 'epoch': 5.0}
{'train_runtime': 2.5877, 'train_samples_per_second': 30.916, 'train_steps_per_second': 3.864, 'train_loss': 0.6724793910980225, 'epoch': 5.0}
{'eval_loss': 0.6735413074493408, 'eval_model_preparation_time': 0.0011, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0273, 'eval_samples_per_second': 146.376, 'eval_steps_per_second': 36.594}

🔍 Model: huawei-noah/TinyBERT_General_4L_312D
 ↪ Fold 1/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6890227198600769, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0073, 'eval_samples_per_second': 546.365, 'eval_steps_per_second': 136.591, 'epoch': 1.0}
{'eval_loss': 0.6841299533843994, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0107, 'eval_samples_per_second': 373.134, 'eval_steps_per_second': 93.283, 'epoch': 2.0}




{'eval_loss': 0.6817242503166199, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0113, 'eval_samples_per_second': 354.286, 'eval_steps_per_second': 88.572, 'epoch': 3.0}




{'eval_loss': 0.6799689531326294, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0095, 'eval_samples_per_second': 419.588, 'eval_steps_per_second': 104.897, 'epoch': 4.0}




{'eval_loss': 0.6793385744094849, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0118, 'eval_samples_per_second': 338.209, 'eval_steps_per_second': 84.552, 'epoch': 5.0}




{'train_runtime': 2.05, 'train_samples_per_second': 39.025, 'train_steps_per_second': 4.878, 'train_loss': 0.6802978038787841, 'epoch': 5.0}
{'eval_loss': 0.6793385744094849, 'eval_model_preparation_time': 0.0005, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0105, 'eval_samples_per_second': 380.729, 'eval_steps_per_second': 95.182}
 ↪ Fold 2/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6837440729141235, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0162, 'eval_samples_per_second': 247.247, 'eval_steps_per_second': 61.812, 'epoch': 1.0}
{'eval_loss': 0.6782488822937012, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0169, 'eval_samples_per_second': 236.212, 'eval_steps_per_second': 59.053, 'epoch': 2.0}




{'eval_loss': 0.6741973161697388, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0159, 'eval_samples_per_second': 251.476, 'eval_steps_per_second': 62.869, 'epoch': 3.0}




{'eval_loss': 0.6716941595077515, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0133, 'eval_samples_per_second': 300.839, 'eval_steps_per_second': 75.21, 'epoch': 4.0}




{'eval_loss': 0.6705105304718018, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.021, 'eval_samples_per_second': 190.867, 'eval_steps_per_second': 47.717, 'epoch': 5.0}




{'train_runtime': 2.1027, 'train_samples_per_second': 38.046, 'train_steps_per_second': 4.756, 'train_loss': 0.6823843002319336, 'epoch': 5.0}
{'eval_loss': 0.6705105304718018, 'eval_model_preparation_time': 0.0006, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0166, 'eval_samples_per_second': 241.27, 'eval_steps_per_second': 60.318}
 ↪ Fold 3/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6834582090377808, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0113, 'eval_samples_per_second': 353.078, 'eval_steps_per_second': 88.27, 'epoch': 1.0}
{'eval_loss': 0.6783255934715271, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0103, 'eval_samples_per_second': 389.516, 'eval_steps_per_second': 97.379, 'epoch': 2.0}




{'eval_loss': 0.6747463941574097, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0108, 'eval_samples_per_second': 372.091, 'eval_steps_per_second': 93.023, 'epoch': 3.0}




{'eval_loss': 0.6728994250297546, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0107, 'eval_samples_per_second': 372.537, 'eval_steps_per_second': 93.134, 'epoch': 4.0}




{'eval_loss': 0.6720307469367981, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0129, 'eval_samples_per_second': 309.977, 'eval_steps_per_second': 77.494, 'epoch': 5.0}




{'train_runtime': 1.7132, 'train_samples_per_second': 46.695, 'train_steps_per_second': 5.837, 'train_loss': 0.6834444522857666, 'epoch': 5.0}
{'eval_loss': 0.6720307469367981, 'eval_model_preparation_time': 0.0003, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0094, 'eval_samples_per_second': 427.162, 'eval_steps_per_second': 106.791}
 ↪ Fold 4/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6868109703063965, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0091, 'eval_samples_per_second': 437.739, 'eval_steps_per_second': 109.435, 'epoch': 1.0}
{'eval_loss': 0.6809101104736328, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0094, 'eval_samples_per_second': 426.218, 'eval_steps_per_second': 106.554, 'epoch': 2.0}




{'eval_loss': 0.6764316558837891, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0095, 'eval_samples_per_second': 420.218, 'eval_steps_per_second': 105.055, 'epoch': 3.0}




{'eval_loss': 0.6734156012535095, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0104, 'eval_samples_per_second': 383.47, 'eval_steps_per_second': 95.868, 'epoch': 4.0}




{'eval_loss': 0.6721760034561157, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0116, 'eval_samples_per_second': 343.612, 'eval_steps_per_second': 85.903, 'epoch': 5.0}




{'train_runtime': 1.8341, 'train_samples_per_second': 43.617, 'train_steps_per_second': 5.452, 'train_loss': 0.6812983512878418, 'epoch': 5.0}
{'eval_loss': 0.6721760034561157, 'eval_model_preparation_time': 0.0004, 'eval_accuracy': 0.75, 'eval_f1': 0.8571428571428571, 'eval_precision': 0.75, 'eval_recall': 1.0, 'eval_runtime': 0.0137, 'eval_samples_per_second': 291.544, 'eval_steps_per_second': 72.886}
 ↪ Fold 5/5


Map:   0%|          | 0/16 [00:00<?, ? examples/s]

Map:   0%|          | 0/4 [00:00<?, ? examples/s]



{'eval_loss': 0.6896883249282837, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0129, 'eval_samples_per_second': 310.201, 'eval_steps_per_second': 77.55, 'epoch': 1.0}
{'eval_loss': 0.6887905597686768, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0124, 'eval_samples_per_second': 323.884, 'eval_steps_per_second': 80.971, 'epoch': 2.0}




{'eval_loss': 0.6879966259002686, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0122, 'eval_samples_per_second': 326.551, 'eval_steps_per_second': 81.638, 'epoch': 3.0}




{'eval_loss': 0.6873769164085388, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.015, 'eval_samples_per_second': 266.453, 'eval_steps_per_second': 66.613, 'epoch': 4.0}




{'eval_loss': 0.687095046043396, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0146, 'eval_samples_per_second': 273.597, 'eval_steps_per_second': 68.399, 'epoch': 5.0}




{'train_runtime': 2.1065, 'train_samples_per_second': 37.978, 'train_steps_per_second': 4.747, 'train_loss': 0.679874038696289, 'epoch': 5.0}
{'eval_loss': 0.687095046043396, 'eval_model_preparation_time': 0.0015, 'eval_accuracy': 0.5, 'eval_f1': 0.6666666666666666, 'eval_precision': 0.5, 'eval_recall': 1.0, 'eval_runtime': 0.0175, 'eval_samples_per_second': 229.056, 'eval_steps_per_second': 57.264}

✅ Multimodal Benchmarking complete. Results saved to multimodal_results.csv
