# Demo: Fine-tuning with Sequence Modality for Regression Task

In [1]:
import numpy as np
from torch import nn
from torch.optim import Adam
from benchmol.dataloader.sequence_dataset import TrainValTestFromCSVFactory
from benchmol.trainer import Trainer
from benchmol.model_pools import SmilesModelFactory

In [2]:
# Data
csv_path = "../datasets/toys/CHEMBL4419606_IC50_nM/processed/CHEMBL4419606_IC50_nM_processed_ac.csv"
num_tasks = 1
device = "cuda:1"  # cpu or cuda:0

# Take the sequence modality and regression task as an example
modality="sequence"
model_name = "CHEM-BERT"
task_type = "regression"

# define Model with backbone as ViT and neck as arch4 for n tasks
model = SmilesModelFactory(
    model_name=model_name, vocab_path=None, head_arch="arch4",
    head_arch_params={"inner_dim": 128, "dropout": 0.2, "activation_fn": "gelu"}, num_tasks=num_tasks, device=device
)

# define Dataset
factory = TrainValTestFromCSVFactory(
    csv_path, model_name, task_type=task_type, 
    batch_size=8, num_workers=8
)
train_loader, valid_loader, test_loader = factory.get_dataloader(split="train"), factory.get_dataloader(split="valid"), factory.get_dataloader(split="test")

# define Trainer
trainer = Trainer(
model, modality, train_loader, valid_loader, test_loader, task_type,
    criterion=nn.MSELoss(), optimizer=Adam(model.parameters(), lr=0.005, weight_decay=1e-5), device=device
)

# training and evaluation
results = trainer.train(
    num_epochs=20, eval_metric="RMSE", valid_select="min", min_value=np.inf, dataset="CHEMBL4419606_IC50_nM", 
    save_finetune_ckpt=True, save_dir="./experiments/"
)

# Output model results
print("results: {}\n".format(results))

[train] dataset: CHEMBL4419606_IC50_nM; epoch: 0 total loss: 23.326: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:02<00:00,  5.72it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 0 total loss: 0.391: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 19.79it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 0 total loss: 1.341: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  9.01it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 0, 'Loss': 0.3913678228855133, 'metric': 'RMSE', 'train': 0.6196628840980745, 'valid': 1.125328346831774, 'test': 0.8792862809935355}
model has been saved as ./experiments//valid_best.pth


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 1 total loss: 0.666: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 14.07it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 1 total loss: 0.409: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 20.11it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 1 total loss: 1.251: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  8.33it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 1, 'Loss': 0.4092365503311157, 'metric': 'RMSE', 'train': 0.6375374293011362, 'valid': 1.0958681897365445, 'test': 0.8889560846926131}
model has been saved as ./experiments//valid_best.pth


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 2 total loss: 0.785: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 13.83it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 2 total loss: 0.585: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 18.65it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 2 total loss: 1.073: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  8.58it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 2, 'Loss': 0.5849220156669617, 'metric': 'RMSE', 'train': 0.762719637847624, 'valid': 1.0477823441843266, 'test': 0.9739175143900679}
model has been saved as ./experiments//valid_best.pth


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 3 total loss: 0.733: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 13.14it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 3 total loss: 0.487: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 19.27it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 3 total loss: 1.966: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  8.59it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 3, 'Loss': 0.48667797446250916, 'metric': 'RMSE', 'train': 0.6984230932120444, 'valid': 1.334307097039971, 'test': 0.9497527977856027}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 4 total loss: 0.601: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 13.26it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 4 total loss: 0.384: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 18.69it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 4 total loss: 1.320: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  8.94it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 4, 'Loss': 0.38421034812927246, 'metric': 'RMSE', 'train': 0.6225685131347065, 'valid': 1.1182737985440572, 'test': 0.8806622031538405}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 5 total loss: 0.600: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 13.60it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 5 total loss: 0.376: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 19.21it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 5 total loss: 1.429: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  7.64it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 5, 'Loss': 0.37562814354896545, 'metric': 'RMSE', 'train': 0.6142407497458262, 'valid': 1.1551588715660908, 'test': 0.8780782279189807}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 6 total loss: 0.618: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 14.06it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 6 total loss: 0.373: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 18.12it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 6 total loss: 1.441: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  8.29it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 6, 'Loss': 0.373168021440506, 'metric': 'RMSE', 'train': 0.6142145963960659, 'valid': 1.1593414841467347, 'test': 0.8783978674577286}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 7 total loss: 0.687: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 12.39it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 7 total loss: 0.383: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 17.01it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 7 total loss: 1.344: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  7.71it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 7, 'Loss': 0.383053719997406, 'metric': 'RMSE', 'train': 0.6193268911314159, 'valid': 1.1262760584771587, 'test': 0.8791382808267049}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 8 total loss: 0.610: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 12.26it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 8 total loss: 0.415: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 16.29it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 8 total loss: 1.412: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  7.71it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 8, 'Loss': 0.415458619594574, 'metric': 'RMSE', 'train': 0.6145391045103801, 'valid': 1.1494404059322048, 'test': 0.8778154823955652}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 9 total loss: 0.591: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 13.37it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 9 total loss: 0.390: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 18.24it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 9 total loss: 1.313: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  7.22it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 9, 'Loss': 0.3902702331542969, 'metric': 'RMSE', 'train': 0.623707950717969, 'valid': 1.1159167490130188, 'test': 0.8812362246373099}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 10 total loss: 0.604: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 12.01it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 10 total loss: 0.453: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 12.49it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 10 total loss: 1.164: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  8.17it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 10, 'Loss': 0.45288097858428955, 'metric': 'RMSE', 'train': 0.674767261181224, 'valid': 1.068840568592388, 'test': 0.912434843246379}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 11 total loss: 0.639: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 12.88it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 11 total loss: 0.547: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 15.67it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 11 total loss: 1.102: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  6.65it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 11, 'Loss': 0.547161340713501, 'metric': 'RMSE', 'train': 0.7236620172609518, 'valid': 1.052901427202071, 'test': 0.9458681730858091}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 12 total loss: 0.710: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 12.21it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 12 total loss: 0.729: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 16.21it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 12 total loss: 1.043: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:01<00:00,  5.69it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 12, 'Loss': 0.7287288904190063, 'metric': 'RMSE', 'train': 0.8533768852629688, 'valid': 1.0514659144382412, 'test': 1.0423738950789594}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 13 total loss: 0.699: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 11.93it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 13 total loss: 0.372: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 19.95it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 13 total loss: 1.382: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  8.17it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 13, 'Loss': 0.37248465418815613, 'metric': 'RMSE', 'train': 0.6158843678959941, 'valid': 1.139266920549708, 'test': 0.8778900069711268}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 14 total loss: 0.683: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 12.12it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 14 total loss: 0.458: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 16.21it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 14 total loss: 1.915: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  8.54it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 14, 'Loss': 0.4581361413002014, 'metric': 'RMSE', 'train': 0.6861415831286606, 'valid': 1.3179574925392499, 'test': 0.9399015838839001}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 15 total loss: 0.667: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 14.43it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 15 total loss: 0.383: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 17.84it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 15 total loss: 1.493: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  6.38it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 15, 'Loss': 0.3829425871372223, 'metric': 'RMSE', 'train': 0.615685192236473, 'valid': 1.1767990775814916, 'test': 0.8807802828942566}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 16 total loss: 0.709: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 12.58it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 16 total loss: 0.382: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 17.92it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 16 total loss: 1.550: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  7.40it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 16, 'Loss': 0.3822004199028015, 'metric': 'RMSE', 'train': 0.6198855663067234, 'valid': 1.1961113750800207, 'test': 0.885125827582154}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 17 total loss: 0.690: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 12.59it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 17 total loss: 0.371: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 17.67it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 17 total loss: 1.427: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  8.25it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 17, 'Loss': 0.37144792079925537, 'metric': 'RMSE', 'train': 0.6142570166061191, 'valid': 1.1545740247734466, 'test': 0.8780419762651478}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 18 total loss: 0.643: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 12.00it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 18 total loss: 0.388: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:00<00:00, 16.43it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 18 total loss: 1.451: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  6.31it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 18, 'Loss': 0.3884791433811188, 'metric': 'RMSE', 'train': 0.6142966422506896, 'valid': 1.1624938743531377, 'test': 0.8787064599242967}


[train] dataset: CHEMBL4419606_IC50_nM; epoch: 19 total loss: 0.574: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 10.51it/s]
[eval on train set] dataset: CHEMBL4419606_IC50_nM; epoch: 19 total loss: 0.377: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 16/16 [00:01<00:00, 14.51it/s]
[eval on valid set] dataset: CHEMBL4419606_IC50_nM; epoch: 19 total loss: 1.436: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:00<00:00,  6.35it/s

{'dataset': 'CHEMBL4419606_IC50_nM', 'epoch': 19, 'Loss': 0.37700581550598145, 'metric': 'RMSE', 'train': 0.6142069656652368, 'valid': 1.1574377547464847, 'test': 0.8782394341506399}
results: {'highest_valid': 1.0477823441843266, 'final_train': 0.762719637847624, 'final_test': 0.9739175143900679, 'highest_train': 0.6142069656652368}




