In [1]:
#!/usr/bin/env python
# coding: utf-8

import os
import sys
sys.path.append('./')
sys.path.append('../')

import lightning.pytorch as pl
from lightning.pytorch.loggers import TensorBoardLogger
from lightning.pytorch.callbacks import EarlyStopping

import config
from libs.data_loader import BBDataModule
from libs.nn import BaselineModel

# import numpy as np
# import pandas as pd
# from torch.utils.data import Dataset, DataLoader, random_split, default_collate

In [2]:
# import freeze_support
# from multiprocessing import freeze_support
# freeze_support()

cfg = config.BASELINE_MODEL

ROOT_DIR = '.' if os.path.exists('config') else '..' 
csv_file = os.path.join(ROOT_DIR, 'dataset', cfg['train_csv_file'])
# csv_file = os.path.join(ROOT_DIR, 'dataset', 'train.csv')

# model = BaselineModel(
#     num_input=cfg['num_input'], 
#     num_output=cfg['num_output'], 
#     layers=cfg['layers'],
#     dropout=cfg['dropout']
# ) 

In [3]:
data_module = BBDataModule(
    csv_file=csv_file, 
    batch_size=cfg['batch_size'], 
    num_workers=cfg['num_workers']
)

In [4]:
log_dir = os.path.join(ROOT_DIR, 'tb_logs')
logger = TensorBoardLogger(log_dir, name="baseline")

trainer = pl.Trainer(
    # limit_train_batches=0.1, # use only 10% of the training data
    min_epochs=1,
    max_epochs=cfg['num_epochs'],
    precision='bf16-mixed',
    callbacks=[EarlyStopping(monitor="val_loss")],
    logger=logger,
    # profiler=profiler,
    # profiler='simple'
)

Using bfloat16 Automatic Mixed Precision (AMP)
GPU available: True (mps), used: True
TPU available: False, using: 0 TPU cores
HPU available: False, using: 0 HPUs


In [5]:
# load the model
checkpoint = os.path.join(ROOT_DIR, 'models', 'baseline_model.ckpt')
model = BaselineModel.load_from_checkpoint(
    checkpoint,
    num_input=cfg['num_input'],
    num_output=cfg['num_output'],
    layers=cfg['layers'],
    dropout=cfg['dropout']
)

Validation DataLoader 0:  19%|████████████████████████▎                                                                                                      | 48/251 [00:00<00:00, 238.14it/s]



Validation DataLoader 0: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 251/251 [00:00<00:00, 280.21it/s]
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
     Validate metric           DataLoader 0
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
        val_loss            0.3589252829551697
        val_rmse            0.5882092714309692
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
Testing DataLoader 0:  24%|███████████████████████████████                                                                                                   | 60/251 [00:00<00:00, 298.11it/s]



Testing DataLoader 0: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 251/251 [00:00<00:00, 301.53it/s]
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
       Test metric             DataLoader 0
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
        test_loss           0.44477736949920654
        test_rmse           0.6107111573219299
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────


[{'test_loss': 0.44477736949920654, 'test_rmse': 0.6107111573219299}]

In [None]:
trainer.validate(model, data_module)
trainer.test(model, data_module)

Validation DataLoader 0:  26%|████████████████████████████████▉                                                                                              | 65/251 [00:00<00:00, 322.20it/s]



Validation DataLoader 0: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 251/251 [00:00<00:00, 324.12it/s]
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
     Validate metric           DataLoader 0
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
        val_loss            0.42652177810668945
        val_rmse            0.5967417359352112
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
Testing DataLoader 0:  23%|██████████████████████████████                                                                                                    | 58/251 [00:00<00:00, 287.16it/s]



Testing DataLoader 0: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 251/251 [00:00<00:00, 289.94it/s]
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
       Test metric             DataLoader 0
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
        test_loss           0.36157718300819397
        test_rmse           0.5910803079605103
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
