In [12]:
import torch
import pyro
import numpy as np
from torch.nn import ReLU, LeakyReLU
from pyro.infer import SVI, Trace_ELBO, Predictive
from tqdm import tqdm

# Simple model with one hidden layer
from src.models.regression import MLERegression
from src.metrics.regression import  RootMeanSquaredError, PCIP, MPIW
# Six UCI datasets: concrete, power, energy, wine, yacht, housing
from src.data.regression import UCI
from src.commons.pyro_training import to_bayesian_model
from src.commons.utils import seed_everything

In [13]:
input_sizes = {
    'concrete': 7,
    'power': 3,
    'energy': 8,
    'wine': 10,
    'yacht': 5,
    'housing': 12
}

relu = ReLU()
leaky = LeakyReLU(negative_slope = 0.5)

In [14]:
# Reference example: http://pyro.ai/examples/bayesian_regression.html

def training(svi, train_loader, epoch, device):
    loss = 0
    for idx, (X, y) in tqdm(
        enumerate(train_loader), total=len(train_loader), desc=f"Training epoch {epoch}", miniters=10
    ):
        X = X.to(device)
        y = y.to(device)
        step_loss = svi.step(X, y)
        loss += step_loss
        batch_index = (epoch + 1) * len(train_loader) + idx
    return loss

def evaluation(predictive, dataloader, metrics, device):
    for idx, (X, y) in tqdm(enumerate(dataloader), desc=f"Evaluation", miniters=10):
        if not np.isfinite(np.array(X)).all():
            print("WARNING: INF IN DATA")
            X[X == float("-INF")] = 0
            X[X == float("INF")] = 0
            
        y = y.to(device)
        out = predictive(X.to(device))["obs"].T
        for metric in metrics.values():
            metric.update(out, y)


In [15]:
def train_loop(
    model,
    guide,
    train_loader,
    valid_loader,
    svi,
    epochs,
    num_samples,
    metrics,
    device,
):
    
    for e in range(epochs):
        loss = training(svi, train_loader, e, device)
        print(f"Loss: {loss}")
        
        predictive = Predictive(model, guide=guide, num_samples=num_samples, return_sites=("obs",))
        evaluation(predictive, valid_loader, metrics, device)
        
        for metric in metrics:
            print(f"{metric}: {metrics[metric].compute().cpu()}")
            metrics[metric].reset()
            
    return model, guide

In [16]:
def bayesian_training(
    seed,
    max_epochs,
    num_samples,
    batch_size,
    task,
    device,
    optimizer,
    criterion,
    sigma_bound,
    param_mean,
    param_std,
    hidden_size,
    activation
):
    seed_everything(seed)
    pyro.clear_param_store()

    net = MLERegression(activation=activation, in_size=input_sizes[task], hidden_size=hidden_size, out_size=1)
# the model is converted using code in src.models.bnn, in particular BNNRegression class defining bayesian model
    model = to_bayesian_model(net, param_mean, param_std, device=device, sigma_bound=sigma_bound)
    svi = SVI(model.model, model.guide, optimizer, loss=criterion)
    
    dataloader_args = {
      "num_workers": 4,
      "pin_memory": True,
      "persistent_workers": True
    }
    
    uci = UCI(task, train_batch_size=batch_size, test_batch_size=batch_size, train_ratio=0.8, validation_ratio=0.2, dataloader_args=dataloader_args)
    train_loader = uci.train_dataloader()
    valid_loader = uci.validation_dataloader()
    
    metrics = {
    "RMSE": RootMeanSquaredError(input_type="samples"),
    "PCIP": PCIP(input_type="none", percentile=80),
    "MPIW": MPIW(input_type="none", percentile=80)
    }

    for metric in metrics.values():
        metric.set_device(device)
        
    return train_loop(model.model, model.guide, train_loader, valid_loader, svi, max_epochs, num_samples, metrics, device)

In [17]:
param_dict = {
    "seed": 42,
    "max_epochs": 50,
    "num_samples": 50,
    "batch_size": 32,
    "task": 'housing',
    "device": torch.device("cuda"),

    "optimizer": pyro.optim.Adam({"lr": 0.001 ,"betas": [0.9, 0.999]}),
    "criterion": Trace_ELBO(),

    # The models output is Normal(mean, std) where std has prior Uniform(0, sigma_bound)
    "sigma_bound": 5.0,

    # mean and std of bayesian model priors
    "param_mean": 0.0,
    "param_std": 1.0,

    "hidden_size": 40,
    "activation": relu
}

The data is normalized so RMSE of naive model is ~1. 

PCIP metric is adjusted for percentile so for example for 80% confidence interval value 5 means that 85% of datapoint fall into the interval and value -3 means that 77% of the datapoints fall into the interval. In other words, the closer the PCIP metric is to 0 the better.

Here we can see that the model starts with relatively reasonable PCIP but as the model trains it goes up to 18 indicating that 98% of datapoints fall into 80% confidence interval (despite the fact that RMSE goes down so the model converges). 

By changing param_std, sigma_bound, learning_rate, batch_size or the shape of the net one can affect the course of training so that the initial PCIP can be negative/positive and increase/decrease throughout training. But I didn't manage to set the parameters in such a way that it converges to 0.

In [18]:
bayesian_training(**param_dict)

Train data shape
torch.Size([404, 12])
torch.Size([404])
Test data shape
torch.Size([101, 12])
torch.Size([101])
NAIVE RMSE: 0.9948453971905475


Training epoch 0: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 62.86it/s]

Loss: 12201.28772854805



Evaluation: 3it [00:00,  5.01it/s]


RMSE: 1.9745211601257324
PCIP: 3.75
MPIW: 5.2330827713012695


Training epoch 1: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 58.56it/s]


Loss: 12145.839479923248


Evaluation: 3it [00:00,  5.66it/s]


RMSE: 1.7377240657806396
PCIP: 4.375
MPIW: 5.233338356018066


Training epoch 2: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 71.35it/s]


Loss: 12104.237593233585


Evaluation: 3it [00:00,  5.66it/s]


RMSE: 1.4273418188095093
PCIP: 7.083335876464844
MPIW: 5.288703918457031


Training epoch 3: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 68.19it/s]


Loss: 11963.116403579712


Evaluation: 3it [00:00,  5.65it/s]


RMSE: 1.2151650190353394
PCIP: 8.4375
MPIW: 5.23115873336792


Training epoch 4: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.91it/s]


Loss: 11873.29842031002


Evaluation: 3it [00:00,  5.65it/s]


RMSE: 1.0899417400360107
PCIP: 10.0
MPIW: 5.2201104164123535


Training epoch 5: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.20it/s]


Loss: 11814.152236282825


Evaluation: 3it [00:00,  5.68it/s]


RMSE: 1.0481154918670654
PCIP: 11.250007629394531
MPIW: 5.2227606773376465


Training epoch 6: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.71it/s]


Loss: 11771.5860324502


Evaluation: 3it [00:00,  5.68it/s]


RMSE: 0.9633806347846985
PCIP: 12.321426391601562
MPIW: 5.238219738006592


Training epoch 7: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.61it/s]


Loss: 11577.964246034622


Evaluation: 3it [00:00,  5.69it/s]


RMSE: 0.8626309037208557
PCIP: 13.125
MPIW: 5.249088287353516


Training epoch 8: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.44it/s]


Loss: 11561.511214971542


Evaluation: 3it [00:00,  5.71it/s]


RMSE: 0.8412342071533203
PCIP: 13.75
MPIW: 5.2498860359191895


Training epoch 9: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 70.27it/s]


Loss: 11459.387121140957


Evaluation: 3it [00:00,  5.61it/s]


RMSE: 0.8362199068069458
PCIP: 14.375
MPIW: 5.247282981872559


Training epoch 10: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 63.66it/s]


Loss: 11362.684881031513


Evaluation: 3it [00:00,  3.78it/s]


RMSE: 0.7536134123802185
PCIP: 14.772727966308594
MPIW: 5.260594844818115


Training epoch 11: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 66.81it/s]


Loss: 11306.568384349346


Evaluation: 3it [00:00,  5.47it/s]


RMSE: 0.7783670425415039
PCIP: 15.000007629394531
MPIW: 5.2579169273376465


Training epoch 12: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.78it/s]


Loss: 11234.239776551723


Evaluation: 3it [00:00,  5.64it/s]


RMSE: 0.7197064161300659
PCIP: 15.384613037109375
MPIW: 5.2489142417907715


Training epoch 13: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.52it/s]


Loss: 11221.339615046978


Evaluation: 3it [00:00,  5.61it/s]


RMSE: 0.7889441251754761
PCIP: 15.625
MPIW: 5.242625713348389


Training epoch 14: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 70.26it/s]


Loss: 11085.188278853893


Evaluation: 3it [00:00,  5.65it/s]


RMSE: 0.6933871507644653
PCIP: 15.833335876464844
MPIW: 5.23216438293457


Training epoch 15: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.04it/s]


Loss: 11047.406704485416


Evaluation: 3it [00:00,  5.70it/s]


RMSE: 0.7362537980079651
PCIP: 16.015625
MPIW: 5.222671031951904


Training epoch 16: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.17it/s]


Loss: 10996.488861858845


Evaluation: 3it [00:00,  5.68it/s]


RMSE: 0.7447720766067505
PCIP: 16.176475524902344
MPIW: 5.215726375579834


Training epoch 17: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.18it/s]


Loss: 10850.73546475172


Evaluation: 3it [00:00,  5.62it/s]


RMSE: 0.7007922530174255
PCIP: 16.31945037841797
MPIW: 5.214407920837402


Training epoch 18: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 53.93it/s]


Loss: 10973.645402729511


Evaluation: 3it [00:00,  5.18it/s]


RMSE: 0.6913362741470337
PCIP: 16.513160705566406
MPIW: 5.199379920959473


Training epoch 19: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 68.30it/s]


Loss: 10731.622162103653


Evaluation: 3it [00:00,  5.61it/s]


RMSE: 0.679031252861023
PCIP: 16.625
MPIW: 5.188937664031982


Training epoch 20: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 72.73it/s]


Loss: 10711.437962770462


Evaluation: 3it [00:00,  5.62it/s]


RMSE: 0.6188263297080994
PCIP: 16.785720825195312
MPIW: 5.176839351654053


Training epoch 21: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.88it/s]


Loss: 10639.486311733723


Evaluation: 3it [00:00,  5.63it/s]


RMSE: 0.5731141567230225
PCIP: 16.93181610107422
MPIW: 5.16486930847168


Training epoch 22: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 65.43it/s]


Loss: 10654.403968691826


Evaluation: 3it [00:00,  5.46it/s]


RMSE: 0.6594889760017395
PCIP: 17.065216064453125
MPIW: 5.1579270362854


Training epoch 23: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.20it/s]


Loss: 10420.583797693253


Evaluation: 3it [00:00,  5.58it/s]


RMSE: 0.7056401371955872
PCIP: 17.18750762939453
MPIW: 5.148446559906006


Training epoch 24: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 68.89it/s]


Loss: 10342.406872451305


Evaluation: 3it [00:00,  5.66it/s]


RMSE: 0.6614208221435547
PCIP: 17.25000762939453
MPIW: 5.137234687805176


Training epoch 25: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.33it/s]


Loss: 10331.607665836811


Evaluation: 3it [00:00,  5.63it/s]


RMSE: 0.7024210095405579
PCIP: 17.35576629638672
MPIW: 5.131134510040283


Training epoch 26: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 70.13it/s]


Loss: 10330.885304629803


Evaluation: 3it [00:00,  5.69it/s]


RMSE: 0.6679789423942566
PCIP: 17.453704833984375
MPIW: 5.121960163116455


Training epoch 27: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 68.51it/s]


Loss: 10188.569781064987


Evaluation: 3it [00:00,  5.55it/s]


RMSE: 0.6344813704490662
PCIP: 17.5
MPIW: 5.113589286804199


Training epoch 28: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.77it/s]


Loss: 10171.442003369331


Evaluation: 3it [00:00,  5.59it/s]


RMSE: 0.6050661206245422
PCIP: 17.586204528808594
MPIW: 5.101521968841553


Training epoch 29: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.17it/s]


Loss: 10097.777797698975


Evaluation: 3it [00:00,  5.56it/s]


RMSE: 0.638148307800293
PCIP: 17.625
MPIW: 5.0913496017456055


Training epoch 30: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.09it/s]


Loss: 9971.630537033081


Evaluation: 3it [00:00,  5.50it/s]


RMSE: 0.5877673029899597
PCIP: 17.701614379882812
MPIW: 5.081319808959961


Training epoch 31: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 66.78it/s]


Loss: 9918.074712753296


Evaluation: 3it [00:00,  5.53it/s]


RMSE: 0.6977314949035645
PCIP: 17.7734375
MPIW: 5.071162700653076


Training epoch 32: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.19it/s]


Loss: 9984.40328913927


Evaluation: 3it [00:00,  5.51it/s]


RMSE: 0.630133867263794
PCIP: 17.840904235839844
MPIW: 5.060287952423096


Training epoch 33: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.73it/s]


Loss: 9894.96941524744


Evaluation: 3it [00:00,  5.66it/s]


RMSE: 0.6461842060089111
PCIP: 17.867645263671875
MPIW: 5.048527240753174


Training epoch 34: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.46it/s]


Loss: 9813.811757743359


Evaluation: 3it [00:00,  5.66it/s]


RMSE: 0.6525239944458008
PCIP: 17.928573608398438
MPIW: 5.037673473358154


Training epoch 35: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 70.41it/s]


Loss: 9702.005874156952


Evaluation: 3it [00:00,  5.65it/s]


RMSE: 0.631919801235199
PCIP: 17.951393127441406
MPIW: 5.026285171508789


Training epoch 36: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.82it/s]


Loss: 9658.27674806118


Evaluation: 3it [00:00,  5.61it/s]


RMSE: 0.6065350770950317
PCIP: 18.006759643554688
MPIW: 5.01479434967041


Training epoch 37: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.08it/s]


Loss: 9701.17451941967


Evaluation: 3it [00:00,  5.57it/s]


RMSE: 0.581710159778595
PCIP: 18.05921173095703
MPIW: 5.002559185028076


Training epoch 38: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 66.00it/s]


Loss: 9612.954359948635


Evaluation: 3it [00:00,  5.57it/s]


RMSE: 0.5528729557991028
PCIP: 18.108978271484375
MPIW: 4.991311073303223


Training epoch 39: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.12it/s]


Loss: 9581.457455515862


Evaluation: 3it [00:00,  5.59it/s]


RMSE: 0.622696578502655
PCIP: 18.15625
MPIW: 4.982608318328857


Training epoch 40: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.38it/s]


Loss: 9523.074344694614


Evaluation: 3it [00:00,  5.68it/s]


RMSE: 0.6202865242958069
PCIP: 18.201217651367188
MPIW: 4.9733710289001465


Training epoch 41: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.40it/s]


Loss: 9304.977566123009


Evaluation: 3it [00:00,  5.69it/s]


RMSE: 0.5972426533699036
PCIP: 18.21428680419922
MPIW: 4.960517883300781


Training epoch 42: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 69.02it/s]


Loss: 9190.135061979294


Evaluation: 3it [00:00,  5.60it/s]


RMSE: 0.5807090997695923
PCIP: 18.255813598632812
MPIW: 4.949870586395264


Training epoch 43: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 65.78it/s]


Loss: 9199.981912195683


Evaluation: 3it [00:00,  5.57it/s]


RMSE: 0.5996513962745667
PCIP: 18.267044067382812
MPIW: 4.940003871917725


Training epoch 44: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 68.87it/s]


Loss: 9138.406808316708


Evaluation: 3it [00:00,  5.67it/s]


RMSE: 0.5920960307121277
PCIP: 18.305557250976562
MPIW: 4.931490421295166


Training epoch 45: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.04it/s]


Loss: 9105.338749587536


Evaluation: 3it [00:00,  5.62it/s]


RMSE: 0.6800040602684021
PCIP: 18.315216064453125
MPIW: 4.919672012329102


Training epoch 46: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 53.90it/s]


Loss: 8998.472422599792


Evaluation: 3it [00:00,  5.54it/s]


RMSE: 0.6140491366386414
PCIP: 18.351058959960938
MPIW: 4.909765243530273


Training epoch 47: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 70.63it/s]


Loss: 9011.587351799011


Evaluation: 3it [00:00,  5.49it/s]


RMSE: 0.5873497128486633
PCIP: 18.35938262939453
MPIW: 4.898877143859863


Training epoch 48: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.81it/s]


Loss: 8986.11275601387


Evaluation: 3it [00:00,  5.65it/s]


RMSE: 0.6697556972503662
PCIP: 18.392852783203125
MPIW: 4.8877105712890625


Training epoch 49: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 11/11 [00:00<00:00, 67.62it/s]


Loss: 8822.7569039464


Evaluation: 3it [00:00,  5.61it/s]


RMSE: 0.6290941834449768
PCIP: 18.425003051757812
MPIW: 4.875285625457764


(BNNRegression(
   (model): PyroMLERegression(
     (activation): PyroReLU()
     (layer1): PyroLinear(in_features=12, out_features=40, bias=True)
     (layer3): PyroLinear(in_features=40, out_features=1, bias=True)
   )
 ),
 AutoDiagonalNormal())