In [1]:
import argparse
from box import Box
import yaml

import pytorch_lightning as pl
from pytorch_lightning import Trainer
from model_logreg_mvn import ModelLogisicRegressionMvn
from dataset_npz import DataModuleFromNPZ

import torch
import numpy as np

import matplotlib
import matplotlib.pyplot as plt
%matplotlib inline

# Load data

In [2]:
pl.seed_everything(2202)
dm = DataModuleFromNPZ(
    data_dir="data_logistic_regression_2d",
    feature_labels=["inputs", "targets"],
    batch_size=256,
    num_workers=4,
    shuffle_training=False
)

Global seed set to 2202


# Train or load a model

In [None]:
if True: # chose True to train and save a model within this notebook, switch back to False to evaluate
    dm.prepare_data()
    dm.setup(stage="fit")
    model_mvn = ModelLogisicRegressionMvn(
            2,
            dm.size_train(),
            scale_prior=10.0,
            optimizer_name="RMSprop", 
            optimizer_lr=0.1,
            save_path="runs/models/multivariate")
    trainer = Trainer(max_epochs=100)
    trainer.fit(model_mvn, dm)
    trainer.test(model_mvn, dm)
    model_mvn.eval()
        
else:
    dm.prepare_data()
    dm.setup(stage="fit")
    size_data_train = dm.size_train()
    
    SAVE_PATH = "runs/models/multivariate/loss_val-epoch=160-step=644.ckpt" # change this to your saved model in the same directory!!!
    model_mvn = ModelLogisicRegressionMvn.load_from_checkpoint(SAVE_PATH, size_data=size_data_train)
    dm.setup(stage="test")
    trainer = Trainer()
    trainer.test(model_mvn, dm)
    model_mvn.eval()


GPU available: False, used: False
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
HPU available: False, using: 0 HPUs


"dim":                2
"n_nodes_quadrature": 9
"n_samples_mc":       8
"optimizer_lr":       0.1
"optimizer_name":     RMSprop
"scale_prior":        10.0
"size_data":          1024


The following callbacks returned in `LightningModule.configure_callbacks` will override existing callbacks passed to Trainer: ModelCheckpoint
  rank_zero_warn(f"Checkpoint directory {dirpath} exists and is not empty.")

  | Name  | Type               | Params
---------------------------------------------
0 | logit | LikelihoodLogistic | 28    
---------------------------------------------
8         Trainable params
28        Non-trainable params
36        Total params
0.000     Total estimated model params size (MB)


                                                                                                                                                  

  rank_zero_warn(


Epoch 0: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.03s/it, v_num=3]
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                                                                              | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 71.43it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 83.35it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 92.08it/s][A
Epoch 0: 100%|███████████████████████████████████████████████████████

Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 55.82it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 70.56it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 77.39it/s][A
Epoch 7: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:11<00:00,  2.96s/it, v_num=3][A
Epoch 8: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.13s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                    

Epoch 15: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.10s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                                                                              | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 62.94it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 81.23it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 91.51it/s][A
Epoch 15: 100%|███████████████████████████████████████████████████

Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 49.36it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 65.92it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 77.31it/s][A
Epoch 22: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:09<00:00,  2.49s/it, v_num=3][A
Epoch 23: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.18s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                    

Epoch 30: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.07s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                                                                              | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 70.97it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 88.75it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 97.19it/s][A
Epoch 30: 100%|███████████████████████████████████████████████████

Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 74.07it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 91.39it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 88.90it/s][A
Epoch 37: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:08<00:00,  2.17s/it, v_num=3][A
Epoch 38: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.12s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                    

Epoch 45: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:05<00:00,  1.27s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                                                                              | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 46.48it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 64.47it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 68.85it/s][A
Epoch 45: 100%|███████████████████████████████████████████████████

Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 59.25it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 77.35it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 87.22it/s][A
Epoch 52: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:09<00:00,  2.33s/it, v_num=3][A
Epoch 53: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.13s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                    

Epoch 60: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.18s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                                                                              | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 57.11it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 78.26it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 77.77it/s][A
Epoch 60: 100%|███████████████████████████████████████████████████

Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 57.93it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 77.80it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 89.38it/s][A
Epoch 67: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:08<00:00,  2.20s/it, v_num=3][A
Epoch 68: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.10s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                    

Epoch 75: 100%|████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.22s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                           | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                                                                              | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:  25%|█████████████████████▌                                                                | 1/4 [00:00<00:00, 66.45it/s][A
Validation DataLoader 0:  50%|███████████████████████████████████████████                                           | 2/4 [00:00<00:00, 83.08it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████▌                     | 3/4 [00:00<00:00, 90.96it/s][A
Epoch 75: 100%|███████████████████████████████████████████████████

Validation DataLoader 0:   0%|                                                                                                   | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:  25%|██████████████████████▊                                                                    | 1/4 [00:00<00:00, 65.60it/s][A
Validation DataLoader 0:  50%|█████████████████████████████████████████████▌                                             | 2/4 [00:00<00:00, 84.56it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████████▎                      | 3/4 [00:00<00:00, 92.58it/s][A
Epoch 82: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:08<00:00,  2.21s/it, v_num=3][A
Epoch 83: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.08s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                   

Validation DataLoader 0:  50%|█████████████████████████████████████████████▌                                             | 2/4 [00:00<00:00, 83.60it/s][A
Validation DataLoader 0:  75%|████████████████████████████████████████████████████████████████████▎                      | 3/4 [00:00<00:00, 91.72it/s][A
Epoch 89: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:09<00:00,  2.35s/it, v_num=3][A
Epoch 90: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:04<00:00,  1.15s/it, v_num=3][A
Validation: 0it [00:00, ?it/s][A
Validation:   0%|                                                                                                                | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:   0%|                                                                                                   | 0/4 [00:00<?, ?it/s][A
Validation DataLoader 0:  25%|██████

# Load all training and testing data for plotting

In [None]:
dm_plotting = DataModuleFromNPZ(
    data_dir="data_logistic_regression_2d",
    feature_labels=["inputs", "targets"],
    batch_size=-1,
    num_workers=4,
    shuffle_training=False
)
dm_plotting.prepare_data()
dm_plotting.setup(stage="fit")
for f,l in dm_plotting.train_dataloader():
    features_train, labels_train = f, l
dm_plotting.setup(stage="test")
for f,l in dm_plotting.test_dataloader():
    features_test, labels_test = f, l

# Compute class probabilities for plotting

In [None]:
x, y = np.meshgrid(np.arange(-1.1,1.1,0.025), np.arange(-1.1,1.1,0.025))
features_plot = np.concatenate([x.reshape((-1,1)), y.reshape((-1,1))], axis=-1)
p_plot_mvn  = model_mvn(torch.tensor(features_plot, dtype=torch.float32)).detach().cpu().numpy().reshape(x.shape)
p_plot_diag = model_diag(torch.tensor(features_plot, dtype=torch.float32)).detach().cpu().numpy().reshape(x.shape)

# Plot

In [None]:
fig, ax = plt.subplots(1,2, figsize=(20,10))

Ip = np.argwhere(labels_train[:] > 0.5)
In = np.argwhere(labels_train[:] < 0.5)
ax[0].contourf(x, y, p_plot_mvn, 50, cmap=plt.get_cmap("gray"))
ax[0].plot(features_train[Ip,0], features_train[Ip,1], ".", color = "red")
ax[0].plot(features_train[In,0], features_train[In,1], ".", color = "blue")
ax[0].set_title("Multivariate model: Train data")

Ip = np.argwhere(labels_test[:] > 0.5)
In = np.argwhere(labels_test[:] < 0.5)
ax[1].contourf(x, y, p_plot_mvn, 50, cmap=plt.get_cmap("gray"))
ax[1].plot(features_test[Ip,0], features_test[Ip,1], ".", color = "red")
ax[1].plot(features_test[In,0], features_test[In,1], ".", color = "blue")
ax[1].set_title("Multivariate model: Test data")

fig, ax = plt.subplots(1,2, figsize=(20,10))

Ip = np.argwhere(labels_train[:] > 0.5)
In = np.argwhere(labels_train[:] < 0.5)
ax[0].contourf(x, y, p_plot_diag, 50, cmap=plt.get_cmap("gray"))
ax[0].plot(features_train[Ip,0], features_train[Ip,1], ".", color = "red")
ax[0].plot(features_train[In,0], features_train[In,1], ".", color = "blue")
ax[0].set_title("Diagonal model: Train data")

Ip = np.argwhere(labels_test[:] > 0.5)
In = np.argwhere(labels_test[:] < 0.5)
ax[1].contourf(x, y, p_plot_diag, 50, cmap=plt.get_cmap("gray"))
ax[1].plot(features_test[Ip,0], features_test[Ip,1], ".", color = "red")
ax[1].plot(features_test[In,0], features_test[In,1], ".", color = "blue")
ax[1].set_title("Diagonal model: Test data")



# Print model parameters

In [None]:
print("Learned distribution parameters")
print("weights mean")
print(model_mvn.weights_loc.detach().cpu().numpy())
print("weights covariance")
L = model_mvn.weights_chol().detach().cpu().numpy()
print(np.matmul(L,L.T))


print("Learned distribution parameters")
print("weights mean")
print(model_diag.weights_loc.detach().cpu().numpy())
print("weights covariance")
L = model_diag.weights_chol().detach().cpu().numpy()
print(np.matmul(L,L.T))

# Plot Bayesian  posterior distribution of weights

In [None]:
def log_prob_sigma(label_sign, features, w):
    z = label_sign*np.sum(features.reshape((1,-1))*w, axis=-1)
    #return np.abs(z) - np.log(1+np.exp(-z-np.abs(z)))
    return -np.log(1 + np.exp(-z))
    
w1, w2 = np.meshgrid(np.linspace(-3*model_diag.scale_prior,3*model_diag.scale_prior, 101),
                     np.linspace(-3*model_diag.scale_prior,3*model_diag.scale_prior, 101))
shape_mesh = w1.shape

w_plot = np.concatenate([w1.reshape((-1,1)), w2.reshape((-1,1))], axis=-1)
log_prob_prior = -0.5*np.sum((w_plot)**2, axis=-1)/(model_diag.scale_prior**2)
log_prob_prior = log_prob_prior - 0.5*2.0*np.log(2*np.pi) - 0.5*2.0*2.0*np.log(model_diag.scale_prior)

#fig, ax = plt.subplots(1,3, figsize=(20,10))
log_prob_current = log_prob_prior.reshape(shape_mesh)
for i, (feature, label) in enumerate(zip(features_train.cpu().numpy(), labels_train.cpu().numpy())):
    log_prob_likelihood = log_prob_sigma(2*label-1,feature, w_plot).reshape(shape_mesh)
    
    if i < 10:
        plot_on = True
    elif i % 100 == 0:
        plot_on = True
    else:
        plot_on = False
    
    if plot_on:
        fig, ax = plt.subplots(1,3, figsize=(24,8))
        ax[0].contourf(w1, w2, log_prob_current, 50, cmap=plt.get_cmap("gray"))
        ax[1].contourf(w1, w2, log_prob_likelihood, 50, cmap=plt.get_cmap("gray"))
        ax[2].contourf(w1, w2, log_prob_current + log_prob_likelihood, 50, cmap=plt.get_cmap("gray"))
        ax[0].set_title(f"size_data: {i}")
    
    log_prob_current = log_prob_current +  log_prob_likelihood 
    

    

# Plot posterior distribuion vs approximation

In [None]:
import scipy as sp

w_loc = model_mvn.weights_loc.detach().cpu().numpy().reshape((1,-1))
L     = model_mvn.weights_chol().detach().cpu().numpy()

log_prob_approx_mvn = -0.5*np.sum(np.matmul(w_plot-w_loc, np.linalg.inv(L).T)**2, axis=-1)
log_prob_approx_mvn = log_prob_approx_mvn - 0.5*2.0*np.log(2*np.pi) - 0.5*2.0*np.sum(np.log(np.diag(L)))


w_loc = model_diag.weights_loc.detach().cpu().numpy().reshape((1,-1))
L_diag = torch.exp(model_diag.weights_scale_logdiag).detach().cpu().numpy().reshape((1,-1))

log_prob_approx_diag = -0.5*np.sum(((w_plot-w_loc)/L_diag)**2, axis=-1)
log_prob_approx_diag = log_prob_approx_diag - 0.5*2.0*np.log(2*np.pi) - 0.5*2.0*np.sum(np.log(L_diag))

if True:
    dw = (w1[0,1] - w1[0,0])*(w2[1,0] - w2[0,0])
    log_prob_approx_mvn  = log_prob_approx_mvn - sp.special.logsumexp(log_prob_approx_mvn + np.log(dw))
    log_prob_approx_diag = log_prob_approx_diag - sp.special.logsumexp(log_prob_approx_diag + np.log(dw))
    log_prob_current     = log_prob_current - sp.special.logsumexp(log_prob_current + np.log(dw))
    
 
fig, ax = plt.subplots(2,2, figsize=(20,10))
ax[0,0].contourf(w1, w2, log_prob_current, 50, cmap=plt.get_cmap("gray"))
ax[0,0].set_title("Bayesian postrior")
ax[0,1].contourf(w1, w2, log_prob_approx_mvn.reshape(w1.shape), 50, cmap=plt.get_cmap("gray"))
ax[0,1].set_title("Mulrivariate approximation")
ax[1,1].contourf(w1, w2, log_prob_approx_diag.reshape(w1.shape), 50, cmap=plt.get_cmap("gray")) 
ax[1,1].set_title("Diagonal approximation")
