# Compute metrics for different runs and plot them
##### author: Elizabeth A. Barnes, Randal J. Barnes and Mark DeMaria
##### version: v0.2.0

In [1]:
import datetime
import os
import pickle
import pprint
import time

import experiment_settings
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf
import shash
from build_data import build_hurricane_data
import build_model
import model_diagnostics
from silence_tensorflow import silence_tensorflow
import prediction
from sklearn.neighbors import KernelDensity
import pandas as pd
from tqdm import tqdm

import warnings
warnings.filterwarnings("ignore")

silence_tensorflow()
dpiFig = 400

mpl.rcParams["figure.facecolor"] = "white"
mpl.rcParams["figure.dpi"] = 150
np.warnings.filterwarnings("ignore", category=np.VisibleDeprecationWarning)

In [2]:
__author__  = "Randal J Barnes and Elizabeth A. Barnes"
__version__ = "16 March 2022"

EXP_NAME_LIST = (
    # "intensity1_AL48",
    # "intensity2_AL72",
    # "intensity3_AL96",    
    # "intensity4_EPCP48",
    # "intensity5_EPCP72",
    # "intensity6_EPCP96",
    "intensity41_EPCP48",
    "intensity42_EPCP48",    
)

OVERWRITE_METRICS = False
DATA_PATH = "data/"
MODEL_PATH = "saved_models/"
METRIC_PATH = "saved_metrics/"
FIGURE_PATH = "figures/summary_plots/"

## Define get_metrics()

In [3]:
def get_metrics(x_test, onehot_test):
    tf.random.set_seed(network_seed)
    shash_incs = np.arange(-160,161,1)

    if settings["uncertainty_type"] in ("bnn", "mcdrop", "reg"):       
        # loop through runs for bnn calculation    
        runs = 5_000
        bins_plot = np.linspace(np.min(shash_incs), np.max(shash_incs), 1000)
        bnn_cpd = np.zeros((np.shape(x_test)[0],runs))
        bnn_mode = np.zeros((np.shape(x_test)[0],))

        for i in tqdm(range(0,runs)):
            if settings["uncertainty_type"] == "bnn":
                bnn_cpd[:,i] = np.reshape(model.predict(x_test),np.shape(bnn_cpd)[0])
            elif settings["uncertainty_type"] in ("mcdrop", "reg"):
                bnn_cpd[:,i] = np.reshape(model(x_test,training=True),np.shape(bnn_cpd)[0])                
            else:
                raise NotImplementedError
                
        bnn_mean = np.mean(bnn_cpd,axis=1)
        bnn_median = np.median(bnn_cpd,axis=1)

        for j in tqdm(range(0,np.shape(bnn_mode)[0])):
            kde = KernelDensity(kernel="gaussian", bandwidth=4.).fit(bnn_cpd[j,:].reshape(-1,1))
            log_dens = kde.score_samples(bins_plot.reshape(-1,1))
            i = np.argmax(log_dens)
            bnn_mode[j] = bins_plot[i]

        mean_error, median_error, mode_error = model_diagnostics.compute_errors(onehot_test, bnn_mean, bnn_median, bnn_mode)         
        bins, hist_bnn, pit_D, EDp_bnn = model_diagnostics.compute_pit('bnn',onehot_test, bnn_cpd)
        iqr_capture = model_diagnostics.compute_interquartile_capture('bnn',onehot_test, bnn_cpd)
        iqr_error_spearman, iqr_error_pearson = model_diagnostics.compute_iqr_error_corr('bnn',
                                                                                          onehot_data=onehot_test, 
                                                                                          bnn_cpd=bnn_cpd, 
                                                                                          pred_median=bnn_median,
                                                                                         )
        
    elif settings["uncertainty_type"] in ("shash","shash2", "shash3", "shash4"):         
        shash_cpd = np.zeros((np.shape(x_test)[0],len(shash_incs)))
        shash_mean = np.zeros((np.shape(x_test)[0],))
        shash_med = np.zeros((np.shape(x_test)[0],))
        shash_mode = np.zeros((np.shape(x_test)[0],))

        # loop through samples for shash calculation and get PDF for each sample
        for j in tqdm(range(0,np.shape(shash_cpd)[0])):
            mu_pred, sigma_pred, gamma_pred, tau_pred = prediction.params( x_test[np.newaxis,j], model )
            shash_cpd[j,:] = shash.prob(shash_incs, mu_pred, sigma_pred, gamma_pred, tau_pred)    
            shash_mean[j]  = shash.mean(mu_pred,sigma_pred,gamma_pred,tau_pred)#np.sum(shash_cpd[j,:]*shash_incs)
            shash_med[j]   = shash.median(mu_pred,sigma_pred,gamma_pred,tau_pred)

            i = np.argmax(shash_cpd[j,:])
            shash_mode[j]  = shash_incs[i]

        mean_error, median_error, mode_error = model_diagnostics.compute_errors(onehot_test, shash_mean, shash_med, shash_mode)    
        bins, hist_shash, pit_D, EDp_shash = model_diagnostics.compute_pit('shash',onehot_test, x_data=x_test,model_shash=model)
        iqr_capture = model_diagnostics.compute_interquartile_capture('shash',onehot_test, x_data=x_test,model_shash=model)
        iqr_error_spearman, iqr_error_pearson = model_diagnostics.compute_iqr_error_corr('shash',
                                                                                                onehot_data=onehot_test,
                                                                                                pred_median=shash_med,
                                                                                                x_data=x_test,
                                                                                                model_shash=model,
                                                                                               )
    else:
        raise NotImplementedError
        
    # by definition Consensus is a correction of zero
    cons_error = np.mean(np.abs(0.0 - onehot_test[:,0]))
    
    # write metrics dictionary and return
    metrics = {
        'pit_D': pit_D,
        'iqr_capture': iqr_capture,
        
        'iqr_error_spearman': iqr_error_spearman[0],
        'iqr_error_pearson': iqr_error_pearson[0],
        'iqr_error_spearman_p': iqr_error_spearman[1],
        'iqr_error_pearson_p': iqr_error_pearson[1],

        'cons_error': cons_error,
        'mean_error':mean_error, 
        'median_error': median_error,
        'mode_error': mode_error,        
        
        'mean_error_reduction': cons_error - mean_error,
        'median_error_reduction': cons_error - median_error,
        'mode_error_reduction': cons_error - mode_error,
    }
        
    return metrics


## Compute Metrics

In [4]:
import imp
imp.reload(model_diagnostics)

for exp_name in EXP_NAME_LIST:
    settings = experiment_settings.get_settings(exp_name)
    RNG_SEED_LIST = np.copy(settings['rng_seed'])

    for rng_seed in RNG_SEED_LIST:
        settings['rng_seed'] = rng_seed
        NETWORK_SEED_LIST = [settings["rng_seed"]]
        network_seed = NETWORK_SEED_LIST[0]
        tf.random.set_seed(network_seed)  # This sets the global random seed.    

        #----------------------------------------------------------------------------------------------------
        # get the data
        (
            data_summary,        
            x_train,
            onehot_train,
            x_val,
            onehot_val,
            x_test,
            onehot_test,        
            x_valtest,
            onehot_valtest,
            df_train,
            df_val,
            df_test,
            df_valtest,
        ) = build_hurricane_data(DATA_PATH, settings, verbose=0)

        #----------------------------------------------------------------------------------------------------
        # get the model
        # Make, compile, and train the model
        tf.keras.backend.clear_session()            
        model = build_model.make_model(
            settings,
            x_train,
            onehot_train,
            model_compile=False,
        )   
        model_name = (
            exp_name + "_" + 
            settings["uncertainty_type"] + '_' + 
            f"network_seed_{network_seed}_rng_seed_{settings['rng_seed']}"
        )
        
        try:
            model.load_weights(MODEL_PATH + model_name + "_weights.h5")
        except:
            print(model_name + ': model does not exist. skipping...')
            continue

        #----------------------------------------------------------------------------------------------------
        # check if the metric filename exists already
        metric_filename = METRIC_PATH + model_name + '_metrics.pkl'              
        if (os.path.exists(metric_filename) and OVERWRITE_METRICS==False):
            # print(metric_filename + ' exists. Skipping...')
            continue
            
        # get metrics and put into a dictionary
        pprint.pprint(model_name)
                
        # compute the metrics
        metrics_test = get_metrics(x_test, onehot_test)
        metrics_val = get_metrics(x_val, onehot_val)
        metrics_train = get_metrics(x_train, onehot_train)
        metrics_valtest = get_metrics(x_valtest, onehot_valtest)
        
        # create the metrics dataframe
        d = {}
        d['uncertainty_type'] = settings["uncertainty_type"]
        d['network_seed'] = network_seed
        d['rng_seed'] = settings['rng_seed']
        d['exp_name'] = exp_name
        
        for k in metrics_test.keys():
            k_key = k + '_test'            
            d[k_key] = metrics_test[k]
        for k in metrics_val.keys():
            k_key = k + '_val'
            d[k_key] = metrics_val[k]
        for k in metrics_train.keys():
            k_key = k + '_train'
            d[k_key] = metrics_train[k]            
        for k in metrics_valtest.keys():
            k_key = k + '_valtest'
            d[k_key] = metrics_valtest[k]
            
        # save the dataframe    
        # pprint.pprint(d, width=80)  
        df = pd.DataFrame(data=d, index=[0])
        df.to_pickle(metric_filename)

'intensity41_EPCP48_bnn_network_seed_187_rng_seed_187'


100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:06<00:00, 74.93it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:08<00:00, 14.41it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:11<00:00, 70.27it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.41it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [02:16<00:00, 36.53it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [02:06<00:00, 14.23it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:10<00:00, 70.71it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:22<00:00, 14.46it/s]


'intensity41_EPCP48_bnn_network_seed_650_rng_seed_650'


100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:06<00:00, 74.71it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:08<00:00, 14.33it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:10<00:00, 70.65it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.03it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [02:17<00:00, 36.49it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [02:06<00:00, 14.23it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:08<00:00, 72.61it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:22<00:00, 14.19it/s]


'intensity41_EPCP48_bnn_network_seed_891_rng_seed_891'


100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:06<00:00, 74.63it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:08<00:00, 14.36it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:11<00:00, 70.24it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.18it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [02:16<00:00, 36.50it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [02:06<00:00, 14.20it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:11<00:00, 70.38it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:22<00:00, 14.21it/s]


'intensity41_EPCP48_bnn_network_seed_739_rng_seed_739'


100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:07<00:00, 74.33it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:08<00:00, 14.36it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:11<00:00, 69.95it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:14<00:00, 14.12it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [02:17<00:00, 36.48it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [02:06<00:00, 14.20it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:11<00:00, 70.36it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:22<00:00, 14.21it/s]


'intensity41_EPCP48_bnn_network_seed_241_rng_seed_241'


100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:07<00:00, 74.23it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:08<00:00, 14.29it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:11<00:00, 70.36it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:13<00:00, 14.35it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [02:16<00:00, 36.51it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [02:06<00:00, 14.23it/s]
100%|████████████████████████████████████████████████████████████████████| 5000/5000 [01:10<00:00, 70.55it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:22<00:00, 14.40it/s]


'intensity42_EPCP48_mcdrop_network_seed_416_rng_seed_416'


100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1564.37it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:11<00:00, 10.06it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1474.63it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:18<00:00, 10.69it/s]
100%|███████████████████████████████████████████████████████████████████| 5000/5000 [00:08<00:00, 619.87it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [02:55<00:00, 10.24it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:04<00:00, 1248.92it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:30<00:00, 10.46it/s]


'intensity42_EPCP48_mcdrop_network_seed_222_rng_seed_222'


100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1570.07it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:15<00:00,  7.91it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1473.11it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.23it/s]
100%|███████████████████████████████████████████████████████████████████| 5000/5000 [00:07<00:00, 652.50it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [03:42<00:00,  8.10it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:04<00:00, 1240.80it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:39<00:00,  8.15it/s]


'intensity42_EPCP48_mcdrop_network_seed_598_rng_seed_598'


100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1579.42it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:15<00:00,  7.78it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1475.49it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:24<00:00,  8.00it/s]
100%|███████████████████████████████████████████████████████████████████| 5000/5000 [00:08<00:00, 559.46it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [03:42<00:00,  8.10it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:04<00:00, 1247.60it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:40<00:00,  7.86it/s]


'intensity42_EPCP48_mcdrop_network_seed_731_rng_seed_731'


100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1584.56it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:12<00:00,  9.72it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1485.69it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.07it/s]
100%|███████████████████████████████████████████████████████████████████| 5000/5000 [00:08<00:00, 575.20it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [02:57<00:00, 10.14it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1254.58it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:32<00:00,  9.96it/s]


'intensity42_EPCP48_mcdrop_network_seed_414_rng_seed_414'


100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1586.21it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:14<00:00,  8.31it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1493.94it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:23<00:00,  8.39it/s]
100%|███████████████████████████████████████████████████████████████████| 5000/5000 [00:08<00:00, 597.95it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [03:33<00:00,  8.43it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1256.25it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:38<00:00,  8.36it/s]


'intensity42_EPCP48_mcdrop_network_seed_187_rng_seed_187'


100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1584.27it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:12<00:00,  9.82it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1488.15it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:19<00:00, 10.03it/s]
100%|███████████████████████████████████████████████████████████████████| 5000/5000 [00:08<00:00, 580.89it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [02:57<00:00, 10.15it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1260.63it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:32<00:00,  9.88it/s]


'intensity42_EPCP48_mcdrop_network_seed_650_rng_seed_650'


100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1574.43it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:13<00:00,  9.09it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1488.32it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.53it/s]
100%|███████████████████████████████████████████████████████████████████| 5000/5000 [00:08<00:00, 559.09it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [03:11<00:00,  9.42it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:04<00:00, 1241.80it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:34<00:00,  9.35it/s]


'intensity42_EPCP48_mcdrop_network_seed_891_rng_seed_891'


100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1585.18it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:14<00:00,  8.13it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1492.06it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:23<00:00,  8.48it/s]
100%|███████████████████████████████████████████████████████████████████| 5000/5000 [00:08<00:00, 573.30it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [03:32<00:00,  8.47it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:04<00:00, 1249.53it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:38<00:00,  8.38it/s]


'intensity42_EPCP48_mcdrop_network_seed_739_rng_seed_739'


100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1579.43it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:13<00:00,  9.16it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1491.00it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.67it/s]
100%|███████████████████████████████████████████████████████████████████| 5000/5000 [00:08<00:00, 566.06it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [03:11<00:00,  9.41it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1268.72it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:33<00:00,  9.46it/s]


'intensity42_EPCP48_mcdrop_network_seed_241_rng_seed_241'


100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1600.75it/s]
100%|██████████████████████████████████████████████████████████████████████| 120/120 [00:12<00:00,  9.78it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1511.76it/s]
100%|██████████████████████████████████████████████████████████████████████| 200/200 [00:20<00:00,  9.78it/s]
100%|███████████████████████████████████████████████████████████████████| 5000/5000 [00:08<00:00, 592.50it/s]
100%|████████████████████████████████████████████████████████████████████| 1800/1800 [03:00<00:00,  9.95it/s]
100%|██████████████████████████████████████████████████████████████████| 5000/5000 [00:03<00:00, 1263.12it/s]
100%|██████████████████████████████████████████████████████████████████████| 320/320 [00:32<00:00,  9.77it/s]
