In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
from collections import defaultdict
import functools
import itertools
import pprint

import orbax.checkpoint
import numpy as np
import jax
import jax.numpy as jnp
import torch.utils.data.dataloader
import tensorflow as tf
import sqlalchemy as sa
import seaborn as sns
sns.set_theme(style='whitegrid', font_scale=1.3, palette=sns.color_palette('husl'),)
import pandas as pd
import matplotlib.pyplot as plt
from tqdm import tqdm

from userdiffusion import samplers, unet
from userfm import cs, datasets, event_constraints, diffusion, sde_diffusion, flow_matching, utils, main as main_module, plots

2025-01-30 03:13:58.966942: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:477] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
E0000 00:00:1738206838.994247   35023 cuda_dnn.cc:8310] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
E0000 00:00:1738206839.002662   35023 cuda_blas.cc:1418] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
  from .autonotebook import tqdm as notebook_tqdm


In [3]:
# somehow, this line of code prevents a segmentation fault in nn.Dense
# when calling model.init
tf.config.experimental.set_visible_devices([], 'GPU')

In [4]:
engine = cs.get_engine()
cs.create_all(engine)
session = cs.orm.Session(engine)
session.begin()

<sqlalchemy.orm.session.SessionTransaction at 0x7f7a5e6a6600>

In [5]:
config_alt_ids = {
    # Lorenz
    # ('0y35hp7d', 'DM'): {},
    # ('3bjjfgwa', 'FM'): {'sample': {'use_score': True}},
    # ('c0ijllm1', 'FM+Reg'): {'sample': {'use_score': True}},
    # FitzHughNagumo
    ('jzke0dh6', 'DM'): {}, # jzke0dh6, epoch_1999, false, cs.DatasetFitzHughNagumo
    ('trauw532', 'FM'): {'sample': {'use_score': True}}, # trauw532, epoch_1999, false, cs.DatasetFitzHughNagumo
    ('7io88gsu', 'FM+Reg'): {'sample': {'use_score': True}}, # 7io88gsu, epoch_1999, false, cs.DatasetFitzHughNagumo
}

In [6]:
cfgs = session.execute(sa.select(cs.Config).where(cs.Config.alt_id.in_([c[0] for c in config_alt_ids])))
cfgs = {c.alt_id: c for (c,) in cfgs}
reference_cfg = cfgs[next(iter(cfgs.keys()))]
cfg_info = {}
for k in config_alt_ids:
    cfg = cfgs[k[0]]
    assert cfg.rng_seed == reference_cfg.rng_seed
    assert cfg.dataset == reference_cfg.dataset
    cfg_info[k] = dict(
        cfg=cfg,
    )

In [7]:
key = jax.random.key(reference_cfg.rng_seed)

In [8]:
key, key_dataset = jax.random.split(key)
reference_cfg.dataset.batch_count_test = 64
ds = datasets.get_dataset(reference_cfg.dataset, key=key_dataset)
splits = datasets.split_dataset(reference_cfg.dataset, ds)
dataloaders = {}
for n, s in splits.items():
    dataloaders[n] = torch.utils.data.dataloader.DataLoader(
        list(tf.data.Dataset.from_tensor_slices(s).batch(reference_cfg.dataset.batch_size).as_numpy_iterator()),
        batch_size=1,
        collate_fn=lambda x: x[0],
    )
data_std = splits['train'].std()

100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6450/6450 [21:00<00:00,  5.12it/s]


In [9]:
orbax_checkpointer = orbax.checkpoint.PyTreeCheckpointer()
x_sample = next(iter(dataloaders['train']))
ckpt_name = 'epoch_1999'

for info in cfg_info.values():
    cfg = info['cfg']
    assert cfg.rng_seed == reference_cfg.rng_seed
    assert cfg.dataset == reference_cfg.dataset

    cfg_unet = unet.unet_64_config(
        splits['train'].shape[-1],
        base_channels=cfg.model.architecture.base_channel_count,
        attention=cfg.model.architecture.attention,
    )
    model = unet.UNet(cfg_unet)
    
    key, key_jaxlightning = jax.random.split(key)
    if isinstance(cfg.model, cs.ModelDiffusion):
        jax_lightning = diffusion.JaxLightning(cfg, key_jaxlightning, dataloaders, data_std, None, model)
    elif isinstance(cfg.model, cs.ModelFlowMatching):
        jax_lightning = flow_matching.JaxLightning(cfg, key_jaxlightning, dataloaders, data_std, None, model)
    else:
        raise ValueError(f'Unknown model: {cfg.model}')
        
    jax_lightning.params = orbax_checkpointer.restore(cfg.run_dir/ckpt_name)
    jax_lightning.params_ema = orbax_checkpointer.restore(cfg.run_dir/f'{ckpt_name}_ema')

    info['jax_lightning'] = jax_lightning



In [10]:
constraint = event_constraints.get_event_constraint(cfg.dataset)

In [11]:
nlls = defaultdict(lambda: defaultdict(list))
for (config_alt_id, source), info in cfg_info.items():
    # use same key for each model
    _, key_nll = jax.random.split(key)
    for batch in tqdm(dataloaders['test']):
        key_nll, key_nll_batch = jax.random.split(key_nll)
        if isinstance(info['cfg'].model, cs.ModelFlowMatching):
            x_noise, nll_no_div, nll = info['jax_lightning'].compute_nll(key_nll_batch, 1., batch, **config_alt_ids[k]['sample'])
        else:
            x_noise, nll_no_div, nll = info['jax_lightning'].compute_nll(key_nll_batch, 1., batch)
        nlls[(config_alt_id, source)]['nll_no_div'].append(nll_no_div)
        nlls[(config_alt_id, source)]['nll'].append(nll)

  0%|                                                                                                                                                                                                                                                          | 0/64 [00:00<?, ?it/s]

xf std 70.22528076171875 and std_max: 300.0


  3%|███████▌                                                                                                                                                                                                                                          | 2/64 [01:43<52:45, 51.06s/it]

xf std 74.07532501220703 and std_max: 300.0


  5%|███████████▎                                                                                                                                                                                                                                      | 3/64 [02:31<50:39, 49.83s/it]

xf std 72.88363647460938 and std_max: 300.0


  6%|███████████████▏                                                                                                                                                                                                                                  | 4/64 [03:20<49:14, 49.24s/it]

xf std 71.77883911132812 and std_max: 300.0


  8%|██████████████████▉                                                                                                                                                                                                                               | 5/64 [04:08<47:58, 48.79s/it]

xf std 74.27108764648438 and std_max: 300.0


  9%|██████████████████████▋                                                                                                                                                                                                                           | 6/64 [04:55<46:47, 48.40s/it]

xf std 73.96844482421875 and std_max: 300.0


 11%|██████████████████████████▍                                                                                                                                                                                                                       | 7/64 [05:42<45:21, 47.75s/it]

xf std 71.61772155761719 and std_max: 300.0


 12%|██████████████████████████████▎                                                                                                                                                                                                                   | 8/64 [06:28<44:12, 47.37s/it]

xf std 74.14404296875 and std_max: 300.0


 14%|██████████████████████████████████                                                                                                                                                                                                                | 9/64 [07:14<42:58, 46.87s/it]

xf std 71.82096862792969 and std_max: 300.0


 16%|█████████████████████████████████████▋                                                                                                                                                                                                           | 10/64 [08:01<42:17, 47.00s/it]

xf std 71.85791015625 and std_max: 300.0


 17%|█████████████████████████████████████████▍                                                                                                                                                                                                       | 11/64 [08:48<41:34, 47.07s/it]

xf std 71.61241149902344 and std_max: 300.0


 19%|█████████████████████████████████████████████▏                                                                                                                                                                                                   | 12/64 [09:36<40:59, 47.29s/it]

xf std 86.2186508178711 and std_max: 300.0


 20%|████████████████████████████████████████████████▉                                                                                                                                                                                                | 13/64 [10:25<40:33, 47.72s/it]

xf std 74.12003326416016 and std_max: 300.0


 22%|████████████████████████████████████████████████████▋                                                                                                                                                                                            | 14/64 [11:12<39:37, 47.54s/it]

xf std 73.4232406616211 and std_max: 300.0


 23%|████████████████████████████████████████████████████████▍                                                                                                                                                                                        | 15/64 [12:00<38:50, 47.57s/it]

xf std 73.73075103759766 and std_max: 300.0


 25%|████████████████████████████████████████████████████████████▎                                                                                                                                                                                    | 16/64 [12:47<38:05, 47.62s/it]

xf std 70.26171875 and std_max: 300.0


 27%|████████████████████████████████████████████████████████████████                                                                                                                                                                                 | 17/64 [13:36<37:26, 47.79s/it]

xf std 73.88910675048828 and std_max: 300.0


 28%|███████████████████████████████████████████████████████████████████▊                                                                                                                                                                             | 18/64 [14:23<36:30, 47.63s/it]

xf std 70.24373626708984 and std_max: 300.0


 30%|███████████████████████████████████████████████████████████████████████▌                                                                                                                                                                         | 19/64 [15:11<35:48, 47.76s/it]

xf std 70.95075225830078 and std_max: 300.0


 31%|███████████████████████████████████████████████████████████████████████████▎                                                                                                                                                                     | 20/64 [16:00<35:18, 48.14s/it]

xf std 72.40174102783203 and std_max: 300.0


 33%|███████████████████████████████████████████████████████████████████████████████                                                                                                                                                                  | 21/64 [16:47<34:20, 47.91s/it]

xf std 72.1256103515625 and std_max: 300.0


 34%|██████████████████████████████████████████████████████████████████████████████████▊                                                                                                                                                              | 22/64 [17:37<33:57, 48.52s/it]

xf std 73.83699035644531 and std_max: 300.0


 36%|██████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                          | 23/64 [18:25<33:03, 48.37s/it]

xf std 73.29657745361328 and std_max: 300.0


 38%|██████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                      | 24/64 [19:13<32:05, 48.14s/it]

xf std 72.83537292480469 and std_max: 300.0


 39%|██████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                  | 25/64 [20:03<31:36, 48.64s/it]

xf std 69.63021087646484 and std_max: 300.0


 41%|█████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                               | 26/64 [20:51<30:42, 48.49s/it]

xf std 72.29289245605469 and std_max: 300.0


 42%|█████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                           | 27/64 [21:38<29:36, 48.01s/it]

xf std 72.2069320678711 and std_max: 300.0


 44%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                       | 28/64 [22:25<28:38, 47.74s/it]

xf std 76.44893646240234 and std_max: 300.0


 45%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                   | 29/64 [23:12<27:44, 47.57s/it]

xf std 76.86505126953125 and std_max: 300.0


 47%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                | 30/64 [24:01<27:07, 47.88s/it]

xf std 70.1072998046875 and std_max: 300.0


 48%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                            | 31/64 [24:48<26:16, 47.76s/it]

xf std 72.1590805053711 and std_max: 300.0


 50%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                        | 32/64 [25:35<25:15, 47.35s/it]

xf std 85.25033569335938 and std_max: 300.0


 52%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                    | 33/64 [26:22<24:32, 47.51s/it]

xf std 75.59387969970703 and std_max: 300.0


 53%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                 | 34/64 [27:11<23:59, 47.97s/it]

xf std 74.04283142089844 and std_max: 300.0


 55%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                             | 35/64 [28:01<23:21, 48.32s/it]

xf std 71.77711486816406 and std_max: 300.0


 56%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                         | 36/64 [28:49<22:29, 48.21s/it]

xf std 75.75042724609375 and std_max: 300.0


 58%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                     | 37/64 [29:37<21:47, 48.43s/it]

xf std 73.31507873535156 and std_max: 300.0


 59%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                  | 38/64 [30:24<20:45, 47.92s/it]

xf std 73.52549743652344 and std_max: 300.0


 61%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                              | 39/64 [31:11<19:46, 47.47s/it]

xf std 72.28459930419922 and std_max: 300.0


 62%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                          | 40/64 [31:57<18:53, 47.22s/it]

xf std 71.66193389892578 and std_max: 300.0


 64%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                      | 41/64 [32:46<18:18, 47.76s/it]

xf std 74.83935546875 and std_max: 300.0


 66%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 42/64 [33:34<17:31, 47.80s/it]

xf std 71.40079498291016 and std_max: 300.0


 67%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                               | 43/64 [34:21<16:37, 47.50s/it]

xf std 74.15164184570312 and std_max: 300.0


 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                           | 44/64 [35:09<15:55, 47.79s/it]

xf std 72.7043228149414 and std_max: 300.0


 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                       | 45/64 [35:57<15:09, 47.87s/it]

xf std 76.62957000732422 and std_max: 300.0


 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                   | 46/64 [36:46<14:23, 47.95s/it]

xf std 71.76721954345703 and std_max: 300.0


 73%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                | 47/64 [37:33<13:33, 47.87s/it]

xf std 74.98538970947266 and std_max: 300.0


 75%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                            | 48/64 [38:22<12:48, 48.04s/it]

xf std 72.36785125732422 and std_max: 300.0


 77%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                        | 49/64 [39:10<12:02, 48.19s/it]

xf std 74.51898193359375 and std_max: 300.0


 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                    | 50/64 [39:57<11:09, 47.83s/it]

xf std 72.78501892089844 and std_max: 300.0


 80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                 | 51/64 [40:45<10:21, 47.79s/it]

xf std 71.39997863769531 and std_max: 300.0


 81%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                             | 52/64 [41:32<09:31, 47.62s/it]

xf std 74.11803436279297 and std_max: 300.0


 83%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                         | 53/64 [42:20<08:44, 47.70s/it]

xf std 71.78073120117188 and std_max: 300.0


 84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                     | 54/64 [43:08<07:58, 47.83s/it]

xf std 72.95416259765625 and std_max: 300.0


 86%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                  | 55/64 [43:56<07:10, 47.81s/it]

xf std 73.7789077758789 and std_max: 300.0


 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                              | 56/64 [44:43<06:20, 47.58s/it]

xf std 73.1640853881836 and std_max: 300.0


 89%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 57/64 [45:30<05:31, 47.32s/it]

xf std 76.65107727050781 and std_max: 300.0


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                      | 58/64 [46:17<04:44, 47.43s/it]

xf std 78.8259506225586 and std_max: 300.0


 92%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                  | 59/64 [47:04<03:55, 47.14s/it]

xf std 72.083740234375 and std_max: 300.0


 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉               | 60/64 [47:52<03:09, 47.42s/it]

xf std 73.5163803100586 and std_max: 300.0


 95%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋           | 61/64 [48:41<02:23, 47.91s/it]

xf std 68.40653228759766 and std_max: 300.0


 97%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍       | 62/64 [49:29<01:35, 47.90s/it]

xf std 75.61605834960938 and std_max: 300.0


 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏   | 63/64 [50:16<00:47, 47.60s/it]

xf std 82.04244995117188 and std_max: 300.0


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 64/64 [51:04<00:00, 47.88s/it]


xf std 80.90313720703125 and std_max: 300.0


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 64/64 [46:10<00:00, 43.29s/it]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 64/64 [42:01<00:00, 39.40s/it]


In [12]:
nlls_concat = defaultdict(dict)
for k, out in nlls.items():
    for kk, arr in out.items():
        nlls_concat[k][kk] = jnp.concat(arr)
    print(f"{k=}, NLL={nlls_concat[k]['nll'].mean():.3f}")

k=('jzke0dh6', 'DM'), NLL=-7.365
k=('trauw532', 'FM'), NLL=-13.942
k=('7io88gsu', 'FM+Reg'), NLL=-14.408


In [15]:
# import pickle
# with open('nlls_fitzhugh.pkl', 'wb') as f:
#     pickle.dump(dict(jax.tree.map(np.array,nlls)), f)

In [16]:
# with open('nlls_fitzhugh.pkl', 'rb') as f:
#     test_nll = pickle.load(f)