In [1]:
import sys
sys.path.insert(1, '/home/richard/nfmc_jax/')
import nfmc_jax
import arviz as az
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import pandas as pd
import scipy
from sklearn.neighbors import KernelDensity
import jax
import jax.numpy as jnp
from jax.scipy.special import logsumexp
from jax.scipy.stats import multivariate_normal as mvn
import chaospy
import corner
import torch
import warnings
import pickle

import getdist
from getdist import plots, MCSamples

seed=1234
np.random.seed(seed)
key = jax.random.PRNGKey(seed)

In [2]:
n = 10

key = jax.random.PRNGKey(0)
jax_prior_init = jax.random.uniform(key, shape=(10 * n, n), minval=-1, maxval=1)
print(jnp.shape(jax_prior_init))
print(jax_prior_init)

(100, 10)
[[-8.84091854e-01 -4.43298101e-01 -1.22544289e-01 -5.09226084e-01
   4.90239620e-01  2.34477520e-01  5.42016745e-01  6.91947699e-01
   9.19848204e-01  7.04192400e-01]
 [ 7.50247955e-01  7.75618553e-02 -1.93581581e-02 -8.29578400e-01
   1.59775496e-01 -3.33229303e-01 -1.17771864e-01  4.73334551e-01
  -6.47885323e-01 -3.71244907e-01]
 [ 1.63232803e-01  5.28733253e-01 -6.22561693e-01 -3.91986847e-01
   5.72552443e-01 -3.86230469e-01  7.46369123e-01 -4.86523390e-01
   3.35375786e-01  5.44512987e-01]
 [ 2.36198425e-01  2.10574150e-01 -9.22422409e-02 -1.90681696e-01
   4.45937634e-01 -7.79232264e-01 -7.89236546e-01  3.00645828e-04
   8.02695751e-01 -4.50159311e-01]
 [ 1.41799450e-02 -8.90784979e-01 -9.27755117e-01  3.31110477e-01
  -6.48730993e-01 -7.78982401e-01 -5.01650810e-01 -9.97568130e-01
   2.93876886e-01  5.40287733e-01]
 [-7.28118896e-01  6.98439837e-01  8.96300077e-01 -9.57493782e-01
   9.91392136e-01 -2.73618221e-01  8.73942852e-01  5.49952269e-01
  -1.89256191e-01  7.09

In [3]:
def run_nfo(log_like,log_prior,
    n, #number of sobol points
    low=-1.,
    high=1.,
    knots=None,
    knots_trainable=5,
    bw=1.,
    rel_bw=1,
    layers=5,
    ktrunc=jnp.inf,
    t_ess=0.7,
    beta_max=1.0,
    min_delta_beta=0.05,
    rel_beta=0.5,
    frac_rel_beta_AF = 1,
    alpha_w = (0,0),
    alpha_uw = (0,0),
    latent_sigma=2.4/(2**2),  #FIXME put this in the code as default
    use_latent_beta2=False,
    use_pq_beta_IW1=False, 
    top_verbose=True,
    verbose=False,
    trainable_qw=True,
    sgd_steps=10,
    gamma=0,
    optimize_directions=False,
    snf_loss=2,
    logp_cut=0,
    a=1,
    b=1,
    c=1,
    d=1,
    Ntemp=None,
    eps_z=0.1,
    cull_lowp_tol=0.01, 
    max_cull_frac=0.5,
    ess_tol=1.0,
    local_thresh=jnp.inf,
    nfmc_draws=100, 
    nf_iter=100,
    edge_bins=0,
    local_step_factor=0.25,
    nfmc_local_exploration=True,
    nfmc_AF_samples=200,
    nfmc_full_qw_samples=True,
    agressive_cull=False,
    cull_mode='importance_weights',
    cull_iw_tol=1e-3,
    nfmc_frac_validate=0.1,
    frac_validate=0.1):
    
    ntemp = int(12*n) if(Ntemp is None) else Ntemp
    
    n_prior = 10*n
    n0=n_prior
    N=n_prior
    aN=int(2*N*a)
    bN=n*b
    cN=n*c
    dN=n*d
    if(n<6):
        latent_sigma=1
    else:
        latent_sigma*=((n)**(-1/2))
    dist1d = chaospy.Iid(chaospy.Uniform(lower=low,upper=high),n)
    bounds=np.array([low*np.ones(n),high*np.ones(n)])
    init_prior=dist1d
    init_prior = np.atleast_2d(dist1d.sample(n_prior+1,rule='sobol')).T[1:] #drop first (0,0) sample because cheating
    #init_prior = jax_prior_init
    trace = nfmc_jax.infer_nfomc(log_like, log_prior, jnp.array(init_prior), 
                             log_prior_args=((jnp.array([low]), jnp.array([high]))), 
                             inference_mode="sampling", 
                              vmap=True, parallel_backend=None, 
                               n0=n0,
                               N=N,
                               t_ess=t_ess,
                               N_AF=aN,
                               expl_top_AF=bN,
                               expl_top_qw=cN,
                               expl_latent=dN,
                               bounds=bounds,
                               beta_max=beta_max,
                               N_temp=ntemp,
                               rel_bw=rel_bw,
                               rel_beta=rel_beta,
                               frac_rel_beta_AF = frac_rel_beta_AF,
                               latent_sigma=latent_sigma,
                               use_latent_beta2=use_latent_beta2,
                               use_pq_beta_IW1=use_pq_beta_IW1,
                               k_trunc=ktrunc,
                               #sinf parameters
                               frac_validate=frac_validate,
                               alpha_w=alpha_w,
                               alpha_uw=alpha_uw,
                               NBfirstlayer=True, 
                               verbose=verbose,interp_nbin=knots,iteration=layers,
                               bw_factor_min=bw,bw_factor_max=bw,bw_factor_num=1, #manually force bw factor
                               trainable_qw=trainable_qw,
                               sgd_steps=sgd_steps,
                               gamma=gamma,
                               knots_trainable=knots_trainable,
                               optimize_directions=optimize_directions,
                               logp_cut=logp_cut,
                               random_seed=seed,
                               eps_z=eps_z,
                               cull_lowp_tol=cull_lowp_tol, 
                               max_cull_frac=max_cull_frac,
                               ess_tol=ess_tol,
                               local_thresh=local_thresh,
                               nfmc_draws=nfmc_draws, 
                               nf_iter=nf_iter,
                               top_verbose=top_verbose,
                               edge_bins=edge_bins,
                               local_step_factor=local_step_factor,
                               nfmc_AF_samples=nfmc_AF_samples,
                               nfmc_full_qw_samples=nfmc_full_qw_samples,
                               nfmc_local_exploration=nfmc_local_exploration,
                               agressive_cull=agressive_cull,
                               cull_mode=cull_mode,
                               cull_iw_tol=cull_iw_tol,
                               nfmc_frac_validate=nfmc_frac_validate,
                               min_delta_beta=min_delta_beta,
                               snf_loss=snf_loss,
                             )
    
    return trace


def log_flat_prior(x,low,high):
    n=x.shape[-1]
    return -n*jnp.log((high-low))


def plot_Zs(trace,low,high,n,beta_max):
    Zuws = np.array([trace['logZ'][0]['q{0}_pq_uw'.format(i)] for i in range(1,len(trace['betas'][0]))])
    Zws = np.array([trace['logZ'][0]['q{0}_pq_w'.format(i)] for i in range(1,len(trace['betas'][0]))])
    Zts = np.log(np.array([trace['logZ'][0]['q{0}_pq_w_trainable'.format(i)] for i in range(1,len(trace['betas'][0]))]))
    plt.plot(np.array(trace['betas'][0][1:])*beta_max,Zuws,ls=' ',marker='s',label='uw')
    plt.plot(np.array(trace['betas'][0][1:])*beta_max,Zts,ls=' ',marker='d',label='w_t')
    plt.plot(np.array(trace['betas'][0][1:])*beta_max,Zws,ls=' ',marker='.',label='w')
    if(low is not None and high is not None):plt.axhline(np.log((high-low)**-n),ls='--',c='k',zorder=-1,label='prior norm' )
    plt.ylabel(r'$\log Z$')
    plt.legend(prop={"size":10})
    plt.xlabel(r'$\beta$')
    plt.show()

In [4]:

def get_icov(n,target=200,iseed=seed,eps=1,scale=50, just_do_it=False):
    condition=0
    eigmax=np.inf
    this_seed=iseed
    if just_do_it:
        wish = scipy.stats.wishart(df=n, scale=np.eye(n)* scale,seed=this_seed)
        iC = wish.rvs(size=1)
        C = np.linalg.inv(iC)
        eigs = np.linalg.eigvals(C)
        eigmax,eigmin = eigs.max(),eigs.min()
        condition = eigmax/eigmin
    elif not just_do_it:
        while(abs(condition-target)>eps):
            wish = scipy.stats.wishart(df=n, scale=np.eye(n)* scale,seed=this_seed)
            iC = wish.rvs(size=1)
            C = np.linalg.inv(iC)
            eigs = np.linalg.eigvals(C)
            eigmax,eigmin = eigs.max(),eigs.min()
            condition = eigmax/eigmin
            this_seed += 1
    print("PSD: ",np.all(eigs>0))
    print("Condition number: ", condition)
    print("Op norm: ", eigmax)
    return iC,C

iCov,Cov=get_icov(n,eps=1)
def log_like_cg(x,mu_diag=0,icov=iCov):
    n=x.shape[-1]
    mu = mu_diag*jnp.ones(n)
    #return -0.5 * ( n*jnp.log( (2 * jnp.pi)) + jnp.log( 1/jnp.linalg.det(icov) )) - 0.5 * jnp.dot((x - mu),jnp.dot(icov,(x - mu)))
    return - 0.5 * jnp.dot((x - mu),jnp.dot(icov,(x - mu)))

PSD:  True
Condition number:  199.08320751596906
Op norm:  0.1587924033016887


In [5]:
from scipy.stats import multivariate_normal as n_mvn

def t2a(tens): return tens.numpy().astype(np.float64)
def a2t(arr): return torch.from_numpy(arr.astype(np.float32))

def plot_corr_gd(trace,Cov,Ngd=1000,beta_idx=None, out_name=None):
    qmodels=trace['q_models']
    logp=trace['logp']
    samples=trace['q_samples']
    #qnums = np.unique([int(s.split('q')[1].split('_')[0]) for s in list(trace['q_models'][0].keys())])
    names = ["x%s"%i for i in range(n)]
    labels =  ["x_%s"%i for i in range(n)]

    truth = n_mvn.rvs(mean=np.zeros(n),cov=Cov,size=Ngd)
    truth_gd = MCSamples(samples=truth,names = names, labels = labels, label='truth')

    #if(beta_idx is None): beta_idx=qnums.max()
    s_w,s_uw = t2a(qmodels[0]['q{0}_w'.format(beta_idx)].sample(Ngd,device='cpu')[0]),t2a(qmodels[0]['q{0}_uw'.format(beta_idx)].sample(Ngd,device='cpu')[0])
    samples_w = MCSamples(samples=s_w,names = names, labels = labels, label='q_w')
    samples_uw = MCSamples(samples=s_uw,names = names, labels = labels, label='q_uw')

    # Triangle plot
    plt.figure()
    g = plots.get_subplot_plotter()
    g.triangle_plot([samples_uw,truth_gd,samples_w], filled=True)
    plt.show()
    if out_name is not None:
        g.export(out_name)

In [6]:
def plot_triangles(samples, weights, Cov, Ngd=1000, beta_idx=None,
                   out_name=None):

    names = ["x%s"%i for i in range(n)]
    labels =  ["x_%s"%i for i in range(n)]
    
    truth = n_mvn.rvs(mean=np.zeros(n),cov=Cov,size=Ngd)
    truth_gd = MCSamples(samples=truth,names = names, labels = labels, label='truth')

    samples_w = MCSamples(samples=samples, weights=weights,
                          names=names, labels=labels, 
                          label='posterior samples')

    # Triangle plot
    plt.figure()
    g = plots.get_subplot_plotter()
    g.triangle_plot([truth_gd, samples_w], filled=True)
    plt.show()
    if out_name is not None:
        g.export(out_name)

In [7]:
snf_loss = 4
nf_cull = 0

In [8]:
warnings.filterwarnings('ignore')
cg10 = run_nfo(n=n,log_like=log_like_cg,log_prior=log_flat_prior,
               beta_max=1,c=0,t_ess=0.9,frac_rel_beta_AF=.75,b=2,d=2, Ntemp=500,
               min_delta_beta=1e-2, nfmc_draws=1000, nfmc_local_exploration=True,
               agressive_cull=False, local_thresh=jnp.inf, cull_mode=None,
               snf_loss=snf_loss, frac_validate=0.1, nfmc_frac_validate=0.1)

with open(f'cg10_cullNONE_AF_snfloss{snf_loss}_nfcull{nf_cull}_dict.pickle', 'wb') as cg_file:
    pickle.dump(cg10, cg_file, pickle.HIGHEST_PROTOCOL)

qw = cg10['qw_posterior'][0]
qw_iw = cg10['qw_posterior_weights'][0]
qw = qw[qw_iw != 0.0]
qw_iw = np.asarray(qw_iw[qw_iw != 0.0])

resample_idx = np.random.choice(np.arange(len(qw)), size=10000, p=qw_iw/qw_iw.sum())
posterior = qw[resample_idx, ...]

plot_corr_gd(cg10, Cov, beta_idx=100, out_name=f'./qw_quw_nfo_10d_cg_cullNONE_AF_snfloss{snf_loss}_nfcull{nf_cull}.png') 

plot_triangles(qw, qw_iw, Cov, out_name=f'./qw_weighted_10d_cg_cullNONE_AF_snfloss{snf_loss}_nfcull{nf_cull}.png')
plot_triangles(qw, np.ones(len(qw)), Cov, out_name=f'./qw_unweighted_10d_cg_cullNONE_AF_snfloss{snf_loss}_nfcull{nf_cull}.png')

quw = cg10['quw_posterior'][0]
quw_iw = cg10['quw_posterior_weights'][0]
quw = quw[quw_iw != 0.0]
quw_iw = np.asarray(quw_iw[quw_iw != 0.0])
resample_idx = np.random.choice(np.arange(len(quw)), size=10000, p=quw_iw/quw_iw.sum())

posterior = quw[resample_idx, ...]

plot_triangles(quw, quw_iw, Cov, out_name=f'./quw_weighted_10d_cg_cullNONE_AF_snfloss{snf_loss}_nfcull{nf_cull}.png')

Inference mode is sampling. Maximum beta is set to 1.
After first quw fit, beta=0.00
min_delta_beta = 0.01
Updated beta = 9.5367431640625e-07
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.8847],
        [-1.1800],
        [-1.1408],
        [-3.4346],
        [-1.9594],
        [-1.8577],
        [-1.2999],
        [-1.0323],
        [-0.9729],
        [-1.7018]], requires_grad=True)
SNF model parameters: Parameter contai

ESS3 = 30
beta_prod=0.0000
beta_intern=0.0000
norm-logZ_w_pq = -132.1301
norm-logZ_uw_pq = -119.9334
After first quw fit, beta=0.00
min_delta_beta = 0.01
Updated beta = 1.9073481780651491e-06
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.7953],
        [-1.8391],
        [-1.8883],
        [-2.3879],
        [-1.0327],
        [-1.4076],
        [-1.7566],
        [-1.9918],
        [-1.1267],
        [-1.8666]], requires

using beta2=0.00 at idx 1, at stage-1 = 2
ESS3 = 78
beta_prod=0.0000
beta_intern=0.0000
norm-logZ_w_pq = -120.6072
norm-logZ_uw_pq = -131.4778
After first quw fit, beta=0.00
min_delta_beta = 0.01
Updated beta = 3.814694537141762e-06
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.3338],
        [-1.8952],
        [-1.5445],
        [-1.5573],
        [-1.3234],
        [-1.6439],
        [-1.1538],
        [-1.8874],
      

using beta2=0.00 at idx 3, at stage-1 = 4
ESS3 = 90
beta_prod=0.0012
beta_intern=0.0012
norm-logZ_w_pq = -124.3232
norm-logZ_uw_pq = -131.9445
After first quw fit, beta=0.00
min_delta_beta = 0.01
Updated beta = 0.0020784751960640224
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.3644],
        [-1.0952],
        [-1.2724],
        [-2.0241],
        [-1.3659],
        [-1.5202],
        [-1.1415],
        [-1.0213],
      

using beta2=0.00 at idx 5, at stage-1 = 6
ESS3 = 90
beta_prod=0.0042
beta_intern=0.0042
norm-logZ_w_pq = -81.9168
norm-logZ_uw_pq = -90.2049
After first quw fit, beta=0.00
min_delta_beta = 0.01
Updated beta = 0.005735133902187585
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.4216],
        [-1.2229],
        [-1.5719],
        [-1.8738],
        [-1.0917],
        [-1.0583],
        [-1.0598],
        [-1.1560],
        [

ESS3 = 90
beta_prod=0.0065
beta_intern=0.0065
norm-logZ_w_pq = -80.3392
norm-logZ_uw_pq = -88.4380
After first quw fit, beta=0.01
min_delta_beta = 0.01
Updated beta = 0.009203099153988467
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.3615],
        [-0.9816],
        [-1.3482],
        [-1.3730],
        [-0.9161],
        [-0.8317],
        [-1.4868],
        [-0.7953],
        [-1.2201],
        [-0.9326]], requires_gra

using beta2=0.00 at idx 7, at stage-1 = 9
ESS3 = 90
beta_prod=0.0092
beta_intern=0.0092
norm-logZ_w_pq = -43.1887
norm-logZ_uw_pq = -48.2770
After first quw fit, beta=0.01
min_delta_beta = 0.01
Updated beta = 0.009295130145528352
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.3082],
        [-0.8580],
        [-1.1796],
        [-1.3442],
        [-1.4242],
        [-0.8235],
        [-0.9396],
        [-0.5223],
        [

using beta2=0.01 at idx 8, at stage-1 = 11
ESS3 = 90
beta_prod=0.0101
beta_intern=0.0101
norm-logZ_w_pq = -41.8170
norm-logZ_uw_pq = -44.5230
After first quw fit, beta=0.01
min_delta_beta = 0.01
Updated beta = 0.010247107535232607
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.4275],
        [-1.1213],
        [-1.1772],
        [-1.3256],
        [-1.5047],
        [-1.6987],
        [-1.5873],
        [-1.1806],
        

using beta2=0.01 at idx 9, at stage-1 = 13
ESS3 = 90
beta_prod=0.0126
beta_intern=0.0126
norm-logZ_w_pq = -42.5163
norm-logZ_uw_pq = -43.8891
After first quw fit, beta=0.01
min_delta_beta = 0.01
Updated beta = 0.015344553218309541
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.0361],
        [-0.7353],
        [-1.2770],
        [-1.2191],
        [-1.6288],
        [-1.3433],
        [-0.9254],
        [-1.1032],
        

using beta2=0.01 at idx 9, at stage-1 = 14
ESS3 = 90
beta_prod=0.0153
beta_intern=0.0153
norm-logZ_w_pq = -45.2955
norm-logZ_uw_pq = -40.9184
After first quw fit, beta=0.02
min_delta_beta = 0.01
Updated beta = 0.017706661446595856
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8890],
        [-0.7109],
        [-1.2770],
        [-1.0996],
        [-1.3929],
        [-1.2760],
        [-1.1859],
        [-1.0109],
        

using beta2=0.01 at idx 10, at stage-1 = 15
ESS3 = 90
beta_prod=0.0177
beta_intern=0.0177
norm-logZ_w_pq = -41.2107
norm-logZ_uw_pq = -41.3476
After first quw fit, beta=0.02
min_delta_beta = 0.01
Updated beta = 0.01806963019755168
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.9714],
        [-0.6331],
        [-1.1496],
        [-1.0253],
        [-1.5750],
        [-1.2120],
        [-1.0315],
        [-1.1218],
        

using beta2=0.01 at idx 10, at stage-1 = 16
ESS3 = 90
beta_prod=0.0181
beta_intern=0.0181
norm-logZ_w_pq = -42.7790
norm-logZ_uw_pq = -41.8361
After first quw fit, beta=0.02
min_delta_beta = 0.01
Updated beta = 0.018250326499527195
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.1568],
        [-0.9144],
        [-1.1776],
        [-0.9431],
        [-1.5604],
        [-1.3479],
        [-0.8658],
        [-1.1174],
       

ESS3 = 90
beta_prod=0.0228
beta_intern=0.0228
norm-logZ_w_pq = -43.0116
norm-logZ_uw_pq = -41.7409
After first quw fit, beta=0.02
min_delta_beta = 0.01
Updated beta = 0.023075136433769787
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8663],
        [-0.7865],
        [-1.1619],
        [-0.8844],
        [-1.2893],
        [-1.0513],
        [-1.0044],
        [-1.0556],
        [-0.9619],
        [-0.8103]], requires_gra

using beta2=0.01 at idx 14, at stage-1 = 19
ESS3 = 87
beta_prod=0.0231
beta_intern=0.0231
norm-logZ_w_pq = -41.3432
norm-logZ_uw_pq = -41.7421
After first quw fit, beta=0.02
min_delta_beta = 0.01
Updated beta = 0.024764403284961635
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.9491],
        [-0.9983],
        [-1.1795],
        [-0.9260],
        [-1.5492],
        [-1.6103],
        [-0.7933],
        [-1.1173],
       

using beta2=0.01 at idx 14, at stage-1 = 20
ESS3 = 90
beta_prod=0.0248
beta_intern=0.0248
norm-logZ_w_pq = -47.1399
norm-logZ_uw_pq = -41.5132
After first quw fit, beta=0.02
min_delta_beta = 0.01
Updated beta = 0.026693344297378664
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7872],
        [-0.7128],
        [-1.0161],
        [-0.8756],
        [-1.6225],
        [-1.1325],
        [-0.7475],
        [-1.0555],
       

using beta2=0.01 at idx 14, at stage-1 = 21
ESS3 = 90
beta_prod=0.0267
beta_intern=0.0267
norm-logZ_w_pq = -45.5908
norm-logZ_uw_pq = -42.3518
After first quw fit, beta=0.03
min_delta_beta = 0.01
Updated beta = 0.02696027774035245
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6522],
        [-0.5795],
        [-0.9467],
        [-0.8166],
        [-1.4111],
        [-0.8830],
        [-1.6240],
        [-1.0311],
        

using beta2=0.01 at idx 14, at stage-1 = 22
ESS3 = 86
beta_prod=0.0270
beta_intern=0.0270
norm-logZ_w_pq = -52.6235
norm-logZ_uw_pq = -42.1286
After first quw fit, beta=0.03
min_delta_beta = 0.01
Updated beta = 0.027229880517755975
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6629],
        [-0.6875],
        [-1.0026],
        [-0.7415],
        [-1.3898],
        [-0.9161],
        [-1.6753],
        [-1.0368],
       

using beta2=0.01 at idx 14, at stage-1 = 23
ESS3 = 85
beta_prod=0.0272
beta_intern=0.0272
norm-logZ_w_pq = -54.7186
norm-logZ_uw_pq = -42.3960
After first quw fit, beta=0.03
min_delta_beta = 0.01
Updated beta = 0.027502179322933536
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8658],
        [-0.6074],
        [-1.0067],
        [-0.7114],
        [-1.2573],
        [-0.8920],
        [-1.5806],
        [-1.0270],
       

using beta2=0.01 at idx 14, at stage-1 = 24
ESS3 = 85
beta_prod=0.0275
beta_intern=0.0275
norm-logZ_w_pq = -44.6210
norm-logZ_uw_pq = -42.5103
After first quw fit, beta=0.03
min_delta_beta = 0.01
Updated beta = 0.029669230151314105
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7865],
        [-0.5866],
        [-1.1185],
        [-0.6601],
        [-1.2636],
        [-1.0689],
        [-1.6025],
        [-1.0496],
       

using beta2=0.02 at idx 15, at stage-1 = 25
ESS3 = 90
beta_prod=0.0297
beta_intern=0.0297
norm-logZ_w_pq = -44.3864
norm-logZ_uw_pq = -42.4681
After first quw fit, beta=0.03
min_delta_beta = 0.01
Updated beta = 0.0347201269001938
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7813],
        [-0.6875],
        [-1.0998],
        [-0.6493],
        [-1.2670],
        [-1.1926],
        [-1.5077],
        [-1.0457],
        [

using beta2=0.02 at idx 16, at stage-1 = 26
ESS3 = 90
beta_prod=0.0347
beta_intern=0.0347
norm-logZ_w_pq = -47.4717
norm-logZ_uw_pq = -42.4654
After first quw fit, beta=0.03
min_delta_beta = 0.01
Updated beta = 0.035067328169195736
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7835],
        [-0.6833],
        [-1.0031],
        [-0.7742],
        [-1.2358],
        [-1.3513],
        [-1.5848],
        [-1.0471],
       

using beta2=0.02 at idx 16, at stage-1 = 27
ESS3 = 83
beta_prod=0.0351
beta_intern=0.0351
norm-logZ_w_pq = -47.1266
norm-logZ_uw_pq = -42.3531
After first quw fit, beta=0.04
min_delta_beta = 0.01
Updated beta = 0.03626662789565497
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7856],
        [-0.7029],
        [-1.0615],
        [-0.8530],
        [-1.2033],
        [-1.0705],
        [-1.5473],
        [-1.0440],
        

using beta2=0.02 at idx 17, at stage-1 = 28
ESS3 = 90
beta_prod=0.0363
beta_intern=0.0363
norm-logZ_w_pq = -42.6510
norm-logZ_uw_pq = -43.0661
After first quw fit, beta=0.04
min_delta_beta = 0.01
Updated beta = 0.03662929417461152
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6315],
        [-0.7030],
        [-1.0429],
        [-0.6076],
        [-1.1058],
        [-1.2703],
        [-1.5820],
        [-1.0449],
        

using beta2=0.02 at idx 18, at stage-1 = 29
ESS3 = 72
beta_prod=0.0366
beta_intern=0.0366
norm-logZ_w_pq = -43.5398
norm-logZ_uw_pq = -43.3247
After first quw fit, beta=0.04
min_delta_beta = 0.01
Updated beta = 0.036995587116357635
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7824],
        [-0.8626],
        [-0.8316],
        [-0.6968],
        [-1.2027],
        [-1.1209],
        [-1.3273],
        [-1.0492],
       

using beta2=0.02 at idx 18, at stage-1 = 30
ESS3 = 81
beta_prod=0.0370
beta_intern=0.0370
norm-logZ_w_pq = -44.6775
norm-logZ_uw_pq = -42.6293
After first quw fit, beta=0.04
min_delta_beta = 0.01
Updated beta = 0.03736554298752121
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5785],
        [-0.8629],
        [-0.9261],
        [-0.6600],
        [-1.4761],
        [-1.0738],
        [-1.2513],
        [-1.0555],
        

using beta2=0.02 at idx 18, at stage-1 = 31
ESS3 = 59
beta_prod=0.0374
beta_intern=0.0374
norm-logZ_w_pq = -48.3015
norm-logZ_uw_pq = -43.2654
After first quw fit, beta=0.04
min_delta_beta = 0.01
Updated beta = 0.037739198417396425
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8242],
        [-0.7797],
        [-0.9831],
        [-0.6055],
        [-1.1283],
        [-1.0683],
        [-1.2463],
        [-1.0416],
       

using beta2=0.02 at idx 18, at stage-1 = 32
ESS3 = 90
beta_prod=0.0377
beta_intern=0.0377
norm-logZ_w_pq = -42.6239
norm-logZ_uw_pq = -42.9095
After first quw fit, beta=0.04
min_delta_beta = 0.01
Updated beta = 0.040374070099209
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8295],
        [-0.8643],
        [-0.9748],
        [-0.7194],
        [-0.9968],
        [-1.2238],
        [-1.2410],
        [-0.6641],
        [-

using beta2=0.02 at idx 18, at stage-1 = 33
ESS3 = 90
beta_prod=0.0404
beta_intern=0.0404
norm-logZ_w_pq = -47.5747
norm-logZ_uw_pq = -42.4859
After first quw fit, beta=0.04
min_delta_beta = 0.01
Updated beta = 0.04077781080020109
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8241],
        [-0.8228],
        [-0.8321],
        [-0.6072],
        [-1.4054],
        [-1.0708],
        [-1.2442],
        [-1.0488],
        

using beta2=0.02 at idx 18, at stage-1 = 34
ESS3 = 78
beta_prod=0.0408
beta_intern=0.0408
norm-logZ_w_pq = -43.0375
norm-logZ_uw_pq = -43.1680
After first quw fit, beta=0.04
min_delta_beta = 0.01
Updated beta = 0.04221278798955641
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7841],
        [-0.8617],
        [-1.0884],
        [-0.6940],
        [-1.0762],
        [-1.0690],
        [-1.3376],
        [-0.9152],
        

using beta2=0.02 at idx 19, at stage-1 = 35
ESS3 = 90
beta_prod=0.0422
beta_intern=0.0422
norm-logZ_w_pq = -42.8453
norm-logZ_uw_pq = -43.5596
After first quw fit, beta=0.04
min_delta_beta = 0.01
Updated beta = 0.045558615744457076
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8293],
        [-0.8259],
        [-0.9213],
        [-0.6055],
        [-1.0665],
        [-0.8537],
        [-1.2414],
        [-0.9315],
       

using beta2=0.02 at idx 19, at stage-1 = 36
ESS3 = 90
beta_prod=0.0456
beta_intern=0.0456
norm-logZ_w_pq = -44.9852
norm-logZ_uw_pq = -42.9224
After first quw fit, beta=0.05
min_delta_beta = 0.01
Updated beta = 0.04601420190190165
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6332],
        [-0.8614],
        [-0.9365],
        [-0.5913],
        [-1.0665],
        [-0.8530],
        [-1.4303],
        [-0.6362],
        

using beta2=0.02 at idx 20, at stage-1 = 37
ESS3 = 73
beta_prod=0.0460
beta_intern=0.0460
norm-logZ_w_pq = -24.7082
norm-logZ_uw_pq = -20.0384
After first quw fit, beta=0.05
min_delta_beta = 0.01
Updated beta = 0.04647434392092067
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-1.1072],
        [-0.6831],
        [-0.8254],
        [-0.5959],
        [-0.8744],
        [-0.8354],
        [-1.2430],
        [-0.6362],
        

using beta2=0.02 at idx 20, at stage-1 = 38
ESS3 = 79
beta_prod=0.0465
beta_intern=0.0465
norm-logZ_w_pq = -21.6007
norm-logZ_uw_pq = -20.4009
After first quw fit, beta=0.05
min_delta_beta = 0.01
Updated beta = 0.046939087360129875
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7975],
        [-0.6884],
        [-0.8097],
        [-0.9020],
        [-0.9425],
        [-0.8872],
        [-0.8572],
        [-0.6350],
       

using beta2=0.02 at idx 20, at stage-1 = 39
ESS3 = 62
beta_prod=0.0469
beta_intern=0.0469
norm-logZ_w_pq = -29.5261
norm-logZ_uw_pq = -19.8455
After first quw fit, beta=0.05
min_delta_beta = 0.01
Updated beta = 0.05003842718731717
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8034],
        [-0.7245],
        [-0.8205],
        [-0.6041],
        [-1.0486],
        [-0.9109],
        [-0.9606],
        [-0.6595],
        

using beta2=0.02 at idx 21, at stage-1 = 40
ESS3 = 90
beta_prod=0.0500
beta_intern=0.0500
norm-logZ_w_pq = -22.2102
norm-logZ_uw_pq = -19.8768
After first quw fit, beta=0.05
min_delta_beta = 0.01
Updated beta = 0.05053881145919034
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7902],
        [-0.6875],
        [-0.8083],
        [-0.7190],
        [-0.8253],
        [-0.8903],
        [-0.8351],
        [-0.6628],
        

using beta2=0.02 at idx 21, at stage-1 = 41
ESS3 = 82
beta_prod=0.0505
beta_intern=0.0505
norm-logZ_w_pq = -24.9703
norm-logZ_uw_pq = -20.1172
After first quw fit, beta=0.05
min_delta_beta = 0.01
Updated beta = 0.05104419957378224
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8635],
        [-0.5013],
        [-0.8088],
        [-0.7503],
        [-0.7147],
        [-0.6432],
        [-0.8393],
        [-0.5807],
        

using beta2=0.02 at idx 21, at stage-1 = 42
ESS3 = 62
beta_prod=0.0510
beta_intern=0.0510
norm-logZ_w_pq = -27.5456
norm-logZ_uw_pq = -20.1925
After first quw fit, beta=0.05
min_delta_beta = 0.01
Updated beta = 0.05155464156952007
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8287],
        [-0.6875],
        [-0.8415],
        [-0.7159],
        [-0.9091],
        [-0.8098],
        [-0.8442],
        [-0.5920],
        

using beta2=0.03 at idx 22, at stage-1 = 43
ESS3 = 84
beta_prod=0.0516
beta_intern=0.0516
norm-logZ_w_pq = -24.2399
norm-logZ_uw_pq = -20.1637
After first quw fit, beta=0.05
min_delta_beta = 0.01
Updated beta = 0.05226818357089842
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8241],
        [-0.6227],
        [-0.8433],
        [-0.6466],
        [-0.8256],
        [-0.7805],
        [-0.9530],
        [-0.6327],
        

using beta2=0.03 at idx 22, at stage-1 = 44
ESS3 = 90
beta_prod=0.0523
beta_intern=0.0523
norm-logZ_w_pq = -21.8789
norm-logZ_uw_pq = -20.6055
After first quw fit, beta=0.05
min_delta_beta = 0.01
Updated beta = 0.054883546117373054
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8635],
        [-0.5756],
        [-0.9357],
        [-0.5978],
        [-1.0039],
        [-0.8968],
        [-0.8984],
        [-0.6335],
       

using beta2=0.03 at idx 25, at stage-1 = 45
ESS3 = 90
beta_prod=0.0549
beta_intern=0.0549
norm-logZ_w_pq = -22.8947
norm-logZ_uw_pq = -20.1485
After first quw fit, beta=0.05
min_delta_beta = 0.01
Updated beta = 0.06153189337185469
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8635],
        [-0.6834],
        [-0.7436],
        [-0.5790],
        [-0.8331],
        [-0.8329],
        [-0.9394],
        [-0.5566],
        

using beta2=0.03 at idx 26, at stage-1 = 46
ESS3 = 90
beta_prod=0.0615
beta_intern=0.0615
norm-logZ_w_pq = -21.8814
norm-logZ_uw_pq = -20.4167
After first quw fit, beta=0.06
min_delta_beta = 0.01
Updated beta = 0.06271504040959158
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7902],
        [-0.5964],
        [-0.8056],
        [-0.6054],
        [-0.7662],
        [-0.8406],
        [-0.8323],
        [-0.4650],
        

using beta2=0.03 at idx 26, at stage-1 = 47
ESS3 = 90
beta_prod=0.0627
beta_intern=0.0627
norm-logZ_w_pq = -22.2475
norm-logZ_uw_pq = -19.4892
After first quw fit, beta=0.06
min_delta_beta = 0.01
Updated beta = 0.0633421908136875
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7943],
        [-0.5790],
        [-0.8003],
        [-0.5825],
        [-0.7412],
        [-0.8821],
        [-0.8106],
        [-0.5572],
        [

using beta2=0.03 at idx 26, at stage-1 = 48
ESS3 = 90
beta_prod=0.0633
beta_intern=0.0633
norm-logZ_w_pq = -22.6021
norm-logZ_uw_pq = -19.6077
After first quw fit, beta=0.06
min_delta_beta = 0.01
Updated beta = 0.06397561272182438
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7754],
        [-0.5795],
        [-0.8617],
        [-0.6286],
        [-0.9967],
        [-1.0709],
        [-0.7157],
        [-0.6330],
        

using beta2=0.03 at idx 26, at stage-1 = 49
ESS3 = 90
beta_prod=0.0640
beta_intern=0.0640
norm-logZ_w_pq = -21.8102
norm-logZ_uw_pq = -19.8391
After first quw fit, beta=0.06
min_delta_beta = 0.01
Updated beta = 0.06461536884904262
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7665],
        [-0.6588],
        [-0.7470],
        [-0.5257],
        [-0.7589],
        [-0.8152],
        [-0.6470],
        [-0.4642],
        

using beta2=0.03 at idx 27, at stage-1 = 50
ESS3 = 60
beta_prod=0.0646
beta_intern=0.0646
norm-logZ_w_pq = -34.3809
norm-logZ_uw_pq = -19.6599
After first quw fit, beta=0.06
min_delta_beta = 0.01
Updated beta = 0.07217546506447606
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7664],
        [-0.6864],
        [-0.8537],
        [-0.5878],
        [-0.7658],
        [-1.0637],
        [-0.9323],
        [-0.4653],
        

using beta2=0.04 at idx 30, at stage-1 = 52
ESS3 = 67
beta_prod=0.0729
beta_intern=0.0729
norm-logZ_w_pq = -25.1210
norm-logZ_uw_pq = -19.9009
After first quw fit, beta=0.07
min_delta_beta = 0.01
Updated beta = 0.07362619191227203
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7709],
        [-0.8226],
        [-0.9769],
        [-0.7159],
        [-0.6646],
        [-0.8166],
        [-0.9372],
        [-0.3352],
        

using beta2=0.04 at idx 31, at stage-1 = 53
ESS3 = 84
beta_prod=0.0736
beta_intern=0.0736
norm-logZ_w_pq = -22.0596
norm-logZ_uw_pq = -19.8329
After first quw fit, beta=0.07
min_delta_beta = 0.01
Updated beta = 0.07436245383139475
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7403],
        [-0.8032],
        [-0.9331],
        [-0.7217],
        [-0.6646],
        [-0.8186],
        [-0.9729],
        [-0.3216],
        

using beta2=0.04 at idx 32, at stage-1 = 54
ESS3 = 82
beta_prod=0.0744
beta_intern=0.0744
norm-logZ_w_pq = -24.2284
norm-logZ_uw_pq = -20.0277
After first quw fit, beta=0.07
min_delta_beta = 0.01
Updated beta = 0.0751060783697087
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7543],
        [-0.7290],
        [-0.9769],
        [-0.6592],
        [-0.7157],
        [-0.8433],
        [-0.7557],
        [-0.4655],
        [

using beta2=0.04 at idx 33, at stage-1 = 56
ESS3 = 78
beta_prod=0.0759
beta_intern=0.0759
norm-logZ_w_pq = -23.3106
norm-logZ_uw_pq = -20.0975
After first quw fit, beta=0.08
min_delta_beta = 0.01
Updated beta = 0.07661571054493985
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7752],
        [-0.8042],
        [-0.8739],
        [-0.6594],
        [-0.3711],
        [-0.8447],
        [-0.8298],
        [-0.2712],
        

using beta2=0.04 at idx 33, at stage-1 = 57
ESS3 = 82
beta_prod=0.0766
beta_intern=0.0766
norm-logZ_w_pq = -24.9527
norm-logZ_uw_pq = -20.3689
After first quw fit, beta=0.08
min_delta_beta = 0.01
Updated beta = 0.0784940155151108
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7902],
        [-0.8038],
        [-0.8856],
        [-0.7153],
        [-0.7156],
        [-0.8358],
        [-0.8570],
        [-0.3340],
        [

using beta2=0.04 at idx 34, at stage-1 = 58
ESS3 = 90
beta_prod=0.0785
beta_intern=0.0785
norm-logZ_w_pq = -24.6551
norm-logZ_uw_pq = -20.3631
After first quw fit, beta=0.08
min_delta_beta = 0.01
Updated beta = 0.07927895567026191
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7769],
        [-0.8611],
        [-0.8739],
        [-0.7385],
        [-0.5607],
        [-0.8428],
        [-0.8271],
        [-0.3219],
        

using beta2=0.04 at idx 34, at stage-1 = 59
ESS3 = 90
beta_prod=0.0793
beta_intern=0.0793
norm-logZ_w_pq = -24.7012
norm-logZ_uw_pq = -20.3314
After first quw fit, beta=0.08
min_delta_beta = 0.01
Updated beta = 0.08256143792375512
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.8309],
        [-0.8611],
        [-0.8714],
        [-0.7159],
        [-0.3706],
        [-0.8493],
        [-0.8280],
        [-0.3086],
        

using beta2=0.04 at idx 35, at stage-1 = 60
ESS3 = 90
beta_prod=0.0826
beta_intern=0.0826
norm-logZ_w_pq = -23.9362
norm-logZ_uw_pq = -20.3763
After first quw fit, beta=0.08
min_delta_beta = 0.01
Updated beta = 0.08338705230299266
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7543],
        [-0.9089],
        [-0.7992],
        [-0.9012],
        [-0.6117],
        [-0.8822],
        [-0.7556],
        [-0.3956],
        

using beta2=0.04 at idx 36, at stage-1 = 61
ESS3 = 76
beta_prod=0.0834
beta_intern=0.0834
norm-logZ_w_pq = -29.6248
norm-logZ_uw_pq = -20.4009
After first quw fit, beta=0.08
min_delta_beta = 0.01
Updated beta = 0.08422092282602259
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7758],
        [-0.8218],
        [-0.8011],
        [-0.8320],
        [-0.3313],
        [-0.8469],
        [-0.8215],
        [-0.2667],
        

using beta2=0.04 at idx 36, at stage-1 = 62
ESS3 = 66
beta_prod=0.0842
beta_intern=0.0842
norm-logZ_w_pq = -24.3374
norm-logZ_uw_pq = -20.5370
After first quw fit, beta=0.08
min_delta_beta = 0.01
Updated beta = 0.08506313205428281
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7398],
        [-0.8611],
        [-0.8738],
        [-0.9019],
        [-0.3117],
        [-0.8358],
        [-0.7963],
        [-0.2116],
        

using beta2=0.05 at idx 37, at stage-1 = 64
ESS3 = 90
beta_prod=0.0897
beta_intern=0.0897
norm-logZ_w_pq = -23.3719
norm-logZ_uw_pq = -20.6316
After first quw fit, beta=0.09
min_delta_beta = 0.01
Updated beta = 0.09063565360096132
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7319],
        [-0.7294],
        [-0.9213],
        [-0.6077],
        [-0.4172],
        [-0.7911],
        [-0.8207],
        [-0.2119],
        

using beta2=0.05 at idx 37, at stage-1 = 65
ESS3 = 73
beta_prod=0.0906
beta_intern=0.0906
norm-logZ_w_pq = -27.4945
norm-logZ_uw_pq = -20.4977
After first quw fit, beta=0.09
min_delta_beta = 0.01
Updated beta = 0.09154201013697093
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7897],
        [-0.6603],
        [-0.9213],
        [-0.7128],
        [-0.4808],
        [-0.8066],
        [-0.8284],
        [-0.2308],
        

using beta2=0.05 at idx 37, at stage-1 = 66
ESS3 = 88
beta_prod=0.0915
beta_intern=0.0915
norm-logZ_w_pq = -25.6853
norm-logZ_uw_pq = -20.8464
After first quw fit, beta=0.09
min_delta_beta = 0.01
Updated beta = 0.09245743023834063
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7319],
        [-0.8226],
        [-0.9212],
        [-0.6082],
        [-0.3177],
        [-0.8387],
        [-0.8283],
        [-0.1948],
        

using beta2=0.05 at idx 38, at stage-1 = 67
ESS3 = 83
beta_prod=0.0925
beta_intern=0.0925
norm-logZ_w_pq = -27.0478
norm-logZ_uw_pq = -20.9180
After first quw fit, beta=0.09
min_delta_beta = 0.01
Updated beta = 0.09338200454072404
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7359],
        [-0.7466],
        [-0.9213],
        [-0.7161],
        [-0.3278],
        [-0.8057],
        [-0.8280],
        [-0.1943],
        

using beta2=0.05 at idx 39, at stage-1 = 68
ESS3 = 82
beta_prod=0.0934
beta_intern=0.0934
norm-logZ_w_pq = -24.9861
norm-logZ_uw_pq = -20.8531
After first quw fit, beta=0.09
min_delta_beta = 0.01
Updated beta = 0.09710586781310544
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7355],
        [-0.7281],
        [-0.8741],
        [-0.7091],
        [-0.3115],
        [-0.8388],
        [-0.8280],
        [-0.1927],
        

using beta2=0.05 at idx 41, at stage-1 = 69
ESS3 = 90
beta_prod=0.0971
beta_intern=0.0971
norm-logZ_w_pq = -29.4525
norm-logZ_uw_pq = -20.7881
After first quw fit, beta=0.10
min_delta_beta = 0.01
Updated beta = 0.10453904801696051
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7385],
        [-0.6614],
        [-0.9082],
        [-0.6077],
        [-0.3123],
        [-0.8534],
        [-0.7937],
        [-0.2515],
        

using beta2=0.05 at idx 45, at stage-1 = 70
ESS3 = 90
beta_prod=0.1045
beta_intern=0.1045
norm-logZ_w_pq = -25.7448
norm-logZ_uw_pq = -20.9110
After first quw fit, beta=0.10
min_delta_beta = 0.01
Updated beta = 0.10558443849713012
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7376],
        [-0.8226],
        [-0.8166],
        [-0.7359],
        [-0.3306],
        [-0.8421],
        [-0.8280],
        [-0.1930],
        

using beta2=0.05 at idx 45, at stage-1 = 71
ESS3 = 81
beta_prod=0.1056
beta_intern=0.1056
norm-logZ_w_pq = -23.7482
norm-logZ_uw_pq = -21.0566
After first quw fit, beta=0.11
min_delta_beta = 0.01
Updated beta = 0.10743445369391026
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7284],
        [-0.5745],
        [-0.9216],
        [-0.6091],
        [-0.3114],
        [-0.7694],
        [-0.8301],
        [-0.0499],
        

using beta2=0.05 at idx 46, at stage-1 = 72
ESS3 = 90
beta_prod=0.1074
beta_intern=0.1074
norm-logZ_w_pq = -26.3831
norm-logZ_uw_pq = -21.2469
After first quw fit, beta=0.11
min_delta_beta = 0.01
Updated beta = 0.10850879823084937
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7398],
        [-0.7807],
        [-1.0533],
        [-0.7157],
        [-0.3337],
        [-0.7707],
        [-0.9318],
        [-0.2328],
        

using beta2=0.05 at idx 46, at stage-1 = 73
ESS3 = 89
beta_prod=0.1085
beta_intern=0.1085
norm-logZ_w_pq = -27.2140
norm-logZ_uw_pq = -21.0912
After first quw fit, beta=0.11
min_delta_beta = 0.01
Updated beta = 0.10989416776339513
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7286],
        [-0.8608],
        [-1.0500],
        [-0.7191],
        [-0.2177],
        [-0.8189],
        [-0.7939],
        [-0.1674],
        

using beta2=0.05 at idx 46, at stage-1 = 74
ESS3 = 90
beta_prod=0.1099
beta_intern=0.1099
norm-logZ_w_pq = -27.2179
norm-logZ_uw_pq = -21.2051
After first quw fit, beta=0.11
min_delta_beta = 0.01
Updated beta = 0.11773884528976775
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7284],
        [-0.6613],
        [-1.0509],
        [-0.7192],
        [-0.2269],
        [-0.7525],
        [-0.8233],
        [-0.1603],
        

using beta2=0.06 at idx 47, at stage-1 = 75
ESS3 = 90
beta_prod=0.1177
beta_intern=0.1177
norm-logZ_w_pq = -28.2797
norm-logZ_uw_pq = -21.3846
After first quw fit, beta=0.12
min_delta_beta = 0.01
Updated beta = 0.11891623374266543
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6896],
        [-0.7966],
        [-1.0509],
        [-0.7515],
        [-0.2198],
        [-0.8136],
        [-0.7534],
        [-0.0598],
        

using beta2=0.06 at idx 47, at stage-1 = 77
ESS3 = 90
beta_prod=0.1226
beta_intern=0.1226
norm-logZ_w_pq = -29.9276
norm-logZ_uw_pq = -21.3417
After first quw fit, beta=0.12
min_delta_beta = 0.01
Updated beta = 0.12381612772837317
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6552],
        [-0.7788],
        [-1.0509],
        [-0.7192],
        [-0.1593],
        [-0.7495],
        [-0.7931],
        [-0.0220],
        

using beta2=0.06 at idx 47, at stage-1 = 78
ESS3 = 83
beta_prod=0.1238
beta_intern=0.1238
norm-logZ_w_pq = -29.2945
norm-logZ_uw_pq = -21.6701
After first quw fit, beta=0.12
min_delta_beta = 0.01
Updated beta = 0.1250542890056569
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6339],
        [-0.6613],
        [-0.9885],
        [-0.6319],
        [-0.2178],
        [-0.7497],
        [-0.7934],
        [-0.0500],
        [

using beta2=0.06 at idx 48, at stage-1 = 79
ESS3 = 88
beta_prod=0.1251
beta_intern=0.1251
norm-logZ_w_pq = -26.2191
norm-logZ_uw_pq = -21.8431
After first quw fit, beta=0.13
min_delta_beta = 0.01
Updated beta = 0.12630483189571348
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6946],
        [-0.7357],
        [-1.0506],
        [-0.7657],
        [-0.1187],
        [-0.7212],
        [-0.7929],
        [ 0.0380],
        

using beta2=0.06 at idx 49, at stage-1 = 80
ESS3 = 82
beta_prod=0.1263
beta_intern=0.1263
norm-logZ_w_pq = -29.5881
norm-logZ_uw_pq = -21.6917
After first quw fit, beta=0.13
min_delta_beta = 0.01
Updated beta = 0.1304218378803176
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.7277],
        [-0.7357],
        [-1.0510],
        [-0.7657],
        [-0.1857],
        [-0.7212],
        [-0.6735],
        [-0.1919],
        [

using beta2=0.06 at idx 51, at stage-1 = 81
ESS3 = 90
beta_prod=0.1304
beta_intern=0.1304
norm-logZ_w_pq = -23.7876
norm-logZ_uw_pq = -19.3795
After first quw fit, beta=0.13
min_delta_beta = 0.01
Updated beta = 0.1317260562591208
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6008],
        [-0.7285],
        [-0.9217],
        [-0.7120],
        [-0.2181],
        [-0.7491],
        [-0.7932],
        [-0.1919],
        [

using beta2=0.06 at idx 51, at stage-1 = 83
ESS3 = 90
beta_prod=0.1336
beta_intern=0.1336
norm-logZ_w_pq = -21.9278
norm-logZ_uw_pq = -19.6211
After first quw fit, beta=0.13
min_delta_beta = 0.01
Updated beta = 0.13537324708061355
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6004],
        [-0.7357],
        [-1.0499],
        [-0.7657],
        [-0.1318],
        [-0.7206],
        [-0.7531],
        [ 0.0377],
        

using beta2=0.06 at idx 51, at stage-1 = 84
ESS3 = 90
beta_prod=0.1354
beta_intern=0.1354
norm-logZ_w_pq = -25.7745
norm-logZ_uw_pq = -19.4165
After first quw fit, beta=0.14
min_delta_beta = 0.01
Updated beta = 0.14402263875675328
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5773],
        [-0.6619],
        [-0.9213],
        [-0.7162],
        [-0.1612],
        [-0.7118],
        [-0.8677],
        [ 0.0113],
        

using beta2=0.07 at idx 52, at stage-1 = 85
ESS3 = 90
beta_prod=0.1440
beta_intern=0.1440
norm-logZ_w_pq = -23.9350
norm-logZ_uw_pq = -19.4495
After first quw fit, beta=0.14
min_delta_beta = 0.01
Updated beta = 0.1454628651443208
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6004],
        [-0.7346],
        [-0.9219],
        [-0.7192],
        [-0.0985],
        [-0.7210],
        [-0.8698],
        [ 0.0318],
        [

using beta2=0.07 at idx 53, at stage-1 = 86
ESS3 = 79
beta_prod=0.1455
beta_intern=0.1455
norm-logZ_w_pq = -28.5177
norm-logZ_uw_pq = -19.4947
After first quw fit, beta=0.15
min_delta_beta = 0.01
Updated beta = 0.14691749379576402
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5773],
        [-0.7357],
        [-0.9213],
        [-0.7341],
        [-0.2177],
        [-0.7121],
        [-0.8698],
        [-0.0263],
        

using beta2=0.07 at idx 54, at stage-1 = 87
ESS3 = 77
beta_prod=0.1469
beta_intern=0.1469
norm-logZ_w_pq = -26.2072
norm-logZ_uw_pq = -19.5119
After first quw fit, beta=0.15
min_delta_beta = 0.01
Updated beta = 0.14838666873372167
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5776],
        [-0.7361],
        [-0.9213],
        [-0.6349],
        [-0.0982],
        [-0.7126],
        [-0.8698],
        [-0.0081],
        

using beta2=0.07 at idx 55, at stage-1 = 88
ESS3 = 83
beta_prod=0.1484
beta_intern=0.1484
norm-logZ_w_pq = -27.6487
norm-logZ_uw_pq = -19.7206
After first quw fit, beta=0.15
min_delta_beta = 0.01
Updated beta = 0.14987053542105888
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5669],
        [-0.7360],
        [-0.9205],
        [-0.7191],
        [-0.1320],
        [-0.8340],
        [-0.7939],
        [-0.1920],
        

using beta2=0.08 at idx 56, at stage-1 = 89
ESS3 = 80
beta_prod=0.1499
beta_intern=0.1499
norm-logZ_w_pq = -25.2233
norm-logZ_uw_pq = -20.0659
After first quw fit, beta=0.15
min_delta_beta = 0.01
Updated beta = 0.15136924077526948
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5940],
        [-0.7357],
        [-0.9213],
        [-0.6343],
        [-0.2116],
        [-0.7127],
        [-0.8698],
        [-0.0977],
        

using beta2=0.08 at idx 57, at stage-1 = 90
ESS3 = 84
beta_prod=0.1514
beta_intern=0.1514
norm-logZ_w_pq = -27.7490
norm-logZ_uw_pq = -19.7919
After first quw fit, beta=0.15
min_delta_beta = 0.01
Updated beta = 0.15288293318302218
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5661],
        [-0.6603],
        [-0.8946],
        [-0.6084],
        [-0.1319],
        [-0.7118],
        [-0.8644],
        [-0.1919],
        

using beta2=0.08 at idx 58, at stage-1 = 92
ESS3 = 88
beta_prod=0.1544
beta_intern=0.1544
norm-logZ_w_pq = -23.6975
norm-logZ_uw_pq = -19.8571
After first quw fit, beta=0.15
min_delta_beta = 0.01
Updated beta = 0.15595588014000092
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5224],
        [-0.7278],
        [-0.9254],
        [-0.6342],
        [-0.1316],
        [-0.7125],
        [-0.8698],
        [-0.0072],
        

using beta2=0.08 at idx 59, at stage-1 = 93
ESS3 = 80
beta_prod=0.1560
beta_intern=0.1560
norm-logZ_w_pq = -27.3075
norm-logZ_uw_pq = -20.0377
After first quw fit, beta=0.16
min_delta_beta = 0.01
Updated beta = 0.15751543894140094
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5749],
        [-0.7357],
        [-0.8949],
        [-0.6505],
        [-0.1015],
        [-0.8334],
        [-0.8673],
        [-0.1920],
        

using beta2=0.08 at idx 59, at stage-1 = 94
ESS3 = 84
beta_prod=0.1575
beta_intern=0.1575
norm-logZ_w_pq = -24.1310
norm-logZ_uw_pq = -19.0299
After first quw fit, beta=0.16
min_delta_beta = 0.01
Updated beta = 0.15909059333081493
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5038],
        [-0.7269],
        [-0.8946],
        [-0.6303],
        [-0.2524],
        [-0.7118],
        [-0.8280],
        [-0.0979],
        

using beta2=0.08 at idx 60, at stage-1 = 95
ESS3 = 69
beta_prod=0.1591
beta_intern=0.1591
norm-logZ_w_pq = -21.7195
norm-logZ_uw_pq = -18.3701
After first quw fit, beta=0.16
min_delta_beta = 0.01
Updated beta = 0.1606814992641231
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.6004],
        [-0.7357],
        [-1.0504],
        [-0.6176],
        [-0.2179],
        [-0.7647],
        [-0.8395],
        [-0.0843],
        [

using beta2=0.08 at idx 60, at stage-1 = 96
ESS3 = 56
beta_prod=0.1607
beta_intern=0.1607
norm-logZ_w_pq = -21.5053
norm-logZ_uw_pq = -18.4083
After first quw fit, beta=0.16
min_delta_beta = 0.01
Updated beta = 0.16228831425676432
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.4939],
        [-0.7283],
        [-0.9198],
        [-0.6040],
        [-0.2529],
        [-0.7144],
        [-0.8116],
        [-0.0593],
        

using beta2=0.08 at idx 61, at stage-1 = 98
ESS3 = 66
beta_prod=0.1639
beta_intern=0.1639
norm-logZ_w_pq = -21.8201
norm-logZ_uw_pq = -18.6235
After first quw fit, beta=0.16
min_delta_beta = 0.01
Updated beta = 0.1655503093733253
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5553],
        [-0.7356],
        [-0.9218],
        [-0.6094],
        [-0.2182],
        [-0.7596],
        [-0.8386],
        [-0.1676],
        [

using beta2=0.08 at idx 62, at stage-1 = 100
ESS3 = 74
beta_prod=0.1672
beta_intern=0.1672
norm-logZ_w_pq = -20.9286
norm-logZ_uw_pq = -18.2415
After first quw fit, beta=0.17
min_delta_beta = 0.01
Updated beta = 0.16887787059172912
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5189],
        [-0.7353],
        [-0.9215],
        [-0.5085],
        [-0.2205],
        [-0.7118],
        [-0.8104],
        [-0.0593],
       

using beta2=0.09 at idx 64, at stage-1 = 102
ESS3 = 77
beta_prod=0.1706
beta_intern=0.1706
norm-logZ_w_pq = -20.7578
norm-logZ_uw_pq = -18.2035
After first quw fit, beta=0.17
min_delta_beta = 0.01
Updated beta = 0.17227231579062288
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5384],
        [-0.7663],
        [-0.9859],
        [-0.5799],
        [-0.2178],
        [-0.7495],
        [-0.6860],
        [-0.1671],
       

using beta2=0.09 at idx 64, at stage-1 = 103
ESS3 = 69
beta_prod=0.1723
beta_intern=0.1723
norm-logZ_w_pq = -21.3296
norm-logZ_uw_pq = -18.4934
After first quw fit, beta=0.17
min_delta_beta = 0.01
Updated beta = 0.1739950389485291
SNF model parameters: Parameter containing:
tensor([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]], requires_grad=True)
SNF model parameters: Parameter containing:
tensor([[-0.5543],
        [-0.7284],
        [-0.9859],
        [-0.3797],
        [-0.0238],
        [-0.4713],
        [-0.8106],
        [ 0.0132],
        

using beta2=0.09 at idx 64, at stage-1 = 104
ESS3 = 65
beta_prod=0.1740
beta_intern=0.1740
norm-logZ_w_pq = -21.4245
norm-logZ_uw_pq = -17.8451
After first quw fit, beta=0.17
min_delta_beta = 0.01
Updated beta = 0.1757349893380144


ValueError: optimizer got an empty parameter list