In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
import os
import numpy as np
import pandas as pd
#from evcouplings.align import Alignment, map_matrix, ALPHABET_RNA, ALPHABET_PROTEIN
ALPHABET_PROTEIN = '-ACDEFGHIKLMNPQRSTVWY'
from collections import OrderedDict
from torch.utils.data import DataLoader, TensorDataset
from tqdm import tqdm
from sklearn.metrics import roc_auc_score

from itertools import combinations, product
import torch
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib import rcParams
from joblib import Parallel, delayed, parallel_backend
from pathlib import Path
from Bio import SeqIO

import scipy.stats
from scipy.stats import spearmanr
from potts import Potts
from potts.mcmc import GWGCategoricalSampler, ReplayBuffer, CategoricalGibbsSampler, OneHotCategorical, CategoricalMetropolistHastingsSampler, PottsGWGCategoricalSampler, UniformCategoricalSampler, PottsGWGHardWallCategoricalSampler
from potts.structure import get_single_double_mutants, esm_inv_nll_from_encoder, esm_inv_batch_encoding, potts_from_nlls
import pandas as pd
import torch.nn.functional as F
from sklearn.metrics import roc_auc_score



In [3]:
torch.cuda.set_device(0)

In [4]:
def encode(seqs, alphabet=ALPHABET_PROTEIN, verbose=True):
    '''
    Go from letters to numbers
    '''
    aa_to_i = OrderedDict((aa, i) for i, aa in enumerate( alphabet ))
    if verbose:
        seq_iter = tqdm(seqs)
    else:
        seq_iter = seqs
    X = torch.tensor([[aa_to_i[x] for x in seq] 
                      for seq in seq_iter])
    return X, aa_to_i

In [13]:
def train_sgd(model, train_X, train_w, lam, bs=1000, lr=1e-1, device='cuda', n_epoch=10,
              mut_seqs_onehot=None, y_dms=None, contact_map=None):
    L, A = model.L, model.A
    wrs = torch.utils.data.WeightedRandomSampler(train_w / train_w.sum(), len(train_X), replacement=True)
    bs = min(len(train_X), bs)
    train_dl = DataLoader(TensorDataset(train_X, train_w), batch_size=bs, drop_last=True, sampler=wrs)
    model.to(device)
    optim = torch.optim.SGD(model.parameters(), lr=lr)
    epoch_iter = tqdm(range(n_epoch), total=n_epoch, position=0)
    num_iters = 0
    spearman = 0

    if not contact_map is None:
        contact_map = torch.tensor(contact_map).unsqueeze(-1).unsqueeze(-1).cuda()
    for epoch in epoch_iter:
        epoch_l = 0.0
        model.train()
        total_train_pl = []
        total_w = []
        for X, w in train_dl:
            X, w = X.to(device), w.to(device)
            optim.zero_grad()
            mask = X.argmax(dim=-1) != 0
            mask_w = mask.sum(dim=-1) / mask.shape[-1]
            pl = model.pseudolikelihood(X, mask=mask) * mask_w
            #pl = model.pseudolikelihood(X, mask=None)
            loss = -(w * pl).sum() / w.sum()
            epoch_l += (-(w * pl).sum()).item()
            # regularization
            W = model.W.weight
            reg_loss = (model.h ** 2).sum()
            reg_loss += ((W ** 2).sum() ) * (model.L - 1) * (model.A - 1)
            loss += lam * reg_loss 
            loss.backward()
            optim.step()

            num_iters += 1
            #epoch_iter.set_postfix(spearman=spearman, num_iters=num_iters, loss=loss.item(), reg_loss=lam*reg_loss.item())
        if not (mut_seqs_onehot is None):
            with torch.no_grad():
                bs = 1000
                all_preds = []
                for i in range(np.ceil(len(mut_seqs_onehot) / bs).astype(int)):
                    prior_pred = -model(mut_seqs_onehot[i*bs:(i+1)*bs].to(device)).cpu().numpy()
                    all_preds.append(prior_pred)
                all_preds = np.concatenate(all_preds)
                spearman = spearmanr(all_preds, y_dms).correlation
                epoch_iter.set_postfix(spearman=spearman, num_iters=num_iters, loss=loss.item(), mem=torch.cuda.memory_allocated() , epoch_l=epoch_l)
    model.eval()
    return model


In [7]:
df = pd.read_csv('/home/hunter/projects/recombination/ProteinGym/Tranception/proteingym/Detailed_performance_files/Substitutions/Spearman/all_models_substitutions_Spearman_DMS_level.csv')
df = df.rename(columns={df.columns[0]: 'Dataset'})
dataset = 'BLAT_ECOLX_Stiffler_2015'

# get beta-lactamase MSA
msa_fn = Path('/home/hunter/projects/recombination/ProteinGym/MSA_files/BLAT_ECOLX_full_11-26-2021_b02.a2m')
# get beta-lactamase DMS data
mut_fn = Path('/home/hunter/projects/recombination/ProteinGym/ProteinGym_substitutions/BLAT_ECOLX_Stiffler_2015.csv')
# get beta-lactamase MSA sequence weights
weight_fn = Path('/home/hunter/projects/recombination/ProteinGym/substitutions_MSAs_all_positions/BLAT_ECOLX_theta_0.2.npy')
# get ProteinGym results
res_fn = Path('/home/hunter/projects/recombination/ProteinGym/substitutions/BLAT_ECOLX_Stiffler_2015.csv')


mut_df = pd.read_csv(mut_fn)
res_df = pd.read_csv(res_fn)


y_bin = mut_df.DMS_score_bin.to_numpy()
ev_spearman = scipy.stats.spearmanr(res_df.EVmutation, res_df.DMS_score).correlation
print()
print(f"EVmutation Spearman: {ev_spearman:.3f}", )


EVmutation Spearman: 0.707


In [8]:
aa_to_i = OrderedDict((aa, i) for i, aa in enumerate( ALPHABET_PROTEIN ))
y_dms = res_df.DMS_score.to_numpy()
mut_seqs = mut_df.mutated_sequence.map(lambda x: [aa_to_i[x[i]] for i in range(len(x))]).to_list()
mut_seqs = torch.tensor(mut_seqs)
mut_seqs_onehot = torch.nn.functional.one_hot(mut_seqs, num_classes=len(ALPHABET_PROTEIN)).to(torch.float)


In [9]:
'''
CREATE TRAINING DATA
'''
def check_sequence(s, alphabet=ALPHABET_PROTEIN):
    for aa in s:
        if aa not in ALPHABET_PROTEIN:
            return False
    return True

msa_sequences = [str(x.seq) for x in SeqIO.parse(msa_fn, 'fasta')]
msa_sequences = [s.replace(".", "-").upper() for s in msa_sequences]
wt_seq = msa_sequences[0]
columns_to_keep = [i for i in range(len(wt_seq))]
msa_sequences = [[s[i] for i in columns_to_keep] for s in msa_sequences]
#msa_sequences = [[s[i].upper() for i in columns_to_keep] for s in msa_sequences]
#msa_sequences = [[aa.replace(".", "-") for aa in s] for s in msa_sequences]
msa_sequences = np.asarray(msa_sequences)
msa_sequences = [s for s in msa_sequences if check_sequence(s)]
msa_sequences = np.asarray(msa_sequences)
if False:
    threshold_sequence_frac_gaps=0.5
    threshold_focus_cols_frac_gaps=0.3
    gap_array = np.asarray([[1 if aa == "-" else 0 for aa in s] for s in msa_sequences])
    msa_sequences = msa_sequences[~(gap_array.mean(axis=1) > threshold_sequence_frac_gaps)]
    msa_sequences = msa_sequences[:, ~(gap_array.mean(axis=0) > threshold_focus_cols_frac_gaps)]

seqs_enc, aa_to_i = encode(msa_sequences)
i_to_a = {i:aa for i, aa in enumerate(ALPHABET_PROTEIN)}
weights = np.load(weight_fn)
assert weights.shape[0] == len(msa_sequences)
seqs_onehot = torch.nn.functional.one_hot(seqs_enc, num_classes=len(ALPHABET_PROTEIN)).to(torch.float)
train_ds = TensorDataset(seqs_onehot, torch.tensor(weights))

  0%|                                                                                                                                                             | 0/208923 [00:00<?, ?it/s]

  1%|█▉                                                                                                                                             | 2904/208923 [00:00<00:07, 29034.49it/s]

  3%|███▉                                                                                                                                           | 5808/208923 [00:00<00:07, 28997.33it/s]

  4%|█████▉                                                                                                                                         | 8708/208923 [00:00<00:06, 28947.74it/s]

  6%|███████▉                                                                                                                                      | 11603/208923 [00:00<00:06, 28493.89it/s]

  7%|█████████▊                                                                                                                                    | 14510/208923 [00:00<00:06, 28699.10it/s]

  8%|███████████▊                                                                                                                                  | 17401/208923 [00:00<00:06, 28769.22it/s]

 10%|█████████████▊                                                                                                                                | 20279/208923 [00:00<00:06, 28417.50it/s]

 11%|███████████████▊                                                                                                                              | 23173/208923 [00:00<00:06, 28579.59it/s]

 12%|█████████████████▋                                                                                                                            | 26072/208923 [00:00<00:06, 28704.53it/s]

 14%|███████████████████▋                                                                                                                          | 28944/208923 [00:01<00:06, 28285.13it/s]

 15%|█████████████████████▋                                                                                                                        | 31828/208923 [00:01<00:06, 28449.94it/s]

 17%|███████████████████████▌                                                                                                                      | 34709/208923 [00:01<00:06, 28555.39it/s]

 18%|█████████████████████████▌                                                                                                                    | 37566/208923 [00:01<00:08, 20601.53it/s]

 19%|███████████████████████████▍                                                                                                                  | 40380/208923 [00:01<00:07, 22384.93it/s]

 21%|█████████████████████████████▍                                                                                                                | 43248/208923 [00:01<00:06, 23973.90it/s]

 22%|███████████████████████████████▏                                                                                                              | 45921/208923 [00:01<00:06, 24703.95it/s]

 23%|█████████████████████████████████▏                                                                                                            | 48793/208923 [00:01<00:06, 25805.28it/s]

 25%|███████████████████████████████████                                                                                                           | 51654/208923 [00:01<00:05, 26595.51it/s]

 26%|████████████████████████████████████▉                                                                                                         | 54405/208923 [00:02<00:05, 26641.35it/s]

 27%|██████████████████████████████████████▉                                                                                                       | 57269/208923 [00:02<00:05, 27218.63it/s]

 29%|████████████████████████████████████████▊                                                                                                     | 60049/208923 [00:02<00:05, 27388.27it/s]

 30%|██████████████████████████████████████████▋                                                                                                   | 62822/208923 [00:02<00:05, 27243.40it/s]

 31%|████████████████████████████████████████████▌                                                                                                 | 65570/208923 [00:02<00:05, 27272.53it/s]

 33%|██████████████████████████████████████████████▌                                                                                               | 68468/208923 [00:02<00:05, 27775.83it/s]

 34%|████████████████████████████████████████████████▍                                                                                             | 71258/208923 [00:02<00:04, 27639.94it/s]

 35%|██████████████████████████████████████████████████▍                                                                                           | 74162/208923 [00:02<00:04, 28052.12it/s]

 37%|████████████████████████████████████████████████████▍                                                                                         | 77073/208923 [00:02<00:04, 28364.50it/s]

 38%|██████████████████████████████████████████████████████▎                                                                                       | 79915/208923 [00:02<00:04, 28080.92it/s]

 40%|████████████████████████████████████████████████████████▎                                                                                     | 82813/208923 [00:03<00:04, 28344.98it/s]

 41%|██████████████████████████████████████████████████████████▏                                                                                   | 85651/208923 [00:03<00:04, 27602.77it/s]

 42%|████████████████████████████████████████████████████████████                                                                                  | 88418/208923 [00:03<00:04, 27365.06it/s]

 44%|██████████████████████████████████████████████████████████████                                                                                | 91339/208923 [00:03<00:04, 27902.79it/s]

 45%|████████████████████████████████████████████████████████████████                                                                              | 94249/208923 [00:03<00:04, 28254.26it/s]

 46%|█████████████████████████████████████████████████████████████████▉                                                                            | 97078/208923 [00:03<00:03, 28033.32it/s]

 48%|███████████████████████████████████████████████████████████████████▉                                                                          | 99884/208923 [00:03<00:03, 27939.45it/s]

 49%|█████████████████████████████████████████████████████████████████████▎                                                                       | 102772/208923 [00:03<00:03, 28216.19it/s]

 51%|███████████████████████████████████████████████████████████████████████▎                                                                     | 105596/208923 [00:03<00:03, 27894.04it/s]

 52%|█████████████████████████████████████████████████████████████████████████▏                                                                   | 108446/208923 [00:03<00:03, 28071.93it/s]

 53%|███████████████████████████████████████████████████████████████████████████                                                                  | 111257/208923 [00:04<00:03, 28082.27it/s]

 55%|████████████████████████████████████████████████████████████████████████████▉                                                                | 114067/208923 [00:04<00:03, 27654.28it/s]

 56%|██████████████████████████████████████████████████████████████████████████████▊                                                              | 116835/208923 [00:04<00:03, 27603.02it/s]

 57%|████████████████████████████████████████████████████████████████████████████████▊                                                            | 119723/208923 [00:04<00:03, 27978.63it/s]

 59%|██████████████████████████████████████████████████████████████████████████████████▋                                                          | 122523/208923 [00:04<00:03, 27854.49it/s]

 60%|████████████████████████████████████████████████████████████████████████████████████▋                                                        | 125398/208923 [00:04<00:02, 28119.32it/s]

 61%|██████████████████████████████████████████████████████████████████████████████████████▌                                                      | 128266/208923 [00:04<00:02, 28284.46it/s]

 63%|████████████████████████████████████████████████████████████████████████████████████████▍                                                    | 131096/208923 [00:04<00:02, 27985.01it/s]

 64%|██████████████████████████████████████████████████████████████████████████████████████████▍                                                  | 133953/208923 [00:04<00:02, 28155.80it/s]

 65%|████████████████████████████████████████████████████████████████████████████████████████████▎                                                | 136774/208923 [00:04<00:02, 27905.88it/s]

 67%|██████████████████████████████████████████████████████████████████████████████████████████████▏                                              | 139643/208923 [00:05<00:02, 28136.51it/s]

 68%|████████████████████████████████████████████████████████████████████████████████████████████████▏                                            | 142507/208923 [00:05<00:02, 28285.34it/s]

 70%|██████████████████████████████████████████████████████████████████████████████████████████████████                                           | 145337/208923 [00:05<00:02, 27922.73it/s]

 71%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                                         | 148131/208923 [00:05<00:03, 16831.85it/s]

 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████▉                                       | 150982/208923 [00:05<00:03, 19203.39it/s]

 74%|███████████████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 153841/208923 [00:05<00:02, 21312.72it/s]

 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                   | 156509/208923 [00:05<00:02, 22615.84it/s]

 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                 | 159375/208923 [00:06<00:02, 24171.75it/s]

 78%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                               | 162203/208923 [00:06<00:01, 25275.13it/s]

 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                             | 164917/208923 [00:06<00:01, 25572.71it/s]

 80%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 167753/208923 [00:06<00:01, 26356.86it/s]

 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████                          | 170583/208923 [00:06<00:01, 26913.94it/s]

 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                        | 173345/208923 [00:06<00:01, 26725.71it/s]

 84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                      | 176161/208923 [00:06<00:01, 27140.16it/s]

 86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                    | 178978/208923 [00:06<00:01, 27441.56it/s]

 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                  | 181748/208923 [00:06<00:01, 27119.72it/s]

 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                | 184570/208923 [00:06<00:00, 27440.09it/s]

 90%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍              | 187389/208923 [00:07<00:00, 27661.15it/s]

 91%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 190166/208923 [00:07<00:00, 27348.15it/s]

 92%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏          | 192982/208923 [00:07<00:00, 27586.02it/s]

 94%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏        | 195798/208923 [00:07<00:00, 27754.70it/s]

 95%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████       | 198578/208923 [00:07<00:00, 27345.21it/s]

 96%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉     | 201390/208923 [00:07<00:00, 27571.09it/s]

 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊   | 204201/208923 [00:07<00:00, 27729.41it/s]

 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋ | 206977/208923 [00:07<00:00, 27288.78it/s]

100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 208923/208923 [00:07<00:00, 26734.08it/s]




In [11]:
train_X, train_w = train_ds[:]
wt_enc = train_X[0].argmax(dim=-1)

In [14]:
##############################################################
############## Train Potts Model #############################
##############################################################
device='cuda'

seq_len = len(msa_sequences[0])
num_tokens = 21
model = Potts(seq_len, num_tokens, wt_enc=None)
lam=1e-7
lr=1e-1
n_epoch=20
model = train_sgd(model, train_X, train_w, lam, bs=1000, lr=lr, device=device, n_epoch=n_epoch, mut_seqs_onehot=mut_seqs_onehot, y_dms=y_dms)

  0%|                                                                                                                                                                 | 0/20 [00:00<?, ?it/s]

  0%|                                                                                           | 0/20 [00:05<?, ?it/s, epoch_l=4.33e+7, loss=257, mem=6.2e+8, num_iters=208, spearman=0.682]

  5%|████▏                                                                              | 1/20 [00:05<01:35,  5.04s/it, epoch_l=4.33e+7, loss=257, mem=6.2e+8, num_iters=208, spearman=0.682]

  5%|████▏                                                                              | 1/20 [00:09<01:35,  5.04s/it, epoch_l=3.67e+7, loss=236, mem=6.2e+8, num_iters=416, spearman=0.694]

 10%|████████▎                                                                          | 2/20 [00:09<01:25,  4.75s/it, epoch_l=3.67e+7, loss=236, mem=6.2e+8, num_iters=416, spearman=0.694]

 10%|████████▌                                                                            | 2/20 [00:14<01:25,  4.75s/it, epoch_l=3.41e+7, loss=226, mem=6.2e+8, num_iters=624, spearman=0.7]

 15%|████████████▊                                                                        | 3/20 [00:14<01:18,  4.65s/it, epoch_l=3.41e+7, loss=226, mem=6.2e+8, num_iters=624, spearman=0.7]

 15%|████████████▍                                                                      | 3/20 [00:18<01:18,  4.65s/it, epoch_l=3.26e+7, loss=218, mem=6.2e+8, num_iters=832, spearman=0.706]

 20%|████████████████▌                                                                  | 4/20 [00:18<01:13,  4.58s/it, epoch_l=3.26e+7, loss=218, mem=6.2e+8, num_iters=832, spearman=0.706]

 20%|████████████████▍                                                                 | 4/20 [00:23<01:13,  4.58s/it, epoch_l=3.14e+7, loss=214, mem=6.2e+8, num_iters=1040, spearman=0.707]

 25%|████████████████████▌                                                             | 5/20 [00:23<01:08,  4.57s/it, epoch_l=3.14e+7, loss=214, mem=6.2e+8, num_iters=1040, spearman=0.707]

 25%|████████████████████▊                                                              | 5/20 [00:27<01:08,  4.57s/it, epoch_l=3.04e+7, loss=211, mem=6.2e+8, num_iters=1248, spearman=0.71]

 30%|████████████████████████▉                                                          | 6/20 [00:27<01:04,  4.58s/it, epoch_l=3.04e+7, loss=211, mem=6.2e+8, num_iters=1248, spearman=0.71]

 30%|████████████████████████▌                                                         | 6/20 [00:32<01:04,  4.58s/it, epoch_l=2.98e+7, loss=204, mem=6.2e+8, num_iters=1456, spearman=0.711]

 35%|████████████████████████████▋                                                     | 7/20 [00:32<00:59,  4.58s/it, epoch_l=2.98e+7, loss=204, mem=6.2e+8, num_iters=1456, spearman=0.711]

 35%|████████████████████████████▋                                                     | 7/20 [00:36<00:59,  4.58s/it, epoch_l=2.92e+7, loss=205, mem=6.2e+8, num_iters=1664, spearman=0.712]

 40%|████████████████████████████████▊                                                 | 8/20 [00:36<00:54,  4.58s/it, epoch_l=2.92e+7, loss=205, mem=6.2e+8, num_iters=1664, spearman=0.712]

 40%|████████████████████████████████▊                                                 | 8/20 [00:41<00:54,  4.58s/it, epoch_l=2.87e+7, loss=206, mem=6.2e+8, num_iters=1872, spearman=0.713]

 45%|████████████████████████████████████▉                                             | 9/20 [00:41<00:50,  4.58s/it, epoch_l=2.87e+7, loss=206, mem=6.2e+8, num_iters=1872, spearman=0.713]

 45%|████████████████████████████████████▉                                             | 9/20 [00:46<00:50,  4.58s/it, epoch_l=2.83e+7, loss=203, mem=6.2e+8, num_iters=2080, spearman=0.713]

 50%|████████████████████████████████████████▌                                        | 10/20 [00:46<00:45,  4.57s/it, epoch_l=2.83e+7, loss=203, mem=6.2e+8, num_iters=2080, spearman=0.713]

 50%|█████████████████████████████████████████                                         | 10/20 [00:50<00:45,  4.57s/it, epoch_l=2.79e+7, loss=198, mem=6.2e+8, num_iters=2288, spearman=0.71]

 55%|█████████████████████████████████████████████                                     | 11/20 [00:50<00:41,  4.57s/it, epoch_l=2.79e+7, loss=198, mem=6.2e+8, num_iters=2288, spearman=0.71]

 55%|████████████████████████████████████████████▌                                    | 11/20 [00:55<00:41,  4.57s/it, epoch_l=2.76e+7, loss=199, mem=6.2e+8, num_iters=2496, spearman=0.711]

 60%|████████████████████████████████████████████████▌                                | 12/20 [00:55<00:36,  4.58s/it, epoch_l=2.76e+7, loss=199, mem=6.2e+8, num_iters=2496, spearman=0.711]

 60%|█████████████████████████████████████████████████▏                                | 12/20 [00:59<00:36,  4.58s/it, epoch_l=2.73e+7, loss=197, mem=6.2e+8, num_iters=2704, spearman=0.71]

 65%|█████████████████████████████████████████████████████▎                            | 13/20 [00:59<00:32,  4.60s/it, epoch_l=2.73e+7, loss=197, mem=6.2e+8, num_iters=2704, spearman=0.71]

 65%|████████████████████████████████████████████████████▋                            | 13/20 [01:04<00:32,  4.60s/it, epoch_l=2.71e+7, loss=198, mem=6.2e+8, num_iters=2912, spearman=0.708]

 70%|████████████████████████████████████████████████████████▋                        | 14/20 [01:04<00:27,  4.61s/it, epoch_l=2.71e+7, loss=198, mem=6.2e+8, num_iters=2912, spearman=0.708]

 70%|████████████████████████████████████████████████████████▋                        | 14/20 [01:09<00:27,  4.61s/it, epoch_l=2.68e+7, loss=198, mem=6.2e+8, num_iters=3120, spearman=0.708]

 75%|████████████████████████████████████████████████████████████▊                    | 15/20 [01:09<00:23,  4.62s/it, epoch_l=2.68e+7, loss=198, mem=6.2e+8, num_iters=3120, spearman=0.708]

 75%|████████████████████████████████████████████████████████████▊                    | 15/20 [01:13<00:23,  4.62s/it, epoch_l=2.66e+7, loss=198, mem=6.2e+8, num_iters=3328, spearman=0.708]

 80%|████████████████████████████████████████████████████████████████▊                | 16/20 [01:13<00:18,  4.60s/it, epoch_l=2.66e+7, loss=198, mem=6.2e+8, num_iters=3328, spearman=0.708]

 80%|█████████████████████████████████████████████████████████████████▌                | 16/20 [01:18<00:18,  4.60s/it, epoch_l=2.64e+7, loss=196, mem=6.2e+8, num_iters=3536, spearman=0.71]

 85%|█████████████████████████████████████████████████████████████████████▋            | 17/20 [01:18<00:13,  4.62s/it, epoch_l=2.64e+7, loss=196, mem=6.2e+8, num_iters=3536, spearman=0.71]

 85%|████████████████████████████████████████████████████████████████████▊            | 17/20 [01:22<00:13,  4.62s/it, epoch_l=2.63e+7, loss=196, mem=6.2e+8, num_iters=3744, spearman=0.709]

 90%|████████████████████████████████████████████████████████████████████████▉        | 18/20 [01:22<00:09,  4.63s/it, epoch_l=2.63e+7, loss=196, mem=6.2e+8, num_iters=3744, spearman=0.709]

 90%|█████████████████████████████████████████████████████████████████████████▊        | 18/20 [01:27<00:09,  4.63s/it, epoch_l=2.61e+7, loss=196, mem=6.2e+8, num_iters=3952, spearman=0.71]

 95%|█████████████████████████████████████████████████████████████████████████████▉    | 19/20 [01:27<00:04,  4.65s/it, epoch_l=2.61e+7, loss=196, mem=6.2e+8, num_iters=3952, spearman=0.71]

 95%|██████████████████████████████████████████████████████████████████████████████▊    | 19/20 [01:32<00:04,  4.65s/it, epoch_l=2.6e+7, loss=198, mem=6.2e+8, num_iters=4160, spearman=0.71]

100%|███████████████████████████████████████████████████████████████████████████████████| 20/20 [01:32<00:00,  4.65s/it, epoch_l=2.6e+7, loss=198, mem=6.2e+8, num_iters=4160, spearman=0.71]

100%|███████████████████████████████████████████████████████████████████████████████████| 20/20 [01:32<00:00,  4.62s/it, epoch_l=2.6e+7, loss=198, mem=6.2e+8, num_iters=4160, spearman=0.71]




In [17]:
def sample_potts(model, replay_buffer, proposal_dist, n_steps, device):
    # get samples from replay buffer
    samples = replay_buffer.sample()
    samples = samples.to(device)
    # update samples with MCMC using proposal_dist
    samples_new = proposal_dist.sample_nsteps(samples, model, n_steps)
    # update replay buffer
    replay_buffer.update(samples_new)
    return samples_new


bs = 1000
proposal_dist = PottsGWGCategoricalSampler(bs, seq_len, num_tokens, device)
init_X = train_X[:bs].to(device)

In [25]:
n_steps = 100
init_X = train_X[:bs].to(device)
samples_new = proposal_dist.sample_nsteps(init_X, model, n_steps)

In [30]:
with torch.no_grad():
    energies = model(samples_new)
    print(energies.mean())
    

tensor(-695.5458, device='cuda:0')


In [31]:
n_steps = 100
init_X = train_X[:bs].to(device)

model.temp = 0.2 # set temperature lower
samples_new = proposal_dist.sample_nsteps(init_X, model, n_steps)

with torch.no_grad():
    energies = model(samples_new)
    print(energies.mean())

# we will get lower energy sample

tensor(-863.5359, device='cuda:0')
