In [1]:
# import model as M
# import evaluate as E
import config as CFG
import os
import json
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader
from transformers import AutoTokenizer, AutoModel, BatchEncoding, BertModel
from tqdm import tqdm

In [2]:
model_checkpoint = "bert-base-uncased"
tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)

In [3]:
DATASET_ROOT= 'exp/data/'
RESULT_ROOT = "exp/result_bert_base_uncased_summarly"
METHOD = 'summar_ly'

DATASETS = ["cnn_dailymail"]

In [4]:
def convert_single_example(example):
    doc_sents = ["[CLS] " + sent for sent in example["doc"]]
    doc_text = " ".join(doc_sents)

    samples = []

    for _sum in example["sums"]:
        sum_sents = ["[CLS] " + sent["text"] for sent in _sum["sample"]]
        labels = [[sent["fact"], sent["ling"]] for sent in _sum["sample"]]
        sum_text = " ".join(sum_sents)

        inputs = tokenizer(doc_text, sum_text, 
        padding='max_length', truncation="longest_first", return_tensors="pt")
        cov_label = [-100] * tokenizer.model_max_length
        sum_label = [[-100, -100]] * tokenizer.model_max_length
        
        # Align coverage label
        cnt = 0
        sep = -1
        for i in range(1, tokenizer.model_max_length):
            if inputs["input_ids"][0][i] == tokenizer.sep_token_id:
                sep = i
                break
            elif inputs["input_ids"][0][i] == tokenizer.cls_token_id:
                cov_label[i] = int(_sum["coverage"][cnt])
                cnt += 1
        cnt = 0
        # Align fact/ling label
        for i in range(sep, tokenizer.model_max_length):
            if inputs["input_ids"][0][i] == tokenizer.cls_token_id:
                sum_label[i] = labels[cnt]
                cnt += 1

        final_label = np.hstack([np.array(cov_label).reshape(-1, 1), np.array(sum_label)])
        
        inputs = {k: v.squeeze() for k, v in inputs.items()}
        samples.append((inputs, torch.Tensor(final_label)))
        
    return samples

In [5]:
class TokenizedDataset(Dataset):
    def __init__(self, datapath, limit = None):
        self.data = []
        with open(datapath, "r", encoding="utf-8") as f:
            for line in tqdm(f):
                example = json.loads(line)
                samples = convert_single_example(example)
                size = len(samples)
                for i in range(1, size):
                    self.data.append((samples[0], samples[i]))
                
                if not limit is None:
                    limit -= 1
                    if limit == 0: break

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        return self.data[idx][0], self.data[idx][1]

In [6]:
class TokenizedTestset(Dataset):
    def __init__(self, datapath, limit = None):
        self.data = []
        with open(datapath, "r", encoding="utf-8") as f:
            for line in tqdm(f):
                example = json.loads(line)
                samples = convert_single_example(example)
                self.data.extend(samples)

                if not limit is None:
                    limit -= 1
                    if limit == 0: break

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        return self.data[idx]

In [5]:
class Scorer(nn.Module):
    def __init__(self):
        super(Scorer, self).__init__()
        self.model = AutoModel.from_pretrained(CFG.BERT_MODEL)
        self.score_head = nn.Linear(self.model.config.hidden_size, 1)
        self.classify_head = nn.Linear(self.model.config.hidden_size, 3)
    
    def forward(self, inputs):
        outputs = self.model(**inputs)
        score = self.score_head(outputs.pooler_output)
        logits = self.classify_head(outputs.last_hidden_state)

        return score, logits

In [8]:
def test(model, test_set):
    model.eval()
    test_dataloader = DataLoader(test_set, batch_size=CFG.BATCH_SIZE)
    tps = 0
    fps = 0
    fns = 0
    with torch.no_grad():
        for batch in test_dataloader:
            inputs, labels = batch
            labels = labels.to(CFG.DEVICE)
            inputs = BatchEncoding(inputs).to(CFG.DEVICE)
            
            score, logits = model(inputs)
            preds = F.sigmoid(logits) >= 0.5
            tp = torch.sum((preds == 1) * (labels == 1))
            fp = torch.sum((preds == 1) * (labels == 0))
            fn = torch.sum((preds == 0) * (labels == 1))
            tps += tp.item()
            fps += fp.item()
            fns += fn.item()

    model.train()
    precision = tps / (fps + tps)
    recall = tps / (tps + fns)
    return precision, recall


In [9]:
def train_model(model, train_set, test_set = None, max_iter=CFG.MAX_ITERATION):
    train_dataloader = DataLoader(train_set, batch_size=CFG.BATCH_SIZE, shuffle=True)
    optimizer = torch.optim.Adam(model.parameters(), lr = CFG.LR)
    score_loss_fn = nn.CrossEntropyLoss()
    class_loss_fn = nn.BCEWithLogitsLoss(reduction='none')

    running_loss = 0.0
    num_iter = 0
    with tqdm(total=max_iter) as pbar:
        while num_iter < max_iter:
            for pos, neg in train_dataloader:
                if num_iter >= max_iter:
                    break
                inputs_pos, labels_pos = pos
                inputs_neg, labels_neg = neg
                labels_pos = labels_pos.to(CFG.DEVICE)
                labels_neg = labels_neg.to(CFG.DEVICE)
                inputs_pos = BatchEncoding(inputs_pos).to(CFG.DEVICE)
                inputs_neg = BatchEncoding(inputs_neg).to(CFG.DEVICE)

                score_pos, logits_pos = model(inputs_pos)
                score_neg, logits_neg = model(inputs_neg)
                mask_pos = labels_pos != -100
                mask_neg = labels_neg != -100

                # Preference Loss
                score_cat = torch.cat((score_pos, score_neg), -1)
                score_labels = torch.tensor([0]*labels_pos.shape[0], dtype=torch.long).to(CFG.DEVICE)
                loss_score = score_loss_fn(score_cat, score_labels)
                # Classification Loss
                loss_class_pos = class_loss_fn(logits_pos, labels_pos) * mask_pos
                loss_class_neg = class_loss_fn(logits_neg, labels_neg) * mask_neg
                loss = loss_score + torch.sum(loss_class_pos)/torch.sum(mask_pos) + torch.sum(loss_class_neg) / torch.sum(mask_neg)

                optimizer.zero_grad()
                loss.backward()
                optimizer.step()
                running_loss += loss.item()

                num_iter += 1
                pbar.update(1)
                if num_iter % 1000 == 999:
                    pbar.write("Iteration {}, Loss {}".format(num_iter+1, running_loss))
                    running_loss = 0.0
                    if not test_set is None:
                        pbar.write("Testing...")
                        p, r = test(model, test_set)
                        pbar.write("Precision {:.2f}, recall {:.2f}".format(p, r))
                        

In [10]:
def train():
    for DATASET in DATASETS:
        train_set = TokenizedDataset(os.path.join(DATASET_ROOT, DATASET, METHOD, 'train.jsonl'))
        test_set = TokenizedTestset(os.path.join(DATASET_ROOT, DATASET, METHOD, 'test.jsonl'))
        
        model = Scorer()
        model.to(CFG.DEVICE)

        train_model(model, train_set, test_set)

        CKPT_PATH = os.path.join(RESULT_ROOT, DATASET, METHOD, "model.pth")
        if not os.path.exists(os.path.dirname(CKPT_PATH)):
            os.makedirs(os.path.dirname(CKPT_PATH))

        torch.save(model.state_dict(), CKPT_PATH)

        del model
        torch.cuda.empty_cache()

In [11]:
train()

40000it [1:05:45, 10.14it/s]
11490it [19:40,  9.74it/s]
Some weights of the model checkpoint at bert-base-uncased were not used when initializing BertModel: ['cls.predictions.transform.LayerNorm.weight', 'cls.predictions.bias', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.transform.dense.bias', 'cls.seq_relationship.bias', 'cls.seq_relationship.weight', 'cls.predictions.decoder.weight', 'cls.predictions.transform.dense.weight']
- This IS expected if you are initializing BertModel from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertModel from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


Iteration 1000, Loss 960.823295712471
Testing...


  1%|█▊                                                                                                                                                                                      | 999/100000 [09:14<7:46:42,  3.54it/s]

Precision 0.86, recall 0.51


  2%|███▋                                                                                                                                                                                   | 1999/100000 [14:13<8:19:44,  3.27it/s]

Iteration 2000, Loss 679.6939150691032
Testing...


  2%|███▋                                                                                                                                                                                   | 1999/100000 [18:45<8:19:44,  3.27it/s]

Precision 0.84, recall 0.66


  3%|█████▍                                                                                                                                                                                 | 2999/100000 [23:44<8:04:52,  3.33it/s]

Iteration 3000, Loss 602.9551938772202
Testing...


  3%|█████▍                                                                                                                                                                                 | 2999/100000 [28:15<8:04:52,  3.33it/s]

Precision 0.83, recall 0.71


  4%|███████▎                                                                                                                                                                               | 3999/100000 [33:14<7:59:34,  3.34it/s]

Iteration 4000, Loss 570.1983116865158
Testing...


  4%|███████▎                                                                                                                                                                               | 3999/100000 [37:46<7:59:34,  3.34it/s]

Precision 0.83, recall 0.73


  5%|█████████▏                                                                                                                                                                             | 4999/100000 [42:44<7:55:14,  3.33it/s]

Iteration 5000, Loss 551.2786398530006
Testing...


  5%|█████████▏                                                                                                                                                                             | 4999/100000 [47:16<7:55:14,  3.33it/s]

Precision 0.86, recall 0.70


  6%|██████████▉                                                                                                                                                                            | 5999/100000 [52:15<7:46:33,  3.36it/s]

Iteration 6000, Loss 534.8179283440113
Testing...


  6%|██████████▉                                                                                                                                                                            | 5999/100000 [56:47<7:46:33,  3.36it/s]

Precision 0.84, recall 0.74


  7%|████████████▋                                                                                                                                                                        | 6999/100000 [1:01:46<7:37:45,  3.39it/s]

Iteration 7000, Loss 519.1319914758205
Testing...


  7%|████████████▋                                                                                                                                                                        | 6999/100000 [1:06:18<7:37:45,  3.39it/s]

Precision 0.86, recall 0.73


  8%|██████████████▍                                                                                                                                                                      | 7999/100000 [1:11:17<7:44:57,  3.30it/s]

Iteration 8000, Loss 509.6986853480339
Testing...


  8%|██████████████▍                                                                                                                                                                      | 7999/100000 [1:15:48<7:44:57,  3.30it/s]

Precision 0.85, recall 0.74


  9%|████████████████▎                                                                                                                                                                    | 8999/100000 [1:20:48<7:38:31,  3.31it/s]

Iteration 9000, Loss 494.22719022631645
Testing...


  9%|████████████████▎                                                                                                                                                                    | 8999/100000 [1:25:19<7:38:31,  3.31it/s]

Precision 0.86, recall 0.74


 10%|██████████████████                                                                                                                                                                   | 9999/100000 [1:30:18<7:30:06,  3.33it/s]

Iteration 10000, Loss 482.2693729400635
Testing...


 10%|██████████████████                                                                                                                                                                   | 9999/100000 [1:34:49<7:30:06,  3.33it/s]

Precision 0.88, recall 0.71


 11%|███████████████████▊                                                                                                                                                                | 10999/100000 [1:39:51<7:28:35,  3.31it/s]

Iteration 11000, Loss 480.6331687569618
Testing...


 11%|███████████████████▊                                                                                                                                                                | 10999/100000 [1:44:23<7:28:35,  3.31it/s]

Precision 0.86, recall 0.76


 12%|█████████████████████▌                                                                                                                                                              | 11999/100000 [1:49:21<7:17:47,  3.35it/s]

Iteration 12000, Loss 469.71231776475906
Testing...


 12%|█████████████████████▌                                                                                                                                                              | 11999/100000 [1:53:53<7:17:47,  3.35it/s]

Precision 0.87, recall 0.74


 13%|███████████████████████▍                                                                                                                                                            | 12999/100000 [1:58:52<7:11:41,  3.36it/s]

Iteration 13000, Loss 468.159545481205
Testing...


 13%|███████████████████████▍                                                                                                                                                            | 12999/100000 [2:03:24<7:11:41,  3.36it/s]

Precision 0.87, recall 0.75


 14%|█████████████████████████▏                                                                                                                                                          | 13999/100000 [2:08:21<7:00:57,  3.40it/s]

Iteration 14000, Loss 462.0356529057026
Testing...


 14%|█████████████████████████▏                                                                                                                                                          | 13999/100000 [2:12:53<7:00:57,  3.40it/s]

Precision 0.85, recall 0.77


 15%|██████████████████████████▉                                                                                                                                                         | 14999/100000 [2:17:51<6:59:00,  3.38it/s]

Iteration 15000, Loss 451.1195248067379
Testing...


 15%|██████████████████████████▉                                                                                                                                                         | 14999/100000 [2:22:23<6:59:00,  3.38it/s]

Precision 0.86, recall 0.77


 16%|████████████████████████████▊                                                                                                                                                       | 15999/100000 [2:27:20<6:51:59,  3.40it/s]

Iteration 16000, Loss 448.2655685544014
Testing...


 16%|████████████████████████████▊                                                                                                                                                       | 15999/100000 [2:31:51<6:51:59,  3.40it/s]

Precision 0.86, recall 0.77


 17%|██████████████████████████████▌                                                                                                                                                     | 16999/100000 [2:36:50<6:54:20,  3.34it/s]

Iteration 17000, Loss 418.42533756792545
Testing...


 17%|██████████████████████████████▌                                                                                                                                                     | 16999/100000 [2:41:21<6:54:20,  3.34it/s]

Precision 0.85, recall 0.79


 18%|████████████████████████████████▍                                                                                                                                                   | 17999/100000 [2:46:18<6:37:13,  3.44it/s]

Iteration 18000, Loss 427.7070944160223
Testing...


 18%|████████████████████████████████▍                                                                                                                                                   | 17999/100000 [2:50:50<6:37:13,  3.44it/s]

Precision 0.88, recall 0.75


 19%|██████████████████████████████████▏                                                                                                                                                 | 18999/100000 [2:55:49<6:41:00,  3.37it/s]

Iteration 19000, Loss 415.42507776618004
Testing...


 19%|██████████████████████████████████▏                                                                                                                                                 | 18999/100000 [3:00:20<6:41:00,  3.37it/s]

Precision 0.85, recall 0.79


 20%|███████████████████████████████████▉                                                                                                                                                | 19999/100000 [3:05:19<6:39:09,  3.34it/s]

Iteration 20000, Loss 416.7395850867033
Testing...


 20%|███████████████████████████████████▉                                                                                                                                                | 19999/100000 [3:09:50<6:39:09,  3.34it/s]

Precision 0.88, recall 0.75


 21%|█████████████████████████████████████▊                                                                                                                                              | 20999/100000 [3:14:49<6:33:19,  3.35it/s]

Iteration 21000, Loss 412.3992513269186
Testing...


 21%|█████████████████████████████████████▊                                                                                                                                              | 20999/100000 [3:19:20<6:33:19,  3.35it/s]

Precision 0.89, recall 0.73


 22%|███████████████████████████████████████▌                                                                                                                                            | 21999/100000 [3:24:17<6:32:33,  3.31it/s]

Iteration 22000, Loss 409.6017978787422
Testing...


 22%|███████████████████████████████████████▌                                                                                                                                            | 21999/100000 [3:28:49<6:32:33,  3.31it/s]

Precision 0.87, recall 0.77


 23%|█████████████████████████████████████████▍                                                                                                                                          | 22999/100000 [3:33:48<6:24:34,  3.34it/s]

Iteration 23000, Loss 401.73364320397377
Testing...


 23%|█████████████████████████████████████████▍                                                                                                                                          | 22999/100000 [3:38:19<6:24:34,  3.34it/s]

Precision 0.87, recall 0.78


 24%|███████████████████████████████████████████▏                                                                                                                                        | 23999/100000 [3:43:17<6:24:22,  3.30it/s]

Iteration 24000, Loss 404.46012438833714
Testing...


 24%|███████████████████████████████████████████▏                                                                                                                                        | 23999/100000 [3:47:49<6:24:22,  3.30it/s]

Precision 0.86, recall 0.78


 25%|████████████████████████████████████████████▉                                                                                                                                       | 24999/100000 [3:52:48<6:09:09,  3.39it/s]

Iteration 25000, Loss 398.2320056706667
Testing...


 25%|████████████████████████████████████████████▉                                                                                                                                       | 24999/100000 [3:57:19<6:09:09,  3.39it/s]

Precision 0.86, recall 0.79


 26%|██████████████████████████████████████████████▊                                                                                                                                     | 25999/100000 [4:02:17<6:10:02,  3.33it/s]

Iteration 26000, Loss 394.0723844319582
Testing...


 26%|██████████████████████████████████████████████▊                                                                                                                                     | 25999/100000 [4:06:48<6:10:02,  3.33it/s]

Precision 0.86, recall 0.80


 27%|████████████████████████████████████████████████▌                                                                                                                                   | 26999/100000 [4:11:46<6:05:10,  3.33it/s]

Iteration 27000, Loss 391.16168074309826
Testing...


 27%|████████████████████████████████████████████████▌                                                                                                                                   | 26999/100000 [4:16:18<6:05:10,  3.33it/s]

Precision 0.89, recall 0.76


 28%|██████████████████████████████████████████████████▍                                                                                                                                 | 27999/100000 [4:21:16<5:59:37,  3.34it/s]

Iteration 28000, Loss 390.61771833896637
Testing...


 28%|██████████████████████████████████████████████████▍                                                                                                                                 | 27999/100000 [4:25:47<5:59:37,  3.34it/s]

Precision 0.87, recall 0.77


 29%|████████████████████████████████████████████████████▏                                                                                                                               | 28999/100000 [4:30:45<5:53:09,  3.35it/s]

Iteration 29000, Loss 385.61515061557293
Testing...


 29%|████████████████████████████████████████████████████▏                                                                                                                               | 28999/100000 [4:35:16<5:53:09,  3.35it/s]

Precision 0.88, recall 0.77


 30%|█████████████████████████████████████████████████████▉                                                                                                                              | 29999/100000 [4:40:15<5:48:18,  3.35it/s]

Iteration 30000, Loss 386.8957047909498
Testing...


 30%|█████████████████████████████████████████████████████▉                                                                                                                              | 29999/100000 [4:44:46<5:48:18,  3.35it/s]

Precision 0.88, recall 0.77


 31%|███████████████████████████████████████████████████████▊                                                                                                                            | 30999/100000 [4:49:43<5:44:12,  3.34it/s]

Iteration 31000, Loss 387.8181423842907
Testing...


 31%|███████████████████████████████████████████████████████▊                                                                                                                            | 30999/100000 [4:54:15<5:44:12,  3.34it/s]

Precision 0.88, recall 0.78


 32%|█████████████████████████████████████████████████████████▌                                                                                                                          | 31999/100000 [4:59:10<5:34:11,  3.39it/s]

Iteration 32000, Loss 368.6114554554224
Testing...


 32%|█████████████████████████████████████████████████████████▌                                                                                                                          | 31999/100000 [5:03:42<5:34:11,  3.39it/s]

Precision 0.87, recall 0.79


 33%|███████████████████████████████████████████████████████████▍                                                                                                                        | 32999/100000 [5:08:40<5:28:36,  3.40it/s]

Iteration 33000, Loss 351.9737859070301
Testing...


 33%|███████████████████████████████████████████████████████████▍                                                                                                                        | 32999/100000 [5:13:11<5:28:36,  3.40it/s]

Precision 0.88, recall 0.78


 34%|█████████████████████████████████████████████████████████████▏                                                                                                                      | 33999/100000 [5:18:08<5:24:38,  3.39it/s]

Iteration 34000, Loss 353.0221663415432
Testing...


 34%|█████████████████████████████████████████████████████████████▏                                                                                                                      | 33999/100000 [5:22:40<5:24:38,  3.39it/s]

Precision 0.87, recall 0.78


 35%|██████████████████████████████████████████████████████████████▉                                                                                                                     | 34999/100000 [5:27:38<5:18:03,  3.41it/s]

Iteration 35000, Loss 349.0831976234913
Testing...


 35%|██████████████████████████████████████████████████████████████▉                                                                                                                     | 34999/100000 [5:32:09<5:18:03,  3.41it/s]

Precision 0.88, recall 0.78


 36%|████████████████████████████████████████████████████████████████▊                                                                                                                   | 35999/100000 [5:37:08<5:18:08,  3.35it/s]

Iteration 36000, Loss 347.08925661444664
Testing...


 36%|████████████████████████████████████████████████████████████████▊                                                                                                                   | 35999/100000 [5:41:39<5:18:08,  3.35it/s]

Precision 0.88, recall 0.78


 37%|██████████████████████████████████████████████████████████████████▌                                                                                                                 | 36999/100000 [5:46:36<5:14:37,  3.34it/s]

Iteration 37000, Loss 347.71979205310345
Testing...


 37%|██████████████████████████████████████████████████████████████████▌                                                                                                                 | 36999/100000 [5:51:08<5:14:37,  3.34it/s]

Precision 0.88, recall 0.78


 38%|████████████████████████████████████████████████████████████████████▍                                                                                                               | 37999/100000 [5:56:05<5:09:32,  3.34it/s]

Iteration 38000, Loss 345.6550233364105
Testing...


 38%|████████████████████████████████████████████████████████████████████▍                                                                                                               | 37999/100000 [6:00:37<5:09:32,  3.34it/s]

Precision 0.87, recall 0.79


 39%|██████████████████████████████████████████████████████████████████████▏                                                                                                             | 38999/100000 [6:05:35<5:01:22,  3.37it/s]

Iteration 39000, Loss 348.5531508475542
Testing...


 39%|██████████████████████████████████████████████████████████████████████▏                                                                                                             | 38999/100000 [6:10:06<5:01:22,  3.37it/s]

Precision 0.87, recall 0.78


 40%|███████████████████████████████████████████████████████████████████████▉                                                                                                            | 39999/100000 [6:15:04<5:00:28,  3.33it/s]

Iteration 40000, Loss 335.88172098994255
Testing...


 40%|███████████████████████████████████████████████████████████████████████▉                                                                                                            | 39999/100000 [6:19:36<5:00:28,  3.33it/s]

Precision 0.88, recall 0.78


 41%|█████████████████████████████████████████████████████████████████████████▊                                                                                                          | 40999/100000 [6:24:33<4:54:30,  3.34it/s]

Iteration 41000, Loss 339.6691496372223
Testing...


 41%|█████████████████████████████████████████████████████████████████████████▊                                                                                                          | 40999/100000 [6:29:05<4:54:30,  3.34it/s]

Precision 0.86, recall 0.81


 42%|███████████████████████████████████████████████████████████████████████████▌                                                                                                        | 41999/100000 [6:34:03<4:50:06,  3.33it/s]

Iteration 42000, Loss 336.4954511523247
Testing...


 42%|███████████████████████████████████████████████████████████████████████████▌                                                                                                        | 41999/100000 [6:38:34<4:50:06,  3.33it/s]

Precision 0.87, recall 0.78


 43%|█████████████████████████████████████████████████████████████████████████████▍                                                                                                      | 42999/100000 [6:43:31<4:37:30,  3.42it/s]

Iteration 43000, Loss 332.9936072975397
Testing...


 43%|█████████████████████████████████████████████████████████████████████████████▍                                                                                                      | 42999/100000 [6:48:02<4:37:30,  3.42it/s]

Precision 0.88, recall 0.77


 44%|███████████████████████████████████████████████████████████████████████████████▏                                                                                                    | 43999/100000 [6:52:59<4:40:12,  3.33it/s]

Iteration 44000, Loss 333.66101241111755
Testing...


 44%|███████████████████████████████████████████████████████████████████████████████▏                                                                                                    | 43999/100000 [6:57:31<4:40:12,  3.33it/s]

Precision 0.87, recall 0.79


 45%|████████████████████████████████████████████████████████████████████████████████▉                                                                                                   | 44999/100000 [7:02:28<4:34:14,  3.34it/s]

Iteration 45000, Loss 328.65979193151
Testing...


 45%|████████████████████████████████████████████████████████████████████████████████▉                                                                                                   | 44999/100000 [7:07:00<4:34:14,  3.34it/s]

Precision 0.87, recall 0.79


 46%|██████████████████████████████████████████████████████████████████████████████████▊                                                                                                 | 45999/100000 [7:11:58<4:28:14,  3.36it/s]

Iteration 46000, Loss 330.00451427698135
Testing...


 46%|██████████████████████████████████████████████████████████████████████████████████▊                                                                                                 | 45999/100000 [7:16:30<4:28:14,  3.36it/s]

Precision 0.87, recall 0.80


 47%|████████████████████████████████████████████████████████████████████████████████████▌                                                                                               | 46999/100000 [7:21:31<4:22:04,  3.37it/s]

Iteration 47000, Loss 326.7741405367851
Testing...


 47%|████████████████████████████████████████████████████████████████████████████████████▌                                                                                               | 46999/100000 [7:26:02<4:22:04,  3.37it/s]

Precision 0.88, recall 0.77


 48%|██████████████████████████████████████████████████████████████████████████████████████▍                                                                                             | 47999/100000 [7:30:59<4:18:15,  3.36it/s]

Iteration 48000, Loss 304.02149344980717
Testing...


 48%|██████████████████████████████████████████████████████████████████████████████████████▍                                                                                             | 47999/100000 [7:35:31<4:18:15,  3.36it/s]

Precision 0.86, recall 0.81


 49%|████████████████████████████████████████████████████████████████████████████████████████▏                                                                                           | 48999/100000 [7:40:29<4:13:08,  3.36it/s]

Iteration 49000, Loss 300.05959260463715
Testing...


 49%|████████████████████████████████████████████████████████████████████████████████████████▏                                                                                           | 48999/100000 [7:45:01<4:13:08,  3.36it/s]

Precision 0.88, recall 0.78


 50%|█████████████████████████████████████████████████████████████████████████████████████████▉                                                                                          | 49999/100000 [7:49:59<4:10:02,  3.33it/s]

Iteration 50000, Loss 300.8760960251093
Testing...


 50%|█████████████████████████████████████████████████████████████████████████████████████████▉                                                                                          | 49999/100000 [7:54:31<4:10:02,  3.33it/s]

Precision 0.89, recall 0.76


 51%|███████████████████████████████████████████████████████████████████████████████████████████▊                                                                                        | 50999/100000 [7:59:30<4:06:35,  3.31it/s]

Iteration 51000, Loss 293.6830305606127
Testing...


 51%|███████████████████████████████████████████████████████████████████████████████████████████▊                                                                                        | 50999/100000 [8:04:01<4:06:35,  3.31it/s]

Precision 0.88, recall 0.78


 52%|█████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                      | 51999/100000 [8:08:57<3:59:10,  3.34it/s]

Iteration 52000, Loss 291.9596770182252
Testing...


 52%|█████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                      | 51999/100000 [8:13:29<3:59:10,  3.34it/s]

Precision 0.88, recall 0.77


 53%|███████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                    | 52999/100000 [8:18:26<3:54:09,  3.35it/s]

Iteration 53000, Loss 291.0294405966997
Testing...


 53%|███████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                    | 52999/100000 [8:22:58<3:54:09,  3.35it/s]

Precision 0.88, recall 0.78


 54%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 53999/100000 [8:27:56<3:46:30,  3.38it/s]

Iteration 54000, Loss 288.12327091395855
Testing...


 54%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 53999/100000 [8:32:27<3:46:30,  3.38it/s]

Precision 0.88, recall 0.78


 55%|██████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                 | 54999/100000 [8:37:25<3:43:00,  3.36it/s]

Iteration 55000, Loss 293.1883657723665
Testing...


 55%|██████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                 | 54999/100000 [8:41:57<3:43:00,  3.36it/s]

Precision 0.88, recall 0.78


 56%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                               | 55999/100000 [8:46:52<3:39:02,  3.35it/s]

Iteration 56000, Loss 284.805847838521
Testing...


 56%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                               | 55999/100000 [8:51:24<3:39:02,  3.35it/s]

Precision 0.86, recall 0.80


 57%|██████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                             | 56999/100000 [8:56:24<3:35:15,  3.33it/s]

Iteration 57000, Loss 287.73622973263264
Testing...


 57%|██████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                             | 56999/100000 [9:00:55<3:35:15,  3.33it/s]

Precision 0.87, recall 0.78


 58%|████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                           | 57999/100000 [9:05:53<3:26:35,  3.39it/s]

Iteration 58000, Loss 283.44792146235704
Testing...


 58%|████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                           | 57999/100000 [9:10:24<3:26:35,  3.39it/s]

Precision 0.87, recall 0.79


 59%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                         | 58999/100000 [9:15:21<3:23:08,  3.36it/s]

Iteration 59000, Loss 278.27225149422884
Testing...


 59%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                         | 58999/100000 [9:19:53<3:23:08,  3.36it/s]

Precision 0.88, recall 0.78


 60%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                        | 59999/100000 [9:24:50<3:19:20,  3.34it/s]

Iteration 60000, Loss 278.10666086524725
Testing...


 60%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                        | 59999/100000 [9:29:21<3:19:20,  3.34it/s]

Precision 0.86, recall 0.80


 61%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                      | 60999/100000 [9:34:17<3:11:19,  3.40it/s]

Iteration 61000, Loss 274.87089697271585
Testing...


 61%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                      | 60999/100000 [9:38:49<3:11:19,  3.40it/s]

Precision 0.87, recall 0.77


 62%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                    | 61999/100000 [9:43:45<3:08:42,  3.36it/s]

Iteration 62000, Loss 276.0349909812212
Testing...


 62%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                    | 61999/100000 [9:48:16<3:08:42,  3.36it/s]

Precision 0.87, recall 0.79


 63%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                  | 62999/100000 [9:53:15<3:04:59,  3.33it/s]

Iteration 63000, Loss 271.7992961257696
Testing...


 63%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                  | 62999/100000 [9:57:46<3:04:59,  3.33it/s]

Precision 0.88, recall 0.78


 64%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                | 63999/100000 [10:02:46<3:00:19,  3.33it/s]

Iteration 64000, Loss 243.80426638573408
Testing...


 64%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                | 63999/100000 [10:07:17<3:00:19,  3.33it/s]

Precision 0.87, recall 0.77


 65%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                              | 64999/100000 [10:12:15<2:54:50,  3.34it/s]

Iteration 65000, Loss 239.82168531417847
Testing...


 65%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                              | 64999/100000 [10:16:47<2:54:50,  3.34it/s]

Precision 0.86, recall 0.80


 66%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                            | 65999/100000 [10:21:44<2:50:15,  3.33it/s]

Iteration 66000, Loss 241.31884057074785
Testing...


 66%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                            | 65999/100000 [10:26:15<2:50:15,  3.33it/s]

Precision 0.87, recall 0.79


 67%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                           | 66999/100000 [10:31:15<2:45:14,  3.33it/s]

Iteration 67000, Loss 243.2798783481121
Testing...


 67%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                           | 66999/100000 [10:35:46<2:45:14,  3.33it/s]

Precision 0.87, recall 0.78


 68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                         | 67999/100000 [10:40:44<2:39:05,  3.35it/s]

Iteration 68000, Loss 238.6217177286744
Testing...


 68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                         | 67999/100000 [10:45:16<2:39:05,  3.35it/s]

Precision 0.86, recall 0.80


 69%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                       | 68999/100000 [10:50:14<2:34:57,  3.33it/s]

Iteration 69000, Loss 242.34990438818932
Testing...


 69%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                       | 68999/100000 [10:54:45<2:34:57,  3.33it/s]

Precision 0.87, recall 0.78


 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                     | 69999/100000 [10:59:44<2:29:58,  3.33it/s]

Iteration 70000, Loss 235.66883442550898
Testing...


 70%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                     | 69999/100000 [11:04:15<2:29:58,  3.33it/s]

Precision 0.87, recall 0.79


 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                    | 70999/100000 [11:09:11<2:24:06,  3.35it/s]

Iteration 71000, Loss 233.8823172301054
Testing...


 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                    | 70999/100000 [11:13:42<2:24:06,  3.35it/s]

Precision 0.86, recall 0.79


 72%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                  | 71999/100000 [11:18:41<2:18:43,  3.36it/s]

Iteration 72000, Loss 235.237098634243
Testing...


 72%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                  | 71999/100000 [11:23:13<2:18:43,  3.36it/s]

Precision 0.86, recall 0.80


 73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                | 72999/100000 [11:28:12<2:15:25,  3.32it/s]

Iteration 73000, Loss 235.08591070771217
Testing...


 73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                | 72999/100000 [11:32:43<2:15:25,  3.32it/s]

Precision 0.86, recall 0.79


 74%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                              | 73999/100000 [11:37:43<2:08:01,  3.38it/s]

Iteration 74000, Loss 232.44121800363064
Testing...


 74%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                              | 73999/100000 [11:42:14<2:08:01,  3.38it/s]

Precision 0.86, recall 0.79


 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                            | 74999/100000 [11:47:13<2:03:58,  3.36it/s]

Iteration 75000, Loss 230.15636157244444
Testing...


 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                            | 74999/100000 [11:51:44<2:03:58,  3.36it/s]

Precision 0.87, recall 0.79


 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                           | 75999/100000 [11:56:43<1:59:54,  3.34it/s]

Iteration 76000, Loss 227.61008083820343
Testing...


 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                           | 75999/100000 [12:01:14<1:59:54,  3.34it/s]

Precision 0.85, recall 0.81


 77%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                         | 76999/100000 [12:06:11<1:54:11,  3.36it/s]

Iteration 77000, Loss 230.12471920251846
Testing...


 77%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                         | 76999/100000 [12:10:42<1:54:11,  3.36it/s]

Precision 0.87, recall 0.78


 78%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                       | 77999/100000 [12:15:41<1:49:59,  3.33it/s]

Iteration 78000, Loss 225.40079510211945
Testing...


 78%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                       | 77999/100000 [12:20:12<1:49:59,  3.33it/s]

Precision 0.86, recall 0.80


 79%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                     | 78999/100000 [12:25:11<1:44:42,  3.34it/s]

Iteration 79000, Loss 214.337737724185
Testing...


 79%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                     | 78999/100000 [12:29:42<1:44:42,  3.34it/s]

Precision 0.87, recall 0.77


 80%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                   | 79999/100000 [12:34:41<1:38:26,  3.39it/s]

Iteration 80000, Loss 194.35487418994308
Testing...


 80%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                   | 79999/100000 [12:39:13<1:38:26,  3.39it/s]

Precision 0.86, recall 0.78


 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                  | 80999/100000 [12:44:12<1:35:00,  3.33it/s]

Iteration 81000, Loss 195.47542567178607
Testing...


 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                  | 80999/100000 [12:48:43<1:35:00,  3.33it/s]

Precision 0.87, recall 0.77


 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                | 81999/100000 [12:53:38<1:28:00,  3.41it/s]

Iteration 82000, Loss 194.95621936023235
Testing...


 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                | 81999/100000 [12:58:10<1:28:00,  3.41it/s]

Precision 0.87, recall 0.77


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                              | 82999/100000 [13:03:07<1:25:02,  3.33it/s]

Iteration 83000, Loss 194.7588279210031
Testing...


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                              | 82999/100000 [13:07:38<1:25:02,  3.33it/s]

Precision 0.85, recall 0.80


 84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                            | 83999/100000 [13:12:37<1:18:06,  3.41it/s]

Iteration 84000, Loss 194.335652038455
Testing...


 84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                            | 83999/100000 [13:17:08<1:18:06,  3.41it/s]

Precision 0.87, recall 0.77


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                          | 84999/100000 [13:22:07<1:15:10,  3.33it/s]

Iteration 85000, Loss 189.19007235765457
Testing...


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                          | 84999/100000 [13:26:38<1:15:10,  3.33it/s]

Precision 0.85, recall 0.80


 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                         | 85999/100000 [13:31:38<1:10:41,  3.30it/s]

Iteration 86000, Loss 190.22492688894272
Testing...


 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                         | 85999/100000 [13:36:09<1:10:41,  3.30it/s]

Precision 0.87, recall 0.78


 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 86999/100000 [13:41:04<1:04:59,  3.33it/s]

Iteration 87000, Loss 191.9181748777628
Testing...


 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                       | 86999/100000 [13:45:36<1:04:59,  3.33it/s]

Precision 0.86, recall 0.78


 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                     | 87999/100000 [13:50:34<1:00:29,  3.31it/s]

Iteration 88000, Loss 192.91463159769773
Testing...


 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                     | 87999/100000 [13:55:06<1:00:29,  3.31it/s]

Precision 0.86, recall 0.78


 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                    | 88999/100000 [14:00:04<54:49,  3.34it/s]

Iteration 89000, Loss 189.79236280173063
Testing...


 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                    | 88999/100000 [14:04:35<54:49,  3.34it/s]

Precision 0.86, recall 0.79


 90%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                  | 89999/100000 [14:09:31<48:56,  3.41it/s]

Iteration 90000, Loss 189.14435501396656
Testing...


 90%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                  | 89999/100000 [14:14:03<48:56,  3.41it/s]

Precision 0.86, recall 0.79


 91%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                | 90999/100000 [14:19:01<44:49,  3.35it/s]

Iteration 91000, Loss 188.36313431710005
Testing...


 91%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                | 90999/100000 [14:23:32<44:49,  3.35it/s]

Precision 0.85, recall 0.80


 92%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌              | 91999/100000 [14:28:30<39:36,  3.37it/s]

Iteration 92000, Loss 181.34926533699036
Testing...


 92%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌              | 91999/100000 [14:33:01<39:36,  3.37it/s]

Precision 0.86, recall 0.78


 93%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 92999/100000 [14:37:57<34:38,  3.37it/s]

Iteration 93000, Loss 182.53914750367403
Testing...


 93%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 92999/100000 [14:42:29<34:38,  3.37it/s]

Precision 0.87, recall 0.77


 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏          | 93999/100000 [14:47:26<29:55,  3.34it/s]

Iteration 94000, Loss 184.43122647702694
Testing...


 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏          | 93999/100000 [14:51:58<29:55,  3.34it/s]

Precision 0.86, recall 0.78


 95%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉         | 94999/100000 [14:56:58<25:00,  3.33it/s]

Iteration 95000, Loss 170.87707219272852
Testing...


 95%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉         | 94999/100000 [15:01:29<25:00,  3.33it/s]

Precision 0.84, recall 0.81


 96%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 95999/100000 [15:06:28<19:30,  3.42it/s]

Iteration 96000, Loss 160.04166872799397
Testing...


 96%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 95999/100000 [15:10:59<19:30,  3.42it/s]

Precision 0.86, recall 0.78


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌     | 96999/100000 [15:15:57<14:57,  3.34it/s]

Iteration 97000, Loss 156.4046347439289
Testing...


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌     | 96999/100000 [15:20:28<14:57,  3.34it/s]

Precision 0.86, recall 0.79


 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍   | 97999/100000 [15:25:27<09:47,  3.41it/s]

Iteration 98000, Loss 157.25577071495354
Testing...


 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍   | 97999/100000 [15:29:58<09:47,  3.41it/s]

Precision 0.86, recall 0.78


 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 98999/100000 [15:34:55<04:59,  3.34it/s]

Iteration 99000, Loss 158.3417942263186
Testing...


 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 98999/100000 [15:39:27<04:59,  3.34it/s]

Precision 0.85, recall 0.79


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉| 99999/100000 [15:44:25<00:00,  3.33it/s]

Iteration 100000, Loss 158.74481904879212
Testing...


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉| 99999/100000 [15:48:56<00:00,  3.33it/s]

Precision 0.85, recall 0.79


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100000/100000 [15:48:57<00:00,  1.76it/s]


In [6]:
DATASET = DATASETS[0]
# test_set = TokenizedTestset(os.path.join(DATASET_ROOT, DATASET, METHOD, 'test.jsonl'), 10)
CKPT_PATH = os.path.join(RESULT_ROOT, DATASET, METHOD, "model.pth")
model = Scorer()
model.load_state_dict(torch.load(CKPT_PATH, map_location=CFG.DEVICE))
model.to(CFG.DEVICE)
# test(model, test_set)


Some weights of the model checkpoint at bert-base-uncased were not used when initializing BertModel: ['cls.seq_relationship.bias', 'cls.predictions.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.decoder.weight', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.seq_relationship.weight', 'cls.predictions.transform.dense.bias']
- This IS expected if you are initializing BertModel from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertModel from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


Scorer(
  (model): BertModel(
    (embeddings): BertEmbeddings(
      (word_embeddings): Embedding(30522, 768, padding_idx=0)
      (position_embeddings): Embedding(512, 768)
      (token_type_embeddings): Embedding(2, 768)
      (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (encoder): BertEncoder(
      (layer): ModuleList(
        (0): BertLayer(
          (attention): BertAttention(
            (self): BertSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1, inplace=False)
            )
            (output): BertSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
              (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
    

In [7]:
from utils import sent_tokenizer

ImportError: cannot import name 'get_terminal_size' from 'click.termui' (/home/gluo/miniconda3/lib/python3.8/site-packages/click/termui.py)

In [15]:
def evaluate(docs, sums, model, score_output, detail_output):
    docs = sent_tokenizer(docs)
    sums = sent_tokenizer(sums)

    doc_texts, sum_texts = []
    for _doc, _sum in zip(docs, sums):
        doc_sents = ["[CLS] " + sent for sent in _doc]
        sum_sents = ["[CLS] " + sent for sent in _sum]
        doc_texts.append(" ".join(doc_sents))
        sum_texts.append(" ".join(sum_texts))

    inputs = tokenizer(doc_texts, sum_texts, 
        padding='max_length', truncation="longest_first", return_tensors="pt") 
    
    eval_loader = DataLoader(inputs, batch_size=CFG.BATCH_SIZE)
    
    scores = []
    preds = []
    with torch.no_grad():
        for batch in eval_loader:
            batch = batch.to(CFG.DEVICE)
            
            score, logits = model(inputs)
            scores.append(score.squeeze().detach().cpu().numpy())
            preds.append(preds.detach().cpu().numpy())
    
    scores = np.vstack(scores)
    preds = np.vstack(preds)
    
    with open(score_output, "w", encoding = "UTF-8") as f:
        f.write("\n".join([str(score) for score in scores])+"\n")
    