In [1]:
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '1, 2'
import json
import torch
import random
import tokenize
import numpy as np
from tqdm import tqdm
import multiprocessing
from torch.utils.data import DataLoader, Dataset, RandomSampler, SequentialSampler
from transformers import RobertaConfig, RobertaForMaskedLM, RobertaTokenizer
from transformers import WEIGHTS_NAME, AdamW, get_linear_schedule_with_warmup
# from parser import remove_comments_and_docstrings

import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.autograd import Variable
from torch.nn import CrossEntropyLoss, MSELoss
from sklearn.metrics import recall_score, precision_score, f1_score

In [2]:
f = open('../data/dataset.jsonl', 'r')
dataset0 = json.loads(f.readline())
f.close()
f = open('../data/labels01.jsonl', 'r')
labels = json.loads(f.readline())
f.close()
topic_number = len(labels[0])

In [3]:
class arguments(object):
    def __init__(self):
        pass
args = arguments()

In [4]:
args.epochs = 25
args.batch_size = 2
args.input_limit = 10
args.gradient_accumulation_steps = 32

args.total_length = 512
args.graph_length = 0
args.max_grad_norm = 1.0
args.learning_rate = 1e-5
args.weight_decay = 0.0
args.adam_epsilon = 1e-8

args.current_topic = 0
args.topic_number = topic_number
args.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
args.n_gpu = torch.cuda.device_count()
args.seed = 978438233

In [5]:
def set_seed():
    random.seed(args.seed)
    np.random.seed(args.seed)
    torch.manual_seed(args.seed)
    if args.n_gpu > 0:
        torch.cuda.manual_seed_all(args.seed)
set_seed()

config = RobertaConfig.from_pretrained('microsoft/codebert-base')
config.num_labels = 1
tokenizer = RobertaTokenizer.from_pretrained('microsoft/codebert-base')
pretrain_model = RobertaForMaskedLM.from_pretrained('microsoft/codebert-base', config = config)

Some weights of RobertaForMaskedLM were not initialized from the model checkpoint at microsoft/codebert-base and are newly initialized: ['lm_head.layer_norm.bias', 'lm_head.bias', 'lm_head.layer_norm.weight', 'lm_head.dense.bias', 'lm_head.dense.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


In [6]:
dataset = []
for x, y in zip(dataset0, labels):
    if (len(x) != 0 and sum(y) != 0):
        dataset.append([x, y])
random.shuffle(dataset)
# dataset = dataset[: 40] # TODO

In [7]:
class TextDataset(Dataset):
    def __init__(self, examples):
        self.examples = examples
        
    def __len__(self):
        return len(self.examples)
        
    def __getitem__(self, item):
        code, labels = self.examples[item]
        random.shuffle(code)
        
        code_ids = []
        position_ids = []
        for x in code:
            code_ids.append([y for y in x if y != 1] + [1])
            position_ids.append([i + tokenizer.pad_token_id + 1 for i in range(len(code_ids[-1]) - 1)] + [1])
        code_ids = [y for x in code_ids for y in x]
        position_ids = [y for x in position_ids for y in x]
        
        length = args.input_limit * args.total_length 
        code_ids = code_ids[: length]
        position_ids = position_ids[: length]
        code_ids.extend([1] * (length - len(code_ids)))
        position_ids.extend([1] * (length - len(position_ids)))
        
        code_ids = torch.tensor(code_ids).view(-1, args.total_length)
        position_ids = torch.tensor(position_ids).view(-1, args.total_length)
        return code_ids, position_ids, torch.Tensor([labels[args.current_topic]])

test_data = TextDataset(dataset[int(len(dataset) * 0.75) :])
test_sampler = RandomSampler(test_data)
test_dataloader = DataLoader(test_data, sampler = test_sampler, drop_last = False,
                             num_workers = 4, batch_size = args.batch_size)

In [8]:
class Model(nn.Module):
    def __init__(self, encoder, config):
        super(Model, self).__init__()
        self.encoder = encoder
        self.config = config
        self.rnn = nn.LSTM(config.hidden_size, config.hidden_size, 1)
        self.dense = nn.Linear(config.hidden_size, config.hidden_size * 8)
        self.dropout = nn.Dropout(0.1)
        self.out_proj = nn.Linear(config.hidden_size * 8, 2)
        
    def forward(self, code_ids, position_ids, labels):
        h = torch.randn(1, code_ids.size(0), self.config.hidden_size).to(args.device)
        c = torch.randn(1, code_ids.size(0), self.config.hidden_size).to(args.device)
        code_ids = code_ids.transpose(0, 1)
        position_ids = position_ids.transpose(0, 1)
        code_embeddings = self.encoder.roberta.embeddings.word_embeddings(code_ids)
        for i in range(code_embeddings.size(0)):
            bert_output = self.encoder.roberta(inputs_embeds = code_embeddings[i],
                                               position_ids = position_ids[i])
            _, (h, c) = self.rnn(bert_output[0][:, 0, :].view(1, -1, config.hidden_size), (h, c))
        x = h[0]
        x = self.dropout(x)
        x = F.relu(self.dense(x))
        x = self.dropout(x)
        x = self.out_proj(x)
        x = F.softmax(x, dim = 1)[:, 1]
        loss_function = MSELoss()
        loss = loss_function(x.view(-1), labels.view(-1))
        return x, loss

In [9]:
def evaluate(model, epoch_id):
    loss_sum = 0
    loss_cnt = 0
    y_trues = []
    y_preds = []
    bar = tqdm(test_dataloader, total = len(test_dataloader))
    for data in bar:
        code_ids, position_ids, labels = data
        code_ids = code_ids.to(args.device)
        position_ids = position_ids.to(args.device)
        labels = labels.to(args.device)
        model.eval()
        with torch.no_grad():
            prob, loss = model(code_ids, position_ids, labels)
            prob = prob.view(-1)
            if args.n_gpu > 1:
                loss = loss.mean()
            loss_sum = loss_sum + loss.item() * code_ids.size(0)
            loss_cnt = loss_cnt + code_ids.size(0)
            y_preds.append((prob > 0.5).long().cpu().numpy())
            y_trues.append(labels.long().view(-1).cpu().numpy())
    y_trues = np.concatenate(y_trues, 0)
    y_preds = np.concatenate(y_preds, 0)
    TP = sum([x == 1 and y == 1 for x, y in zip(y_trues, y_preds)])
    FP = sum([x == 0 and y == 1 for x, y in zip(y_trues, y_preds)])
    TN = sum([x == 0 and y == 0 for x, y in zip(y_trues, y_preds)])
    FN = sum([x == 1 and y == 0 for x, y in zip(y_trues, y_preds)])
    print('TP FP TN FN =', TP, FP, TN, FN)

    f1 = float(f1_score(y_trues, y_preds))
    rs = float(recall_score(y_trues, y_preds))
    ps = float(precision_score(y_trues, y_preds))
    os.system('mkdir -p result')
    print('f1:', f1)
    print('recall:', rs)
    print('precision:', ps)
    print('loss:', loss_sum / loss_cnt)
    f = open('result/codeNLP' + str(args.current_topic).zfill(2) + '-' + str(epoch_id).zfill(3) + '.txt', 'w')
    print(f1, rs, ps, loss_sum / loss_cnt, TP, FP, TN, FN, file = f)
    f.close()
    return f1

In [None]:
def get_dataloader():
    posi_data = []
    nega_data = []
    for x in dataset[: int(len(dataset) * 0.75)]:
        if (x[1][args.current_topic]):
            posi_data.append(x)
        else:
            nega_data.append(x)
    print(len(posi_data), len(nega_data))
    if (len(posi_data) < len(nega_data)):
        nega_data = random.sample(nega_data, max(1, len(posi_data)))
    train_data = TextDataset(posi_data + nega_data)
    train_sampler = RandomSampler(train_data)
    train_dataloader = DataLoader(train_data, sampler = train_sampler, drop_last = False,
                                  num_workers = 4, batch_size = args.batch_size)
    return train_dataloader

for i in range(args.topic_number):
    args.current_topic = i
    model = Model(pretrain_model, config)
    model.to(args.device)
    if args.n_gpu > 1:
        model = torch.nn.DataParallel(model)
    optimizer = torch.optim.Adam(model.parameters(), lr = args.learning_rate)
    
    for epoch_num in range(args.epochs):
        step = 0
        for t in range(10):
            train_dataloader = get_dataloader()
            bar = tqdm(train_dataloader, total = len(train_dataloader))
            for data in bar:
                code_ids, position_ids, labels = data
                code_ids = code_ids.to(args.device)
                position_ids = position_ids.to(args.device)
                labels = labels.to(args.device)
                model.train()
                _, loss = model(code_ids, position_ids, labels)
                if args.n_gpu > 1:
                    loss = loss.mean()
                loss = loss * args.batch_size / args.gradient_accumulation_steps
                loss.backward()
                bar.set_description("topic {} epoch {}".format(i, epoch_num))
                step += args.batch_size
                if (step % args.gradient_accumulation_steps == 0):
                    optimizer.step()
                    optimizer.zero_grad()
        if (step % args.gradient_accumulation_steps != 0):
            optimizer.step()
            optimizer.zero_grad()
        evaluate(model, epoch_num)

947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:48<00:00,  1.61it/s]


947 8170


topic 0 epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:36<00:00,  1.64it/s]


947 8170


topic 0 epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:41<00:00,  1.63it/s]


947 8170


topic 0 epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]


947 8170


topic 0 epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]


947 8170


topic 0 epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]


947 8170


topic 0 epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:35<00:00,  1.65it/s]


947 8170


topic 0 epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]


947 8170


topic 0 epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]


947 8170


topic 0 epoch 0: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:14<00:00,  4.84it/s]


TP FP TN FN = 268 189 2539 44
f1: 0.6970091027308192
recall: 0.8589743589743589
precision: 0.5864332603938731
loss: 0.06393198294430667
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:43<00:00,  1.62it/s]


947 8170


topic 0 epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:27<00:00,  1.67it/s]


947 8170


topic 0 epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:37<00:00,  1.64it/s]


947 8170


topic 0 epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:37<00:00,  1.64it/s]


947 8170


topic 0 epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:28<00:00,  1.66it/s]


947 8170


topic 0 epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:39<00:00,  1.63it/s]


947 8170


topic 0 epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]


947 8170


topic 0 epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:25<00:00,  1.67it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:18<00:00,  4.78it/s]


TP FP TN FN = 270 188 2540 42
f1: 0.7012987012987013
recall: 0.8653846153846154
precision: 0.5895196506550219
loss: 0.061102637232455126
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:38<00:00,  1.64it/s]


947 8170


topic 0 epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:29<00:00,  1.66it/s]


947 8170


topic 0 epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:29<00:00,  1.66it/s]


947 8170


topic 0 epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:35<00:00,  1.65it/s]


947 8170


topic 0 epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:37<00:00,  1.64it/s]


947 8170


topic 0 epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]


947 8170


topic 0 epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:38<00:00,  1.64it/s]


947 8170


topic 0 epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:11<00:00,  4.87it/s]


TP FP TN FN = 257 104 2624 55
f1: 0.7637444279346212
recall: 0.8237179487179487
precision: 0.7119113573407202
loss: 0.04500776300366708
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:43<00:00,  1.62it/s]


947 8170


topic 0 epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]


947 8170


topic 0 epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:35<00:00,  1.65it/s]


947 8170


topic 0 epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:39<00:00,  1.63it/s]


947 8170


topic 0 epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:29<00:00,  1.66it/s]


947 8170


topic 0 epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:36<00:00,  1.64it/s]


947 8170


topic 0 epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:05<00:00,  4.98it/s]


TP FP TN FN = 254 103 2625 58
f1: 0.759342301943199
recall: 0.8141025641025641
precision: 0.711484593837535
loss: 0.046585234211148706
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:36<00:00,  1.64it/s]


947 8170


topic 0 epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:29<00:00,  1.66it/s]


947 8170


topic 0 epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:29<00:00,  1.66it/s]


947 8170


topic 0 epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:27<00:00,  1.67it/s]


947 8170


topic 0 epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:37<00:00,  1.64it/s]


947 8170


topic 0 epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]


947 8170


topic 0 epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:39<00:00,  1.63it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:10<00:00,  4.90it/s]


TP FP TN FN = 262 118 2610 50
f1: 0.7572254335260117
recall: 0.8397435897435898
precision: 0.6894736842105263
loss: 0.048470444632139814
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]


947 8170


topic 0 epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:27<00:00,  1.67it/s]


947 8170


topic 0 epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]


947 8170


topic 0 epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]


947 8170


topic 0 epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:27<00:00,  1.67it/s]


947 8170


topic 0 epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:27<00:00,  1.67it/s]


947 8170


topic 0 epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:29<00:00,  1.66it/s]


947 8170


topic 0 epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:29<00:00,  1.66it/s]


947 8170


topic 0 epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:29<00:00,  1.66it/s]


947 8170


topic 0 epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:11<00:00,  4.89it/s]


TP FP TN FN = 263 125 2603 49
f1: 0.7514285714285716
recall: 0.842948717948718
precision: 0.6778350515463918
loss: 0.050740869433134085
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]


947 8170


topic 0 epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]


947 8170


topic 0 epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]


947 8170


topic 0 epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:28<00:00,  1.67it/s]


947 8170


topic 0 epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]


947 8170


topic 0 epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:26<00:00,  1.67it/s]


947 8170


topic 0 epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:35<00:00,  1.64it/s]


947 8170


topic 0 epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]


947 8170


topic 0 epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]


947 8170


topic 0 epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:27<00:00,  1.67it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:18<00:00,  4.78it/s]


TP FP TN FN = 275 151 2577 37
f1: 0.7452574525745258
recall: 0.8814102564102564
precision: 0.6455399061032864
loss: 0.055003733561312926
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]


947 8170


topic 0 epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:36<00:00,  1.64it/s]


947 8170


topic 0 epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]


947 8170


topic 0 epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:28<00:00,  1.67it/s]


947 8170


topic 0 epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:28<00:00,  1.66it/s]


947 8170


topic 0 epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:27<00:00,  1.67it/s]


947 8170


topic 0 epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]


947 8170


topic 0 epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:29<00:00,  1.66it/s]


947 8170


topic 0 epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:12<00:00,  4.87it/s]


TP FP TN FN = 255 100 2628 57
f1: 0.7646176911544227
recall: 0.8173076923076923
precision: 0.7183098591549296
loss: 0.046048144862450166
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:35<00:00,  1.65it/s]


947 8170


topic 0 epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]


947 8170


topic 0 epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]


947 8170


topic 0 epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:28<00:00,  1.67it/s]


947 8170


topic 0 epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:28<00:00,  1.67it/s]


947 8170


topic 0 epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:36<00:00,  1.64it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:05<00:00,  4.98it/s]


TP FP TN FN = 259 111 2617 53
f1: 0.7595307917888564
recall: 0.8301282051282052
precision: 0.7
loss: 0.04805794729360586
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:37<00:00,  1.64it/s]


947 8170


topic 0 epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:26<00:00,  1.67it/s]


947 8170


topic 0 epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]


947 8170


topic 0 epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:37<00:00,  1.64it/s]


947 8170


topic 0 epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]


947 8170


topic 0 epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:41<00:00,  1.63it/s]


947 8170


topic 0 epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:26<00:00,  1.67it/s]


947 8170


topic 0 epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:38<00:00,  1.64it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:09<00:00,  4.91it/s]


TP FP TN FN = 240 62 2666 72
f1: 0.7817589576547231
recall: 0.7692307692307693
precision: 0.7947019867549668
loss: 0.039975299106342725
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]


947 8170


topic 0 epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]


947 8170


topic 0 epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:26<00:00,  1.67it/s]


947 8170


topic 0 epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:33<00:00,  1.65it/s]


947 8170


topic 0 epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.66it/s]


947 8170


topic 0 epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:31<00:00,  1.66it/s]


947 8170


topic 0 epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1520/1520 [05:26<00:00,  4.65it/s]


TP FP TN FN = 253 94 2634 59
f1: 0.7678300455235206
recall: 0.8108974358974359
precision: 0.729106628242075
loss: 0.04433314118844189
947 8170


  result = _VF.lstm(input, hx, self._flat_weights, self.bias, self.num_layers,
topic 0 epoch 11: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:30<00:00,  1.66it/s]


947 8170


topic 0 epoch 11: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:29<00:00,  1.66it/s]


947 8170


topic 0 epoch 11: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:32<00:00,  1.65it/s]


947 8170


topic 0 epoch 11: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 947/947 [09:34<00:00,  1.65it/s]


947 8170


topic 0 epoch 11:  35%|████████████████████████████████████████████████████▋                                                                                                 | 333/947 [03:20<05:42,  1.79it/s]

In [None]:
exit()