In [1]:
# !pip install datasets
# !pip install -U scikit-learn

In [2]:
# !pip install transformers[torch]

In [3]:
import torch
import pandas as pd
from transformers import BertTokenizer, BertForSequenceClassification, Trainer, TrainingArguments
from datasets import Dataset
from sklearn.metrics import f1_score
import transformers
import random

  from .autonotebook import tqdm as notebook_tqdm


In [4]:
from tqdm import tqdm

In [5]:
random.seed(13)
torch.manual_seed(13)

<torch._C.Generator at 0x7d23c40b1ef0>

In [6]:
device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')
device

device(type='cuda', index=0)

In [7]:
torch.cuda.is_available()

True

In [8]:
train_df = pd.read_csv('train.csv')

In [9]:
train_df

Unnamed: 0,line_id,summary,question,answer,is_hallucination
0,0,Херманус Питер (Дик) Логгере (нидерл. Hermanus...,В каком городе проходил чемпионат мира по хокк...,В Хилверсюме.,1
1,1,Ходуткинские горячие источники (Худутские горя...,Как называется район в который входят источники?,Елизовским районом,0
2,2,Чёрная вдова (лат. Latrodectus mactans) — вид ...,Для кого опасны пауки-бокоходы?,Для рыб.,1
3,3,"Рысь — река в России, протекает по территориям...",Какова длина реки Рысь?,5 км.,1
4,4,"И́се (яп. 伊勢市), ранее Удзиямада — город в Япон...",Что такое Исе?,"Исе — это небольшой город в Японии, который не...",1
...,...,...,...,...,...
1045,1045,Восемь незарегистрированных правителей (яп. 欠史...,Что связывают с императорским домом?,ни одна легенда не связывает их с Японией,0
1046,1046,«Гастингс» (англ. Hastings) — название военной...,Какой род войск проводил военную операцию под ...,Танковые войска.,1
1047,1047,Bacillus cereus (лат.) — вид грамположительных...,У кого вызывает токсикоз?,У растений.,1
1048,1048,Стеклова́та — волокнистый минеральный теплоизо...,Какой способностью обладает стекловата?,Стекловата обладает способностью проводить эле...,1


In [10]:
train_df['text'] = "[CLS] " + train_df['summary'] + " " + train_df['question'] + " [SEP] " + train_df['answer']

In [11]:
#bert_name = 'bert-base-uncased'
#bert_name = 'imvladikon/charbert-bert-wiki'
bert_name = 'DeepPavlov/rubert-base-cased'
tokenizer = BertTokenizer.from_pretrained(bert_name)
model = BertForSequenceClassification.from_pretrained(bert_name, num_labels=2).to(device)

Some weights of BertForSequenceClassification were not initialized from the model checkpoint at DeepPavlov/rubert-base-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


In [12]:
def tokenize_function(examples):
    return tokenizer(examples, #["text"], 
            padding='max_length', 
            max_length = 512, 
            truncation=True) #,
            #return_tensors="pt"
    #return tokenizer(examples["text"], padding="max_length", truncation=True)


train_df['input_ids'] = train_df['text'].apply(tokenize_function)

In [13]:
def split_dataframe(dataframe, proc):
    ids_shu = list(dataframe['line_id'])
    random.shuffle(ids_shu)
    test  = ids_shu[:proc]
    train_df = dataframe[~dataframe['line_id'].isin(test)]
    test_df = dataframe[dataframe['line_id'].isin(test)]
    return train_df, test_df

posdf = train_df[train_df['is_hallucination'] == 1]
negdf = train_df[train_df['is_hallucination'] == 0]

train_pos, test_pos = split_dataframe(posdf, 100)
train_neg, test_neg = split_dataframe(negdf, 100)
#train_df[train_df['is_hallucination'] == 1]

In [14]:
len(train_pos),len(test_pos),len(train_neg),len(test_neg)

(432, 100, 418, 100)

In [15]:
if False:
    train_dataset = Dataset.from_pandas( pd.concat([train_pos, train_neg]).sample(frac=1) [['text', 'is_hallucination']] ) 
    val_dataset   = Dataset.from_pandas( pd.concat([test_pos, test_neg]).sample(frac=1) [['text', 'is_hallucination']] ) 
    train_dataset = train_dataset.rename_column("is_hallucination", "labels")
    val_dataset   = val_dataset.rename_column("is_hallucination", "labels")
    
    if False:
        train_dataset = Dataset.from_pandas(train_df[['text', 'is_hallucination']])
        train_dataset = train_dataset.rename_column("is_hallucination", "labels")
        
        train_test_split = train_dataset.train_test_split(test_size=0.2)
        train_dataset = train_test_split['train']
        val_dataset = train_test_split['test']

In [16]:
class ClassHall(torch.nn.Module):
    def __init__(self, hidden_size, output_size, activationfunc):
        super().__init__()
        self.BERTencoder = transformers.BertModel.from_pretrained(bert_name).to(device)
        #self.linear1 = torch.nn.Linear(768, hidden_size)
        #self.act1 = activationfunc()
        #self.linear2 = torch.nn.Linear(hidden_size, output_size)

        self.linear2 = torch.nn.Linear(768, output_size)
        
        self.act2 = torch.nn.Softmax(dim = 1) # activationfunc()
        
    def forward(self, input_ids , attention_mask):
        #print(x)
        #batches, x2, target, view = x
        #h = self.BERTencoder( x, return_dict=False)[1]# self.BERTencoder(x)

        h = self.BERTencoder (input_ids=input_ids,
                              attention_mask=attention_mask,
                              return_dict=False)[1]
        
        #h = self.linear1(h)
        #h = self.act1(h)
        h = self.linear2(h)
        h = self.act2(h)
        return h

In [17]:
model = ClassHall(256, 2, torch.nn.Tanh)

Some weights of the model checkpoint at DeepPavlov/rubert-base-cased were not used when initializing BertModel: ['cls.seq_relationship.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.bias', 'cls.predictions.bias', 'cls.predictions.decoder.bias', 'cls.predictions.transform.LayerNorm.weight']
- This IS expected if you are initializing BertModel from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertModel from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


In [18]:
getlr = 2e-5
weight_decay=0.01
criterion   = torch.nn.CrossEntropyLoss()
model = model.to(device)
optimizer   = torch.optim.AdamW(model.parameters(), lr= getlr) 

In [19]:
# len(train_pos),len(test_pos),len(train_neg),len(test_neg)

neg_value = [-1.0, 0.0][1] #

In [21]:
max_len = max(len(train_pos), len(train_neg))
batch_size = 1

it_pos = list(train_pos['input_ids'])
it_neg = list(train_neg['input_ids'])
model.train()
epochs = 3
for epoch in range(epochs):
    for i in tqdm(range(max_len// batch_size)):
        groupetensor = []
        groupetarget = []
        groupatt = []
        for it in range(batch_size):
            iterid = i*batch_size + it
            pos_ids = it_pos [ iterid % len(it_pos) ] ['input_ids']
            neg_ids = it_neg [ iterid % len(it_neg) ] ['input_ids']
            pos_att = it_pos [ iterid % len(it_pos) ] ['attention_mask']
            neg_att = it_neg [ iterid % len(it_neg) ] ['attention_mask']
            
            groupetensor+=[ pos_ids, neg_ids ]
            groupetarget+=[ [neg_value,1.0],[1.0,neg_value]   ]
            groupatt    +=[ pos_att, neg_att ]
        #auggroups = [made_aug(onegroup)  for onegroup in  groupetensor]
        #groupetensor = groupetensor + auggroups
        #line_tensor = torch.cat([torch.cat(onegroup).reshape([1,*torch.cat(onegroup).shape ]) for onegroup in groupetensor]).to(device)
        #fit_target  = torch.cat([torch.cat(onegroup).reshape([1,*torch.cat(onegroup).shape ]) for onegroup in groupetarget]).to(device)
        line_tensor = torch.tensor(groupetensor).to(device) # torch.cat([onegroup for onegroup in groupetensor]).to(device)
        attention = torch.tensor(groupatt).to(device)
        fit_target =  torch.tensor(groupetarget).to(device) #torch.cat([onegroup.reshape([1,*onegroup.shape ]) for onegroup in groupetarget]).float().to(device)
        output = model(line_tensor, attention ) #[:, -1, :]
        loss = criterion(output, fit_target)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
    

100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:27<00:00, 15.48it/s]
100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.38it/s]
100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.33it/s]


In [22]:
# len(train_pos),len(test_pos),len(train_neg),len(test_neg)
it_pos = list(test_pos['input_ids'])
it_neg = list(test_neg['input_ids'])

model.eval()

tp = 0
fn = 0
for pos_ids in it_pos:
    line_tensor = torch.tensor(pos_ids['input_ids'])
    line_tensor = line_tensor.reshape(1, *line_tensor.shape ).to(device)
    
    attention = torch.tensor(pos_ids['attention_mask'])
    attention = attention.reshape(1, *attention.shape ).to(device)
    output = model(line_tensor, attention)
    right_now = (output.argmax(dim = 1).detach().cpu() == torch.tensor([[neg_value,1.0]]).argmax(dim=1)).item()
    tp += right_now
    fn += 1-right_now

tn = 0
fp = 0
for neg_ids in it_neg:
    line_tensor = torch.tensor(neg_ids['input_ids'])
    line_tensor = line_tensor.reshape(1, *line_tensor.shape ).to(device)
    attention = torch.tensor(neg_ids['attention_mask'])
    attention = attention.reshape(1, *attention.shape ).to(device)
    output = model(line_tensor,attention)
    right_now = (output.argmax(dim = 1).detach().cpu() == torch.tensor([[1.0,neg_value]]).argmax(dim=1)).item()
    tn += right_now
    fp += 1-right_now

rec = tp/(tp+fn)
pre = tp/(tp+fp)
f1 = 2*(pre*rec)/(pre+rec)
f1

0.8603351955307262

0.850828729281768

In [23]:
tp,fn,tn,fp

(77, 23, 98, 2)

In [28]:
#torch.save(model.state_dict(), '0.76f1.pt')

In [None]:
# TUNE

In [20]:
epochs = 100
maxf1 = 0

for epoch in range(epochs):
    max_len = max(len(train_pos), len(train_neg))
    batch_size = 1

    it_pos = list(train_pos['input_ids'])
    it_neg = list(train_neg['input_ids'])
    model.train()
    
    for i in tqdm(range(max_len// batch_size)):
        groupetensor = []
        groupetarget = []
        groupatt = []
        for it in range(batch_size):
            iterid = i*batch_size + it
            pos_ids = it_pos [ iterid % len(it_pos) ] ['input_ids']
            neg_ids = it_neg [ iterid % len(it_neg) ] ['input_ids']
            pos_att = it_pos [ iterid % len(it_pos) ] ['attention_mask']
            neg_att = it_neg [ iterid % len(it_neg) ] ['attention_mask']
            
            groupetensor+=[ pos_ids, neg_ids ]
            groupetarget+=[ [neg_value,1.0],[1.0,neg_value]   ]
            groupatt    +=[ pos_att, neg_att ]
        line_tensor = torch.tensor(groupetensor).to(device)
        attention = torch.tensor(groupatt).to(device)
        fit_target =  torch.tensor(groupetarget).to(device)
        optimizer.zero_grad()
        output = model(line_tensor, attention )
        loss = criterion(output, fit_target)
        loss.backward()
        optimizer.step()
    


    
    it_pos = list(test_pos['input_ids'])
    it_neg = list(test_neg['input_ids'])
    
    model.eval()
    
    tp = 0
    fn = 0
    for pos_ids in it_pos:
        line_tensor = torch.tensor(pos_ids['input_ids'])
        line_tensor = line_tensor.reshape(1, *line_tensor.shape ).to(device)
        
        attention = torch.tensor(pos_ids['attention_mask'])
        attention = attention.reshape(1, *attention.shape ).to(device)
        output = model(line_tensor, attention)
        right_now = (output.argmax(dim = 1).detach().cpu() == torch.tensor([[neg_value,1.0]]).argmax(dim=1)).item()
        tp += right_now
        fn += 1-right_now
    
    tn = 0
    fp = 0
    for neg_ids in it_neg:
        line_tensor = torch.tensor(neg_ids['input_ids'])
        line_tensor = line_tensor.reshape(1, *line_tensor.shape ).to(device)
        attention = torch.tensor(neg_ids['attention_mask'])
        attention = attention.reshape(1, *attention.shape ).to(device)
        output = model(line_tensor,attention)
        right_now = (output.argmax(dim = 1).detach().cpu() == torch.tensor([[1.0,neg_value]]).argmax(dim=1)).item()
        tn += right_now
        fp += 1-right_now

    if tp == 0:
        f1 = 0
    else:
        rec = tp/(tp+fn)
        pre = tp/(tp+fp)
        f1 = 2*(pre*rec)/(pre+rec)
    print('epoch', epoch, 'f1=', f1, 'tp/fn/tn/fp', tp,fn,tn,fp)
    if f1>maxf1:
        maxf1 = f1
        torch.save(model.state_dict(), 'top_1sep.pt')

100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:27<00:00, 15.45it/s]


epoch 0 f1= 0.8469387755102041 tp/fn/tn/fp 83 17 87 13


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.38it/s]


epoch 1 f1= 0.8555555555555556 tp/fn/tn/fp 77 23 97 3


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.17it/s]


epoch 2 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.34it/s]


epoch 3 f1= 0.8681318681318682 tp/fn/tn/fp 79 21 97 3


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.19it/s]


epoch 4 f1= 0.6996466431095406 tp/fn/tn/fp 99 1 16 84


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.32it/s]


epoch 5 f1= 0.7626459143968872 tp/fn/tn/fp 98 2 41 59


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.29it/s]


epoch 6 f1= 0.8911917098445595 tp/fn/tn/fp 86 14 93 7


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.18it/s]


epoch 7 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.30it/s]


epoch 8 f1= 0.8820512820512821 tp/fn/tn/fp 86 14 91 9


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.29it/s]


epoch 9 f1= 0.8677248677248677 tp/fn/tn/fp 82 18 93 7


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 10 f1= 0.877005347593583 tp/fn/tn/fp 82 18 95 5


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 11 f1= 0.8709677419354839 tp/fn/tn/fp 81 19 95 5


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 12 f1= 0.8817204301075269 tp/fn/tn/fp 82 18 96 4


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 13 f1= 0.8762886597938143 tp/fn/tn/fp 85 15 91 9


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 14 f1= 0.8704663212435233 tp/fn/tn/fp 84 16 91 9


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 15 f1= 0.8854166666666666 tp/fn/tn/fp 85 15 93 7


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.25it/s]


epoch 16 f1= 0.8631578947368421 tp/fn/tn/fp 82 18 92 8


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.25it/s]


epoch 17 f1= 0.9072164948453608 tp/fn/tn/fp 88 12 94 6


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.25it/s]


epoch 18 f1= 0.8681318681318682 tp/fn/tn/fp 79 21 97 3


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 19 f1= 0.8681318681318682 tp/fn/tn/fp 79 21 97 3


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.26it/s]


epoch 20 f1= 0.8780487804878048 tp/fn/tn/fp 90 10 85 15


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 21 f1= 0.8844221105527638 tp/fn/tn/fp 88 12 89 11


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 22 f1= 0.8979591836734694 tp/fn/tn/fp 88 12 92 8


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.30it/s]


epoch 23 f1= 0.8979591836734694 tp/fn/tn/fp 88 12 92 8


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 24 f1= 0.8979591836734694 tp/fn/tn/fp 88 12 92 8


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 25 f1= 0.8979591836734694 tp/fn/tn/fp 88 12 92 8


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 26 f1= 0.058252427184466014 tp/fn/tn/fp 3 97 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 27 f1= 0.14814814814814814 tp/fn/tn/fp 8 92 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 28 f1= 0.8341232227488151 tp/fn/tn/fp 88 12 77 23


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 29 f1= 0.8253968253968254 tp/fn/tn/fp 78 22 89 11


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 30 f1= 0.8844221105527638 tp/fn/tn/fp 88 12 89 11


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 31 f1= 0.5673758865248227 tp/fn/tn/fp 40 60 99 1


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 32 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.25it/s]


epoch 33 f1= 0.679245283018868 tp/fn/tn/fp 54 46 95 5


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 34 f1= 0.8333333333333334 tp/fn/tn/fp 75 25 95 5


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.25it/s]


epoch 35 f1= 0.8623853211009174 tp/fn/tn/fp 94 6 76 24


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 36 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.25it/s]


epoch 37 f1= 0.019417475728155338 tp/fn/tn/fp 1 99 98 2


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 38 f1= 0.6348122866894198 tp/fn/tn/fp 93 7 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.30it/s]


epoch 39 f1= 0.019417475728155338 tp/fn/tn/fp 1 99 98 2


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.25it/s]


epoch 40 f1= 0.019417475728155338 tp/fn/tn/fp 1 99 98 2


 29%|███████████████████████▎                                                         | 124/432 [00:08<00:20, 15.23it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)



In [20]:
# 2 sep

100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:27<00:00, 15.44it/s]


epoch 0 f1= 0.8465608465608465 tp/fn/tn/fp 80 20 91 9


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.34it/s]


epoch 1 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.35it/s]


epoch 2 f1= 0.8603351955307262 tp/fn/tn/fp 77 23 98 2


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.19it/s]


epoch 3 f1= 0.8601036269430051 tp/fn/tn/fp 83 17 90 10


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.33it/s]


epoch 4 f1= 0.8555555555555556 tp/fn/tn/fp 77 23 97 3


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.30it/s]


epoch 5 f1= 0.8461538461538461 tp/fn/tn/fp 77 23 95 5


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.29it/s]


epoch 6 f1= 0.8540540540540541 tp/fn/tn/fp 79 21 94 6


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.29it/s]


epoch 7 f1= 0.7843137254901961 tp/fn/tn/fp 80 20 76 24


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 8 f1= 0.26277372262773724 tp/fn/tn/fp 18 82 81 19


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 9 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 10 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 11 f1= 0.7319148936170213 tp/fn/tn/fp 86 14 51 49


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 12 f1= 0.8127853881278538 tp/fn/tn/fp 89 11 70 30


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 13 f1= 0.7218934911242603 tp/fn/tn/fp 61 39 92 8


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.24it/s]


epoch 14 f1= 0.7391304347826089 tp/fn/tn/fp 68 32 84 16


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 15 f1= 0.46268656716417916 tp/fn/tn/fp 31 69 97 3


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 16 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 17 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 18 f1= 0.6829268292682927 tp/fn/tn/fp 84 16 38 62


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 19 f1= 0.7058823529411764 tp/fn/tn/fp 78 22 57 43


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 20 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.30it/s]


epoch 21 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.25it/s]


epoch 22 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 23 f1= 0.717557251908397 tp/fn/tn/fp 94 6 32 68


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 24 f1= 0.8258706467661692 tp/fn/tn/fp 83 17 82 18


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 25 f1= 0.7965367965367965 tp/fn/tn/fp 92 8 61 39


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 26 f1= 0.78 tp/fn/tn/fp 78 22 78 22


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.27it/s]


epoch 27 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 28 f1= 0.806122448979592 tp/fn/tn/fp 79 21 83 17


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 29 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 30 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.25it/s]


epoch 31 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 32 f1= 0.7027027027027026 tp/fn/tn/fp 91 9 32 68


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 33 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 34 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.30it/s]


epoch 35 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 36 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 37 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 38 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 39 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 40 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 41 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 42 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 43 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 44 f1= 0.6689419795221844 tp/fn/tn/fp 98 2 5 95


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 45 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 46 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 47 f1= 0.3472222222222222 tp/fn/tn/fp 25 75 81 19


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 48 f1= 0.34965034965034963 tp/fn/tn/fp 25 75 82 18


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 49 f1= 0.05769230769230769 tp/fn/tn/fp 3 97 99 1


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 50 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 51 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 52 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 53 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 54 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 55 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 56 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 57 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 58 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 59 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 60 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 61 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 62 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 63 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 64 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 65 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 66 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 67 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 68 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 69 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 70 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 71 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 72 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 73 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 74 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 75 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 76 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 77 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 78 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 79 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 80 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 81 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 82 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 83 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 84 f1= 0 tp/fn/tn/fp 0 100 100 0


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 85 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 86 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 87 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 88 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 89 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 90 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 91 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 92 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


100%|█████████████████████████████████████████████████████████████████████████████████| 432/432 [00:28<00:00, 15.28it/s]


epoch 93 f1= 0.6666666666666666 tp/fn/tn/fp 100 0 0 100


 58%|███████████████████████████████████████████████▎                                 | 252/432 [00:16<00:11, 15.25it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

