In [104]:
from transformers import BertTokenizer, BertForSequenceClassification
from torch.utils.data import DataLoader
from transformers import AdamW
import pandas as pd
import os
import torch
import torch.nn as nn
from torch.nn import CrossEntropyLoss
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, roc_auc_score, classification_report
from sklearn.model_selection import train_test_split
from sklearn import preprocessing
from tqdm import tqdm
import json
from collections import OrderedDict
from datetime import datetime
import logging
logging.basicConfig(level=logging.INFO, format='%(message)s')

In [105]:
tokenizer = BertTokenizer.from_pretrained("kykim/bert-kor-base")

In [106]:
## 读入数据
def read_data(file):
    texts = []
    labels = []
    data = pd.read_excel(file, engine='openpyxl')
    for row in data.itertuples():
        label = getattr(row, 'label')
        review = str(getattr(row, 'review'))[1:-1]
        texts.append(review)
        labels.append(label)
    assert len(texts) == len(labels)
    return texts, labels

In [107]:
texts, labels = read_data('Ko.xlsx')

In [108]:
train_texts, val_texts, train_labels, val_labels = train_test_split(
texts, labels, test_size=0.2, random_state=43, stratify=labels)

In [109]:
len(train_labels),len(val_labels),len(train_texts),len(val_texts)

(24000, 6000, 24000, 6000)

In [110]:
###  求最大长度，为后面分词做准备
max_len = max([len(item) for item in train_texts])
print(max_len)

max_len = max([len(item) for item in val_texts])
print(max_len)

298
298


In [111]:
# ### label和id进行映射
label2id = OrderedDict({item: idx for idx, item in enumerate(set(train_labels + val_labels))})
id2label = OrderedDict({v: k for k, v in label2id.items()})

In [112]:
# 训练集和验证集 分词
train_encodings = tokenizer(train_texts,
                            truncation=True,
                            padding=True,
                            max_length=128)
val_encodings = tokenizer(val_texts,
                          truncation=True,
                          padding=True,
                          max_length=128)

In [113]:
# PyTorch Dataset  创建Dataset
class CuDataset(torch.utils.data.Dataset):
    def __init__(self, encodings, labels):
        self.encodings = encodings
        self.labels = labels

    def __getitem__(self, idx):
        idx = int(idx)
        item = {
            key: torch.tensor(val[idx])
            for key, val in self.encodings.items()
        }
        item['labels'] = torch.tensor(label2id[self.labels[idx]])
        return item

    def __len__(self):
        return len(self.labels)

In [114]:
train_dataset = CuDataset(train_encodings, train_labels)
val_dataset = CuDataset(val_encodings, val_labels)

In [115]:
#  创建Dataloader
batch_size = 64
train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
eval_loader = DataLoader(val_dataset, batch_size=batch_size, shuffle=False)

In [116]:
device = torch.device('cuda:0') if torch.cuda.is_available() else torch.device('cpu')  # 使用cpu或者gpu
model = BertForSequenceClassification.from_pretrained("kykim/bert-kor-base", num_labels=len(label2id))
model.to(device)
model.train()

Some weights of the model checkpoint at kykim/bert-kor-base were not used when initializing BertForSequenceClassification: ['cls.predictions.decoder.bias', 'cls.predictions.transform.dense.bias', 'cls.predictions.transform.LayerNorm.bias', 'cls.seq_relationship.bias', 'cls.seq_relationship.weight', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.dense.weight', 'cls.predictions.decoder.weight', 'cls.predictions.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of BertForSequenceClassification were not initia

BertForSequenceClassification(
  (bert): BertModel(
    (embeddings): BertEmbeddings(
      (word_embeddings): Embedding(42000, 768, padding_idx=0)
      (position_embeddings): Embedding(512, 768)
      (token_type_embeddings): Embedding(2, 768)
      (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (encoder): BertEncoder(
      (layer): ModuleList(
        (0): BertLayer(
          (attention): BertAttention(
            (self): BertSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1, inplace=False)
            )
            (output): BertSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
              (LayerNorm): LayerNorm((768,), eps=1e-12, element

In [117]:
## 计算Accuracy，Precision，Recall，F1 score，confusion_matrix，classification_report
def compute_metrics(labels, preds):
    accuracy = accuracy_score(labels, preds)
    precision = precision_score(labels, preds)
    recall = recall_score(labels, preds)
    f1 = f1_score(labels, preds)
    print(f'accuracy: {accuracy}\n')
    print(f'precision: {precision}\n')
    print(f'recall: {recall}\n')
    print(f'f1: {f1}\n')
    print(confusion_matrix(labels, preds))
    print(classification_report(labels, preds))
    return f1

In [118]:
@torch.no_grad()
def eval_model(model, eval_loader):
    model.eval()
    labels = []
    preds = []
    for idx, batch in enumerate(eval_loader):
        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        labels.extend(batch['labels'].numpy())
        outputs = model(input_ids,attention_mask=attention_mask)  # 输出所有概率
        preds.extend(torch.argmax(outputs[0], dim=-1).cpu().numpy())  # 拿到标签
    f1 = compute_metrics(labels, preds)
    model.train()
    return f1

In [119]:
optim = AdamW(model.parameters(), lr=1e-5)  # 声明优化器
step = 0
best_f1 = 0
epoch = 10
for epoch in range(epoch):
    for idx, batch in tqdm(enumerate(train_loader),
                           total=len(train_texts) // batch_size):
        optim.zero_grad()
        input_ids = batch['input_ids'].to(device)
        labels = batch['labels'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        outputs = model(input_ids=input_ids, labels=labels, attention_mask=attention_mask)
        loss = outputs[0]  # 计算Loss
        logging.info(f'Epoch-{epoch}, Step-{step}, Loss: {loss.cpu().detach().numpy()}')
        step += 1
        loss.backward()
        optim.step()

    print(f'Epoch {epoch}, start evaluating.')
    f1 = eval_model(model, eval_loader)  # 评估模型
    if f1 > best_f1:
        print(f'best_f1: {f1}')
        model.save_pretrained('model_best')  # 保存模型
        tokenizer.save_pretrained('model_best')
        best_f1 = f1

  0%|                                                                                          | 0/375 [00:00<?, ?it/s]Epoch-0, Step-0, Loss: 0.9355964064598083
  0%|▏                                                                               | 1/375 [00:21<2:15:57, 21.81s/it]Epoch-0, Step-1, Loss: 0.7451502084732056
  1%|▍                                                                               | 2/375 [00:46<2:27:02, 23.65s/it]Epoch-0, Step-2, Loss: 0.5668846964836121
  1%|▋                                                                               | 3/375 [01:07<2:19:43, 22.54s/it]Epoch-0, Step-3, Loss: 0.4768636226654053
  1%|▊                                                                               | 4/375 [01:29<2:16:52, 22.14s/it]Epoch-0, Step-4, Loss: 0.4764520227909088
  1%|█                                                                               | 5/375 [01:51<2:15:30, 21.98s/it]Epoch-0, Step-5, Loss: 0.5004020929336548
  2%|█▎                           

 13%|██████████▌                                                                    | 50/375 [16:35<1:47:51, 19.91s/it]Epoch-0, Step-50, Loss: 0.386236310005188
 14%|██████████▋                                                                    | 51/375 [16:54<1:45:34, 19.55s/it]Epoch-0, Step-51, Loss: 0.23153886198997498
 14%|██████████▉                                                                    | 52/375 [17:14<1:46:02, 19.70s/it]Epoch-0, Step-52, Loss: 0.35450318455696106
 14%|███████████▏                                                                   | 53/375 [17:33<1:44:18, 19.44s/it]Epoch-0, Step-53, Loss: 0.33530694246292114
 14%|███████████▍                                                                   | 54/375 [17:51<1:43:10, 19.28s/it]Epoch-0, Step-54, Loss: 0.368864506483078
 15%|███████████▌                                                                   | 55/375 [18:12<1:45:40, 19.81s/it]Epoch-0, Step-55, Loss: 0.2950384020805359
 15%|███████████▊          

 27%|████████████████████▊                                                         | 100/375 [33:35<1:31:07, 19.88s/it]Epoch-0, Step-100, Loss: 0.3789339065551758
 27%|█████████████████████                                                         | 101/375 [33:54<1:29:57, 19.70s/it]Epoch-0, Step-101, Loss: 0.36268994212150574
 27%|█████████████████████▏                                                        | 102/375 [34:13<1:28:59, 19.56s/it]Epoch-0, Step-102, Loss: 0.22732487320899963
 27%|█████████████████████▍                                                        | 103/375 [34:33<1:29:22, 19.71s/it]Epoch-0, Step-103, Loss: 0.3928193151950836
 28%|█████████████████████▋                                                        | 104/375 [34:53<1:28:53, 19.68s/it]Epoch-0, Step-104, Loss: 0.27635812759399414
 28%|█████████████████████▊                                                        | 105/375 [35:13<1:28:55, 19.76s/it]Epoch-0, Step-105, Loss: 0.3928129971027374
 28%|██████████████

 40%|███████████████████████████████▏                                              | 150/375 [48:52<1:02:12, 16.59s/it]Epoch-0, Step-150, Loss: 0.16905911266803741
 40%|███████████████████████████████▍                                              | 151/375 [49:09<1:01:56, 16.59s/it]Epoch-0, Step-151, Loss: 0.3213464617729187
 41%|███████████████████████████████▌                                              | 152/375 [49:26<1:02:10, 16.73s/it]Epoch-0, Step-152, Loss: 0.3330525755882263
 41%|███████████████████████████████▊                                              | 153/375 [49:43<1:01:38, 16.66s/it]Epoch-0, Step-153, Loss: 0.26497960090637207
 41%|████████████████████████████████                                              | 154/375 [49:59<1:01:21, 16.66s/it]Epoch-0, Step-154, Loss: 0.3604782223701477
 41%|████████████████████████████████▏                                             | 155/375 [50:16<1:01:00, 16.64s/it]Epoch-0, Step-155, Loss: 0.2806762456893921
 42%|███████████████

 53%|█████████████████████████████████████████▌                                    | 200/375 [1:02:41<48:14, 16.54s/it]Epoch-0, Step-200, Loss: 0.5108040571212769
 54%|█████████████████████████████████████████▊                                    | 201/375 [1:02:58<47:49, 16.49s/it]Epoch-0, Step-201, Loss: 0.3924446702003479
 54%|██████████████████████████████████████████                                    | 202/375 [1:03:14<47:45, 16.57s/it]Epoch-0, Step-202, Loss: 0.2752104103565216
 54%|██████████████████████████████████████████▏                                   | 203/375 [1:03:31<47:27, 16.56s/it]Epoch-0, Step-203, Loss: 0.3143313229084015
 54%|██████████████████████████████████████████▍                                   | 204/375 [1:03:47<47:03, 16.51s/it]Epoch-0, Step-204, Loss: 0.4118908643722534
 55%|██████████████████████████████████████████▋                                   | 205/375 [1:04:04<46:43, 16.49s/it]Epoch-0, Step-205, Loss: 0.21499371528625488
 55%|████████████████

 67%|████████████████████████████████████████████████████                          | 250/375 [1:16:25<34:14, 16.44s/it]Epoch-0, Step-250, Loss: 0.5345368385314941
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:16:43<34:29, 16.69s/it]Epoch-0, Step-251, Loss: 0.2881034314632416
 67%|████████████████████████████████████████████████████▍                         | 252/375 [1:16:59<34:17, 16.73s/it]Epoch-0, Step-252, Loss: 0.38912662863731384
 67%|████████████████████████████████████████████████████▌                         | 253/375 [1:17:16<34:01, 16.73s/it]Epoch-0, Step-253, Loss: 0.3144141733646393
 68%|████████████████████████████████████████████████████▊                         | 254/375 [1:17:33<33:40, 16.69s/it]Epoch-0, Step-254, Loss: 0.41536155343055725
 68%|█████████████████████████████████████████████████████                         | 255/375 [1:17:49<33:13, 16.62s/it]Epoch-0, Step-255, Loss: 0.22080935537815094
 68%|██████████████

 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:30:11<20:34, 16.46s/it]Epoch-0, Step-300, Loss: 0.31833335757255554
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:30:28<20:19, 16.48s/it]Epoch-0, Step-301, Loss: 0.3183692991733551
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:30:44<20:00, 16.44s/it]Epoch-0, Step-302, Loss: 0.2613157331943512
 81%|███████████████████████████████████████████████████████████████               | 303/375 [1:31:00<19:41, 16.41s/it]Epoch-0, Step-303, Loss: 0.27979788184165955
 81%|███████████████████████████████████████████████████████████████▏              | 304/375 [1:31:17<19:30, 16.48s/it]Epoch-0, Step-304, Loss: 0.28436318039894104
 81%|███████████████████████████████████████████████████████████████▍              | 305/375 [1:31:34<19:15, 16.51s/it]Epoch-0, Step-305, Loss: 0.46439430117607117
 82%|█████████████

 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:44:00<06:56, 16.65s/it]Epoch-0, Step-350, Loss: 0.2530978322029114
 94%|█████████████████████████████████████████████████████████████████████████     | 351/375 [1:44:16<06:38, 16.59s/it]Epoch-0, Step-351, Loss: 0.2475566565990448
 94%|█████████████████████████████████████████████████████████████████████████▏    | 352/375 [1:44:33<06:21, 16.60s/it]Epoch-0, Step-352, Loss: 0.3824223577976227
 94%|█████████████████████████████████████████████████████████████████████████▍    | 353/375 [1:44:50<06:05, 16.62s/it]Epoch-0, Step-353, Loss: 0.4808594882488251
 94%|█████████████████████████████████████████████████████████████████████████▋    | 354/375 [1:45:06<05:47, 16.57s/it]Epoch-0, Step-354, Loss: 0.3267775774002075
 95%|█████████████████████████████████████████████████████████████████████████▊    | 355/375 [1:45:23<05:32, 16.62s/it]Epoch-0, Step-355, Loss: 0.30586254596710205
 95%|████████████████

Epoch 0, start evaluating.
accuracy: 0.8673333333333333

precision: 0.71900826446281

recall: 0.46858168761220825

f1: 0.5673913043478261

[[4682  204]
 [ 592  522]]
              precision    recall  f1-score   support

           0       0.89      0.96      0.92      4886
           1       0.72      0.47      0.57      1114

    accuracy                           0.87      6000
   macro avg       0.80      0.71      0.74      6000
weighted avg       0.86      0.87      0.86      6000

best_f1: 0.5673913043478261


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]Epoch-1, Step-375, Loss: 0.29799455404281616
  0%|▏                                                                               | 1/375 [00:16<1:45:36, 16.94s/it]Epoch-1, Step-376, Loss: 0.2746531069278717
  1%|▍                                                                               | 2/375 [00:33<1:43:28, 16.64s/it]Epoch-1, Step-377, Loss: 0.4155539572238922
  1%|▋                                                                               | 3/375 [00:49<1:42:06, 16.47s/it]Epoch-1, Step-378, Loss: 0.2417875975370407
  1%|▊                                                                               | 4/375 [01:06<1:41:51, 16.47s/it]Epoch-1, Step-379, Loss: 0.5077495574951172
  1%|█                                                                               | 5/375 [01:22<1:42:16, 16.59s/it]Epoch-1, Step-380, Loss: 0.26119932532310486
  2%|█▎             

 13%|██████████▌                                                                    | 50/375 [13:48<1:29:07, 16.45s/it]Epoch-1, Step-425, Loss: 0.22620873153209686
 14%|██████████▋                                                                    | 51/375 [14:05<1:30:20, 16.73s/it]Epoch-1, Step-426, Loss: 0.24428677558898926
 14%|██████████▉                                                                    | 52/375 [14:23<1:32:00, 17.09s/it]Epoch-1, Step-427, Loss: 0.42978185415267944
 14%|███████████▏                                                                   | 53/375 [14:40<1:30:40, 16.90s/it]Epoch-1, Step-428, Loss: 0.26105010509490967
 14%|███████████▍                                                                   | 54/375 [14:56<1:30:05, 16.84s/it]Epoch-1, Step-429, Loss: 0.20130811631679535
 15%|███████████▌                                                                   | 55/375 [15:13<1:29:17, 16.74s/it]Epoch-1, Step-430, Loss: 0.26458653807640076
 15%|███████████

 27%|████████████████████▊                                                         | 100/375 [27:35<1:15:19, 16.43s/it]Epoch-1, Step-475, Loss: 0.32787686586380005
 27%|█████████████████████                                                         | 101/375 [27:51<1:15:04, 16.44s/it]Epoch-1, Step-476, Loss: 0.4640405476093292
 27%|█████████████████████▏                                                        | 102/375 [28:08<1:15:14, 16.54s/it]Epoch-1, Step-477, Loss: 0.3507165312767029
 27%|█████████████████████▍                                                        | 103/375 [28:25<1:15:11, 16.59s/it]Epoch-1, Step-478, Loss: 0.27184635400772095
 28%|█████████████████████▋                                                        | 104/375 [28:41<1:14:33, 16.51s/it]Epoch-1, Step-479, Loss: 0.23399604856967926
 28%|█████████████████████▊                                                        | 105/375 [28:58<1:14:26, 16.54s/it]Epoch-1, Step-480, Loss: 0.17646606266498566
 28%|█████████████

 40%|███████████████████████████████▏                                              | 150/375 [41:20<1:01:51, 16.50s/it]Epoch-1, Step-525, Loss: 0.41699862480163574
 40%|███████████████████████████████▍                                              | 151/375 [41:36<1:01:22, 16.44s/it]Epoch-1, Step-526, Loss: 0.23229281604290009
 41%|███████████████████████████████▌                                              | 152/375 [41:53<1:02:13, 16.74s/it]Epoch-1, Step-527, Loss: 0.47351303696632385
 41%|███████████████████████████████▊                                              | 153/375 [42:10<1:02:12, 16.82s/it]Epoch-1, Step-528, Loss: 0.2558973431587219
 41%|████████████████████████████████                                              | 154/375 [42:27<1:01:41, 16.75s/it]Epoch-1, Step-529, Loss: 0.20135344564914703
 41%|████████████████████████████████▏                                             | 155/375 [42:43<1:00:58, 16.63s/it]Epoch-1, Step-530, Loss: 0.24704833328723907
 42%|████████████

 53%|██████████████████████████████████████████▋                                     | 200/375 [55:05<48:00, 16.46s/it]Epoch-1, Step-575, Loss: 0.2693054974079132
 54%|██████████████████████████████████████████▉                                     | 201/375 [55:21<47:46, 16.47s/it]Epoch-1, Step-576, Loss: 0.19894170761108398
 54%|███████████████████████████████████████████                                     | 202/375 [55:38<47:34, 16.50s/it]Epoch-1, Step-577, Loss: 0.40069979429244995
 54%|███████████████████████████████████████████▎                                    | 203/375 [55:54<47:23, 16.53s/it]Epoch-1, Step-578, Loss: 0.27443358302116394
 54%|███████████████████████████████████████████▌                                    | 204/375 [56:11<47:04, 16.52s/it]Epoch-1, Step-579, Loss: 0.17215706408023834
 55%|███████████████████████████████████████████▋                                    | 205/375 [56:27<46:42, 16.49s/it]Epoch-1, Step-580, Loss: 0.21880744397640228
 55%|████████████

 67%|████████████████████████████████████████████████████                          | 250/375 [1:08:50<34:16, 16.45s/it]Epoch-1, Step-625, Loss: 0.43827080726623535
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:09:06<34:00, 16.46s/it]Epoch-1, Step-626, Loss: 0.24992455542087555
 67%|████████████████████████████████████████████████████▍                         | 252/375 [1:09:23<33:46, 16.47s/it]Epoch-1, Step-627, Loss: 0.09827408194541931
 67%|████████████████████████████████████████████████████▌                         | 253/375 [1:09:39<33:35, 16.52s/it]Epoch-1, Step-628, Loss: 0.1871953010559082
 68%|████████████████████████████████████████████████████▊                         | 254/375 [1:09:56<33:13, 16.47s/it]Epoch-1, Step-629, Loss: 0.3131425082683563
 68%|█████████████████████████████████████████████████████                         | 255/375 [1:10:12<32:51, 16.43s/it]Epoch-1, Step-630, Loss: 0.3096811771392822
 68%|██████████████

 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:22:33<20:33, 16.45s/it]Epoch-1, Step-675, Loss: 0.26492759585380554
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:22:50<20:20, 16.49s/it]Epoch-1, Step-676, Loss: 0.3025830388069153
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:23:06<20:11, 16.59s/it]Epoch-1, Step-677, Loss: 0.2716425955295563
 81%|███████████████████████████████████████████████████████████████               | 303/375 [1:23:23<19:54, 16.59s/it]Epoch-1, Step-678, Loss: 0.3367695212364197
 81%|███████████████████████████████████████████████████████████████▏              | 304/375 [1:23:39<19:37, 16.58s/it]Epoch-1, Step-679, Loss: 0.29619672894477844
 81%|███████████████████████████████████████████████████████████████▍              | 305/375 [1:23:56<19:15, 16.51s/it]Epoch-1, Step-680, Loss: 0.21388646960258484
 82%|██████████████

 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:36:18<06:51, 16.44s/it]Epoch-1, Step-725, Loss: 0.24905605614185333
 94%|█████████████████████████████████████████████████████████████████████████     | 351/375 [1:36:34<06:35, 16.50s/it]Epoch-1, Step-726, Loss: 0.15581756830215454
 94%|█████████████████████████████████████████████████████████████████████████▏    | 352/375 [1:36:51<06:18, 16.44s/it]Epoch-1, Step-727, Loss: 0.1819077730178833
 94%|█████████████████████████████████████████████████████████████████████████▍    | 353/375 [1:37:07<06:01, 16.44s/it]Epoch-1, Step-728, Loss: 0.2350802719593048
 94%|█████████████████████████████████████████████████████████████████████████▋    | 354/375 [1:37:24<05:45, 16.46s/it]Epoch-1, Step-729, Loss: 0.28340527415275574
 95%|█████████████████████████████████████████████████████████████████████████▊    | 355/375 [1:37:40<05:29, 16.49s/it]Epoch-1, Step-730, Loss: 0.23905415832996368
 95%|█████████████

Epoch 1, start evaluating.
accuracy: 0.8698333333333333

precision: 0.7193675889328063

recall: 0.49012567324955114

f1: 0.5830218900160171

[[4673  213]
 [ 568  546]]
              precision    recall  f1-score   support

           0       0.89      0.96      0.92      4886
           1       0.72      0.49      0.58      1114

    accuracy                           0.87      6000
   macro avg       0.81      0.72      0.75      6000
weighted avg       0.86      0.87      0.86      6000

best_f1: 0.5830218900160171


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]Epoch-2, Step-750, Loss: 0.29856544733047485
  0%|▏                                                                               | 1/375 [00:16<1:43:08, 16.55s/it]Epoch-2, Step-751, Loss: 0.2662822902202606
  1%|▍                                                                               | 2/375 [00:33<1:42:42, 16.52s/it]Epoch-2, Step-752, Loss: 0.2538098096847534
  1%|▋                                                                               | 3/375 [00:49<1:41:55, 16.44s/it]Epoch-2, Step-753, Loss: 0.2651132345199585
  1%|▊                                                                               | 4/375 [01:06<1:42:09, 16.52s/it]Epoch-2, Step-754, Loss: 0.31263086199760437
  1%|█                                                                               | 5/375 [01:22<1:41:58, 16.54s/it]Epoch-2, Step-755, Loss: 0.17008884251117706
  2%|█▎            

 13%|██████████▌                                                                    | 50/375 [13:48<1:29:23, 16.50s/it]Epoch-2, Step-800, Loss: 0.38085711002349854
 14%|██████████▋                                                                    | 51/375 [14:05<1:29:31, 16.58s/it]Epoch-2, Step-801, Loss: 0.21273523569107056
 14%|██████████▉                                                                    | 52/375 [14:21<1:29:03, 16.54s/it]Epoch-2, Step-802, Loss: 0.31457677483558655
 14%|███████████▏                                                                   | 53/375 [14:38<1:28:42, 16.53s/it]Epoch-2, Step-803, Loss: 0.3628343641757965
 14%|███████████▍                                                                   | 54/375 [14:54<1:28:08, 16.47s/it]Epoch-2, Step-804, Loss: 0.27802279591560364
 15%|███████████▌                                                                   | 55/375 [15:11<1:28:19, 16.56s/it]Epoch-2, Step-805, Loss: 0.23627303540706635
 15%|███████████▊

 27%|████████████████████▊                                                         | 100/375 [27:37<1:15:45, 16.53s/it]Epoch-2, Step-850, Loss: 0.2699836194515228
 27%|█████████████████████                                                         | 101/375 [27:53<1:15:13, 16.47s/it]Epoch-2, Step-851, Loss: 0.4245380759239197
 27%|█████████████████████▏                                                        | 102/375 [28:10<1:15:05, 16.51s/it]Epoch-2, Step-852, Loss: 0.33625760674476624
 27%|█████████████████████▍                                                        | 103/375 [28:26<1:14:46, 16.50s/it]Epoch-2, Step-853, Loss: 0.1541343629360199
 28%|█████████████████████▋                                                        | 104/375 [28:43<1:14:38, 16.53s/it]Epoch-2, Step-854, Loss: 0.2600368559360504
 28%|█████████████████████▊                                                        | 105/375 [28:59<1:14:21, 16.52s/it]Epoch-2, Step-855, Loss: 0.20615331828594208
 28%|███████████████

 40%|███████████████████████████████▏                                              | 150/375 [41:25<1:01:49, 16.49s/it]Epoch-2, Step-900, Loss: 0.4859548509120941
 40%|███████████████████████████████▍                                              | 151/375 [41:41<1:01:38, 16.51s/it]Epoch-2, Step-901, Loss: 0.3561103641986847
 41%|███████████████████████████████▌                                              | 152/375 [41:58<1:01:24, 16.52s/it]Epoch-2, Step-902, Loss: 0.24443122744560242
 41%|███████████████████████████████▊                                              | 153/375 [42:14<1:00:44, 16.42s/it]Epoch-2, Step-903, Loss: 0.2271905541419983
 41%|████████████████████████████████                                              | 154/375 [42:31<1:00:35, 16.45s/it]Epoch-2, Step-904, Loss: 0.2767390012741089
 41%|████████████████████████████████▏                                             | 155/375 [42:47<1:00:29, 16.50s/it]Epoch-2, Step-905, Loss: 0.2622855305671692
 42%|████████████████

 53%|██████████████████████████████████████████▋                                     | 200/375 [55:15<48:43, 16.71s/it]Epoch-2, Step-950, Loss: 0.223640576004982
 54%|██████████████████████████████████████████▉                                     | 201/375 [55:32<48:14, 16.63s/it]Epoch-2, Step-951, Loss: 0.1866723746061325
 54%|███████████████████████████████████████████                                     | 202/375 [55:48<47:50, 16.60s/it]Epoch-2, Step-952, Loss: 0.27660349011421204
 54%|███████████████████████████████████████████▎                                    | 203/375 [56:05<47:28, 16.56s/it]Epoch-2, Step-953, Loss: 0.3202938735485077
 54%|███████████████████████████████████████████▌                                    | 204/375 [56:21<47:05, 16.52s/it]Epoch-2, Step-954, Loss: 0.17522567510604858
 55%|███████████████████████████████████████████▋                                    | 205/375 [56:38<46:59, 16.58s/it]Epoch-2, Step-955, Loss: 0.3740856349468231
 55%|████████████████

 67%|████████████████████████████████████████████████████                          | 250/375 [1:09:05<34:38, 16.63s/it]Epoch-2, Step-1000, Loss: 0.29424721002578735
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:09:21<34:19, 16.61s/it]Epoch-2, Step-1001, Loss: 0.3227718472480774
 67%|████████████████████████████████████████████████████▍                         | 252/375 [1:09:38<34:12, 16.69s/it]Epoch-2, Step-1002, Loss: 0.259532630443573
 67%|████████████████████████████████████████████████████▌                         | 253/375 [1:09:55<33:55, 16.69s/it]Epoch-2, Step-1003, Loss: 0.2218010127544403
 68%|████████████████████████████████████████████████████▊                         | 254/375 [1:10:11<33:25, 16.57s/it]Epoch-2, Step-1004, Loss: 0.25423702597618103
 68%|█████████████████████████████████████████████████████                         | 255/375 [1:10:28<33:15, 16.63s/it]Epoch-2, Step-1005, Loss: 0.30763116478919983
 68%|█████████

 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:22:52<20:35, 16.48s/it]Epoch-2, Step-1050, Loss: 0.4495226740837097
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:23:09<20:23, 16.54s/it]Epoch-2, Step-1051, Loss: 0.2149026095867157
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:23:25<20:06, 16.52s/it]Epoch-2, Step-1052, Loss: 0.21917599439620972
 81%|███████████████████████████████████████████████████████████████               | 303/375 [1:23:41<19:48, 16.51s/it]Epoch-2, Step-1053, Loss: 0.3425178825855255
 81%|███████████████████████████████████████████████████████████████▏              | 304/375 [1:23:58<19:31, 16.50s/it]Epoch-2, Step-1054, Loss: 0.24986624717712402
 81%|███████████████████████████████████████████████████████████████▍              | 305/375 [1:24:15<19:21, 16.59s/it]Epoch-2, Step-1055, Loss: 0.3631591796875
 82%|████████████

 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:36:43<06:56, 16.65s/it]Epoch-2, Step-1100, Loss: 0.26169726252555847
 94%|█████████████████████████████████████████████████████████████████████████     | 351/375 [1:37:00<06:39, 16.65s/it]Epoch-2, Step-1101, Loss: 0.2803746163845062
 94%|█████████████████████████████████████████████████████████████████████████▏    | 352/375 [1:37:17<06:22, 16.64s/it]Epoch-2, Step-1102, Loss: 0.29453104734420776
 94%|█████████████████████████████████████████████████████████████████████████▍    | 353/375 [1:37:33<06:05, 16.60s/it]Epoch-2, Step-1103, Loss: 0.20907104015350342
 94%|█████████████████████████████████████████████████████████████████████████▋    | 354/375 [1:37:49<05:47, 16.56s/it]Epoch-2, Step-1104, Loss: 0.20758198201656342
 95%|█████████████████████████████████████████████████████████████████████████▊    | 355/375 [1:38:06<05:30, 16.53s/it]Epoch-2, Step-1105, Loss: 0.16075795888900757
 95%|██████

Epoch 2, start evaluating.
accuracy: 0.8621666666666666

precision: 0.6327474560592045

recall: 0.6140035906642729

f1: 0.6232346241457859

[[4489  397]
 [ 430  684]]
              precision    recall  f1-score   support

           0       0.91      0.92      0.92      4886
           1       0.63      0.61      0.62      1114

    accuracy                           0.86      6000
   macro avg       0.77      0.77      0.77      6000
weighted avg       0.86      0.86      0.86      6000

best_f1: 0.6232346241457859


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]Epoch-3, Step-1125, Loss: 0.17012706398963928
  0%|▏                                                                               | 1/375 [00:16<1:42:15, 16.40s/it]Epoch-3, Step-1126, Loss: 0.1774526983499527
  1%|▍                                                                               | 2/375 [00:33<1:43:32, 16.65s/it]Epoch-3, Step-1127, Loss: 0.17458902299404144
  1%|▋                                                                               | 3/375 [00:49<1:43:10, 16.64s/it]Epoch-3, Step-1128, Loss: 0.2119418978691101
  1%|▊                                                                               | 4/375 [01:06<1:42:39, 16.60s/it]Epoch-3, Step-1129, Loss: 0.1779017597436905
  1%|█                                                                               | 5/375 [01:23<1:42:31, 16.62s/it]Epoch-3, Step-1130, Loss: 0.22326044738292694
  2%|█▎      

 13%|██████████▌                                                                    | 50/375 [14:21<1:29:29, 16.52s/it]Epoch-3, Step-1175, Loss: 0.17203497886657715
 14%|██████████▋                                                                    | 51/375 [14:37<1:29:36, 16.59s/it]Epoch-3, Step-1176, Loss: 0.22618672251701355
 14%|██████████▉                                                                    | 52/375 [14:54<1:29:05, 16.55s/it]Epoch-3, Step-1177, Loss: 0.31430962681770325
 14%|███████████▏                                                                   | 53/375 [15:10<1:28:54, 16.57s/it]Epoch-3, Step-1178, Loss: 0.24356859922409058
 14%|███████████▍                                                                   | 54/375 [15:28<1:30:02, 16.83s/it]Epoch-3, Step-1179, Loss: 0.16518059372901917
 15%|███████████▌                                                                   | 55/375 [15:45<1:30:08, 16.90s/it]Epoch-3, Step-1180, Loss: 0.1740889996290207
 15%|██████

 27%|████████████████████▊                                                         | 100/375 [28:16<1:17:03, 16.81s/it]Epoch-3, Step-1225, Loss: 0.3025168180465698
 27%|█████████████████████                                                         | 101/375 [28:33<1:16:10, 16.68s/it]Epoch-3, Step-1226, Loss: 0.11059684306383133
 27%|█████████████████████▏                                                        | 102/375 [28:50<1:16:39, 16.85s/it]Epoch-3, Step-1227, Loss: 0.16488777101039886
 27%|█████████████████████▍                                                        | 103/375 [29:07<1:15:50, 16.73s/it]Epoch-3, Step-1228, Loss: 0.24637827277183533
 28%|█████████████████████▋                                                        | 104/375 [29:24<1:16:18, 16.90s/it]Epoch-3, Step-1229, Loss: 0.17976655066013336
 28%|█████████████████████▊                                                        | 105/375 [29:40<1:15:28, 16.77s/it]Epoch-3, Step-1230, Loss: 0.2513660490512848
 28%|███████

 40%|███████████████████████████████▏                                              | 150/375 [42:08<1:02:43, 16.73s/it]Epoch-3, Step-1275, Loss: 0.283493310213089
 40%|███████████████████████████████▍                                              | 151/375 [42:25<1:02:17, 16.69s/it]Epoch-3, Step-1276, Loss: 0.18997220695018768
 41%|███████████████████████████████▌                                              | 152/375 [42:42<1:02:17, 16.76s/it]Epoch-3, Step-1277, Loss: 0.2886461615562439
 41%|███████████████████████████████▊                                              | 153/375 [42:58<1:01:43, 16.68s/it]Epoch-3, Step-1278, Loss: 0.17807824909687042
 41%|████████████████████████████████                                              | 154/375 [43:15<1:01:18, 16.65s/it]Epoch-3, Step-1279, Loss: 0.15950995683670044
 41%|████████████████████████████████▏                                             | 155/375 [43:31<1:00:43, 16.56s/it]Epoch-3, Step-1280, Loss: 0.24016080796718597
 42%|████████

 53%|██████████████████████████████████████████▋                                     | 200/375 [56:00<49:13, 16.88s/it]Epoch-3, Step-1325, Loss: 0.24746748805046082
 54%|██████████████████████████████████████████▉                                     | 201/375 [56:18<50:02, 17.26s/it]Epoch-3, Step-1326, Loss: 0.16463293135166168
 54%|███████████████████████████████████████████                                     | 202/375 [56:34<48:53, 16.96s/it]Epoch-3, Step-1327, Loss: 0.173557311296463
 54%|███████████████████████████████████████████▎                                    | 203/375 [56:51<48:26, 16.90s/it]Epoch-3, Step-1328, Loss: 0.30691707134246826
 54%|███████████████████████████████████████████▌                                    | 204/375 [57:08<47:59, 16.84s/it]Epoch-3, Step-1329, Loss: 0.16903823614120483
 55%|███████████████████████████████████████████▋                                    | 205/375 [57:25<47:30, 16.77s/it]Epoch-3, Step-1330, Loss: 0.21104922890663147
 55%|███████

 67%|████████████████████████████████████████████████████                          | 250/375 [1:09:51<34:24, 16.52s/it]Epoch-3, Step-1375, Loss: 0.2983124852180481
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:10:08<34:11, 16.54s/it]Epoch-3, Step-1376, Loss: 0.17641812562942505
 67%|████████████████████████████████████████████████████▍                         | 252/375 [1:10:24<33:51, 16.52s/it]Epoch-3, Step-1377, Loss: 0.1244676485657692
 67%|████████████████████████████████████████████████████▌                         | 253/375 [1:10:41<33:39, 16.56s/it]Epoch-3, Step-1378, Loss: 0.14965885877609253
 68%|████████████████████████████████████████████████████▊                         | 254/375 [1:10:58<33:35, 16.65s/it]Epoch-3, Step-1379, Loss: 0.21203240752220154
 68%|█████████████████████████████████████████████████████                         | 255/375 [1:11:15<33:26, 16.72s/it]Epoch-3, Step-1380, Loss: 0.240731880068779
 68%|█████████

 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:23:43<20:43, 16.58s/it]Epoch-3, Step-1425, Loss: 0.14953173696994781
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:24:00<20:26, 16.58s/it]Epoch-3, Step-1426, Loss: 0.29820966720581055
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:24:16<20:14, 16.63s/it]Epoch-3, Step-1427, Loss: 0.1737234890460968
 81%|███████████████████████████████████████████████████████████████               | 303/375 [1:24:33<19:52, 16.57s/it]Epoch-3, Step-1428, Loss: 0.33738741278648376
 81%|███████████████████████████████████████████████████████████████▏              | 304/375 [1:24:49<19:36, 16.57s/it]Epoch-3, Step-1429, Loss: 0.23636394739151
 81%|███████████████████████████████████████████████████████████████▍              | 305/375 [1:25:06<19:20, 16.58s/it]Epoch-3, Step-1430, Loss: 0.1894107609987259
 82%|██████████

 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:37:34<07:02, 16.91s/it]Epoch-3, Step-1475, Loss: 0.15488725900650024
 94%|█████████████████████████████████████████████████████████████████████████     | 351/375 [1:37:50<06:43, 16.81s/it]Epoch-3, Step-1476, Loss: 0.2437562793493271
 94%|█████████████████████████████████████████████████████████████████████████▏    | 352/375 [1:38:07<06:24, 16.72s/it]Epoch-3, Step-1477, Loss: 0.21342645585536957
 94%|█████████████████████████████████████████████████████████████████████████▍    | 353/375 [1:38:24<06:07, 16.72s/it]Epoch-3, Step-1478, Loss: 0.1787082850933075
 94%|█████████████████████████████████████████████████████████████████████████▋    | 354/375 [1:38:40<05:49, 16.64s/it]Epoch-3, Step-1479, Loss: 0.23718567192554474
 95%|█████████████████████████████████████████████████████████████████████████▊    | 355/375 [1:38:57<05:32, 16.63s/it]Epoch-3, Step-1480, Loss: 0.22456960380077362
 95%|███████

Epoch 3, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8578333333333333

precision: 0.6202764976958526

recall: 0.604129263913824

f1: 0.6120964074579355

[[4474  412]
 [ 441  673]]
              precision    recall  f1-score   support

           0       0.91      0.92      0.91      4886
           1       0.62      0.60      0.61      1114

    accuracy                           0.86      6000
   macro avg       0.77      0.76      0.76      6000
weighted avg       0.86      0.86      0.86      6000



Epoch-4, Step-1500, Loss: 0.14724886417388916
  0%|▏                                                                               | 1/375 [00:16<1:43:34, 16.62s/it]Epoch-4, Step-1501, Loss: 0.12316986918449402
  1%|▍                                                                               | 2/375 [00:33<1:43:57, 16.72s/it]Epoch-4, Step-1502, Loss: 0.11746003478765488
  1%|▋                                                                               | 3/375 [00:50<1:43:45, 16.74s/it]Epoch-4, Step-1503, Loss: 0.17220409214496613
  1%|▊                                                                               | 4/375 [01:06<1:43:06, 16.68s/it]Epoch-4, Step-1504, Loss: 0.18935923278331757
  1%|█                                                                               | 5/375 [01:23<1:42:52, 16.68s/it]Epoch-4, Step-1505, Loss: 0.1588706076145172
  2%|█▎                                                                              | 6/375 [01:39<1:41:51, 16.56s/it]Epoch-4, St

 13%|██████████▌                                                                    | 50/375 [13:49<1:29:29, 16.52s/it]Epoch-4, Step-1550, Loss: 0.14040324091911316
 14%|██████████▋                                                                    | 51/375 [14:06<1:29:22, 16.55s/it]Epoch-4, Step-1551, Loss: 0.13099294900894165
 14%|██████████▉                                                                    | 52/375 [14:23<1:29:33, 16.63s/it]Epoch-4, Step-1552, Loss: 0.18952986598014832
 14%|███████████▏                                                                   | 53/375 [14:39<1:29:13, 16.63s/it]Epoch-4, Step-1553, Loss: 0.19310468435287476
 14%|███████████▍                                                                   | 54/375 [14:55<1:28:33, 16.55s/it]Epoch-4, Step-1554, Loss: 0.2207520306110382
 15%|███████████▌                                                                   | 55/375 [15:12<1:28:32, 16.60s/it]Epoch-4, Step-1555, Loss: 0.193324014544487
 15%|████████

 27%|████████████████████▊                                                         | 100/375 [27:40<1:16:10, 16.62s/it]Epoch-4, Step-1600, Loss: 0.169778972864151
 27%|█████████████████████                                                         | 101/375 [27:57<1:17:03, 16.87s/it]Epoch-4, Step-1601, Loss: 0.15365290641784668
 27%|█████████████████████▏                                                        | 102/375 [28:14<1:16:37, 16.84s/it]Epoch-4, Step-1602, Loss: 0.21225832402706146
 27%|█████████████████████▍                                                        | 103/375 [28:30<1:16:07, 16.79s/it]Epoch-4, Step-1603, Loss: 0.14115563035011292
 28%|█████████████████████▋                                                        | 104/375 [28:47<1:15:45, 16.77s/it]Epoch-4, Step-1604, Loss: 0.19383862614631653
 28%|█████████████████████▊                                                        | 105/375 [29:04<1:15:26, 16.76s/it]Epoch-4, Step-1605, Loss: 0.20142053067684174
 28%|███████

 40%|██████████████████████████████▉                                               | 149/375 [41:18<1:02:16, 16.53s/it]Epoch-4, Step-1649, Loss: 0.1307087540626526
 40%|███████████████████████████████▏                                              | 150/375 [41:35<1:02:38, 16.70s/it]Epoch-4, Step-1650, Loss: 0.2539381980895996
 40%|███████████████████████████████▍                                              | 151/375 [41:51<1:02:01, 16.61s/it]Epoch-4, Step-1651, Loss: 0.10979717969894409
 41%|███████████████████████████████▌                                              | 152/375 [42:08<1:01:24, 16.52s/it]Epoch-4, Step-1652, Loss: 0.2122763693332672
 41%|███████████████████████████████▊                                              | 153/375 [42:25<1:01:25, 16.60s/it]Epoch-4, Step-1653, Loss: 0.06377316266298294
 41%|████████████████████████████████                                              | 154/375 [42:41<1:01:09, 16.61s/it]Epoch-4, Step-1654, Loss: 0.16261979937553406
 41%|████████

 53%|██████████████████████████████████████████▍                                     | 199/375 [55:06<48:23, 16.50s/it]Epoch-4, Step-1699, Loss: 0.17077405750751495
 53%|██████████████████████████████████████████▋                                     | 200/375 [55:22<47:55, 16.43s/it]Epoch-4, Step-1700, Loss: 0.20575286448001862
 54%|██████████████████████████████████████████▉                                     | 201/375 [55:39<47:51, 16.50s/it]Epoch-4, Step-1701, Loss: 0.20206809043884277
 54%|███████████████████████████████████████████                                     | 202/375 [55:56<47:49, 16.59s/it]Epoch-4, Step-1702, Loss: 0.31581592559814453
 54%|███████████████████████████████████████████▎                                    | 203/375 [56:12<47:33, 16.59s/it]Epoch-4, Step-1703, Loss: 0.12241016328334808
 54%|███████████████████████████████████████████▌                                    | 204/375 [56:29<47:10, 16.55s/it]Epoch-4, Step-1704, Loss: 0.1544974148273468
 55%|██████

 66%|███████████████████████████████████████████████████▊                          | 249/375 [1:08:57<35:00, 16.67s/it]Epoch-4, Step-1749, Loss: 0.2678879499435425
 67%|████████████████████████████████████████████████████                          | 250/375 [1:09:14<34:36, 16.61s/it]Epoch-4, Step-1750, Loss: 0.10391273349523544
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:09:31<34:34, 16.73s/it]Epoch-4, Step-1751, Loss: 0.08627564460039139
 67%|████████████████████████████████████████████████████▍                         | 252/375 [1:09:47<34:11, 16.68s/it]Epoch-4, Step-1752, Loss: 0.2681463658809662
 67%|████████████████████████████████████████████████████▌                         | 253/375 [1:10:04<33:47, 16.62s/it]Epoch-4, Step-1753, Loss: 0.08134812116622925
 68%|████████████████████████████████████████████████████▊                         | 254/375 [1:10:20<33:19, 16.52s/it]Epoch-4, Step-1754, Loss: 0.1878567785024643
 68%|████████

 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:22:50<21:06, 16.67s/it]Epoch-4, Step-1799, Loss: 0.1155499666929245
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:23:06<20:45, 16.60s/it]Epoch-4, Step-1800, Loss: 0.32111838459968567
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:23:23<20:31, 16.64s/it]Epoch-4, Step-1801, Loss: 0.21573495864868164
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:23:40<20:21, 16.74s/it]Epoch-4, Step-1802, Loss: 0.10568464547395706
 81%|███████████████████████████████████████████████████████████████               | 303/375 [1:23:56<20:00, 16.68s/it]Epoch-4, Step-1803, Loss: 0.22224891185760498
 81%|███████████████████████████████████████████████████████████████▏              | 304/375 [1:24:13<19:39, 16.62s/it]Epoch-4, Step-1804, Loss: 0.07672028988599777
 81%|██████

 93%|████████████████████████████████████████████████████████████████████████▌     | 349/375 [1:36:42<07:13, 16.66s/it]Epoch-4, Step-1849, Loss: 0.22320210933685303
 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:36:58<06:54, 16.59s/it]Epoch-4, Step-1850, Loss: 0.1753966510295868
 94%|█████████████████████████████████████████████████████████████████████████     | 351/375 [1:37:14<06:36, 16.52s/it]Epoch-4, Step-1851, Loss: 0.10151683539152145
 94%|█████████████████████████████████████████████████████████████████████████▏    | 352/375 [1:37:31<06:21, 16.60s/it]Epoch-4, Step-1852, Loss: 0.17490221560001373
 94%|█████████████████████████████████████████████████████████████████████████▍    | 353/375 [1:37:48<06:04, 16.58s/it]Epoch-4, Step-1853, Loss: 0.148149773478508
 94%|█████████████████████████████████████████████████████████████████████████▋    | 354/375 [1:38:04<05:48, 16.59s/it]Epoch-4, Step-1854, Loss: 0.11115428805351257
 95%|████████

Epoch 4, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8548333333333333

precision: 0.6274921301154249

recall: 0.5368043087971275

f1: 0.5786163522012578

[[4531  355]
 [ 516  598]]
              precision    recall  f1-score   support

           0       0.90      0.93      0.91      4886
           1       0.63      0.54      0.58      1114

    accuracy                           0.85      6000
   macro avg       0.76      0.73      0.75      6000
weighted avg       0.85      0.85      0.85      6000



Epoch-5, Step-1875, Loss: 0.1330990344285965
  0%|▏                                                                               | 1/375 [00:16<1:45:07, 16.87s/it]Epoch-5, Step-1876, Loss: 0.16753454506397247
  1%|▍                                                                               | 2/375 [00:34<1:46:43, 17.17s/it]Epoch-5, Step-1877, Loss: 0.08202500641345978
  1%|▋                                                                               | 3/375 [00:50<1:44:41, 16.89s/it]Epoch-5, Step-1878, Loss: 0.13169190287590027
  1%|▊                                                                               | 4/375 [01:07<1:43:03, 16.67s/it]Epoch-5, Step-1879, Loss: 0.11939780414104462
  1%|█                                                                               | 5/375 [01:23<1:42:19, 16.59s/it]Epoch-5, Step-1880, Loss: 0.12636958062648773
  2%|█▎                                                                              | 6/375 [01:40<1:42:19, 16.64s/it]Epoch-5, St

 13%|██████████▌                                                                    | 50/375 [13:56<1:30:38, 16.74s/it]Epoch-5, Step-1925, Loss: 0.11883978545665741
 14%|██████████▋                                                                    | 51/375 [14:13<1:30:29, 16.76s/it]Epoch-5, Step-1926, Loss: 0.10240833461284637
 14%|██████████▉                                                                    | 52/375 [14:29<1:30:07, 16.74s/it]Epoch-5, Step-1927, Loss: 0.07059084624052048
 14%|███████████▏                                                                   | 53/375 [14:46<1:29:37, 16.70s/it]Epoch-5, Step-1928, Loss: 0.1261589229106903
 14%|███████████▍                                                                   | 54/375 [15:04<1:31:05, 17.03s/it]Epoch-5, Step-1929, Loss: 0.19971507787704468
 15%|███████████▌                                                                   | 55/375 [15:22<1:31:56, 17.24s/it]Epoch-5, Step-1930, Loss: 0.2153376191854477
 15%|███████

 27%|████████████████████▊                                                         | 100/375 [27:51<1:16:00, 16.58s/it]Epoch-5, Step-1975, Loss: 0.2734348475933075
 27%|█████████████████████                                                         | 101/375 [28:08<1:16:04, 16.66s/it]Epoch-5, Step-1976, Loss: 0.06225304678082466
 27%|█████████████████████▏                                                        | 102/375 [28:25<1:15:49, 16.66s/it]Epoch-5, Step-1977, Loss: 0.16262701153755188
 27%|█████████████████████▍                                                        | 103/375 [28:41<1:15:52, 16.74s/it]Epoch-5, Step-1978, Loss: 0.1121009886264801
 28%|█████████████████████▋                                                        | 104/375 [28:58<1:15:20, 16.68s/it]Epoch-5, Step-1979, Loss: 0.14057405292987823
 28%|█████████████████████▊                                                        | 105/375 [29:15<1:14:57, 16.66s/it]Epoch-5, Step-1980, Loss: 0.2606508433818817
 28%|████████

 40%|███████████████████████████████▏                                              | 150/375 [41:45<1:02:51, 16.76s/it]Epoch-5, Step-2025, Loss: 0.1242947056889534
 40%|███████████████████████████████▍                                              | 151/375 [42:01<1:02:30, 16.74s/it]Epoch-5, Step-2026, Loss: 0.17715008556842804
 41%|███████████████████████████████▌                                              | 152/375 [42:18<1:02:34, 16.84s/it]Epoch-5, Step-2027, Loss: 0.08223874121904373
 41%|███████████████████████████████▊                                              | 153/375 [42:35<1:01:58, 16.75s/it]Epoch-5, Step-2028, Loss: 0.16460704803466797
 41%|████████████████████████████████                                              | 154/375 [42:52<1:01:38, 16.73s/it]Epoch-5, Step-2029, Loss: 0.12414954602718353
 41%|████████████████████████████████▏                                             | 155/375 [43:08<1:01:14, 16.70s/it]Epoch-5, Step-2030, Loss: 0.11966641992330551
 42%|██████

 53%|██████████████████████████████████████████▍                                     | 199/375 [55:19<48:52, 16.66s/it]Epoch-5, Step-2074, Loss: 0.15801309049129486
 53%|██████████████████████████████████████████▋                                     | 200/375 [55:36<48:34, 16.66s/it]Epoch-5, Step-2075, Loss: 0.2444523721933365
 54%|██████████████████████████████████████████▉                                     | 201/375 [55:53<48:12, 16.62s/it]Epoch-5, Step-2076, Loss: 0.14671659469604492
 54%|███████████████████████████████████████████                                     | 202/375 [56:09<47:56, 16.63s/it]Epoch-5, Step-2077, Loss: 0.2113373577594757
 54%|███████████████████████████████████████████▎                                    | 203/375 [56:26<47:42, 16.64s/it]Epoch-5, Step-2078, Loss: 0.20177364349365234
 54%|███████████████████████████████████████████▌                                    | 204/375 [56:42<47:12, 16.57s/it]Epoch-5, Step-2079, Loss: 0.16149383783340454
 55%|███████

 66%|███████████████████████████████████████████████████▌                          | 248/375 [1:08:59<36:20, 17.17s/it]Epoch-5, Step-2123, Loss: 0.11083260923624039
 66%|███████████████████████████████████████████████████▊                          | 249/375 [1:09:16<35:40, 16.99s/it]Epoch-5, Step-2124, Loss: 0.11958832293748856
 67%|████████████████████████████████████████████████████                          | 250/375 [1:09:33<35:11, 16.89s/it]Epoch-5, Step-2125, Loss: 0.11800092458724976
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:09:49<34:44, 16.81s/it]Epoch-5, Step-2126, Loss: 0.15543384850025177
 67%|████████████████████████████████████████████████████▍                         | 252/375 [1:10:06<34:18, 16.74s/it]Epoch-5, Step-2127, Loss: 0.19972968101501465
 67%|████████████████████████████████████████████████████▌                         | 253/375 [1:10:22<33:51, 16.65s/it]Epoch-5, Step-2128, Loss: 0.12363553047180176
 68%|█████

 79%|█████████████████████████████████████████████████████████████▊                | 297/375 [1:22:33<21:27, 16.50s/it]Epoch-5, Step-2172, Loss: 0.1668502241373062
 79%|█████████████████████████████████████████████████████████████▉                | 298/375 [1:22:49<21:14, 16.55s/it]Epoch-5, Step-2173, Loss: 0.2445371299982071
 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:23:06<20:59, 16.57s/it]Epoch-5, Step-2174, Loss: 0.1543307900428772
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:23:23<20:45, 16.61s/it]Epoch-5, Step-2175, Loss: 0.06326112896203995
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:23:39<20:34, 16.68s/it]Epoch-5, Step-2176, Loss: 0.10598821192979813
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:23:56<20:22, 16.75s/it]Epoch-5, Step-2177, Loss: 0.21438398957252502
 81%|████████

 93%|████████████████████████████████████████████████████████████████████████▏     | 347/375 [1:36:24<07:44, 16.60s/it]Epoch-5, Step-2222, Loss: 0.14430786669254303
 93%|████████████████████████████████████████████████████████████████████████▍     | 348/375 [1:36:41<07:27, 16.59s/it]Epoch-5, Step-2223, Loss: 0.17478901147842407
 93%|████████████████████████████████████████████████████████████████████████▌     | 349/375 [1:36:58<07:11, 16.59s/it]Epoch-5, Step-2224, Loss: 0.08488374948501587
 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:37:14<06:53, 16.55s/it]Epoch-5, Step-2225, Loss: 0.039951786398887634
 94%|█████████████████████████████████████████████████████████████████████████     | 351/375 [1:37:30<06:36, 16.52s/it]Epoch-5, Step-2226, Loss: 0.16361060738563538
 94%|█████████████████████████████████████████████████████████████████████████▏    | 352/375 [1:37:47<06:19, 16.51s/it]Epoch-5, Step-2227, Loss: 0.14578741788864136
 94%|████

Epoch 5, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8413333333333334

precision: 0.568760611205433

recall: 0.6014362657091562

f1: 0.5846422338568935

[[4378  508]
 [ 444  670]]
              precision    recall  f1-score   support

           0       0.91      0.90      0.90      4886
           1       0.57      0.60      0.58      1114

    accuracy                           0.84      6000
   macro avg       0.74      0.75      0.74      6000
weighted avg       0.84      0.84      0.84      6000



Epoch-6, Step-2250, Loss: 0.0773409754037857
  0%|▏                                                                               | 1/375 [00:16<1:43:11, 16.55s/it]Epoch-6, Step-2251, Loss: 0.16087950766086578
  1%|▍                                                                               | 2/375 [00:33<1:43:08, 16.59s/it]Epoch-6, Step-2252, Loss: 0.11299269646406174
  1%|▋                                                                               | 3/375 [00:49<1:43:15, 16.66s/it]Epoch-6, Step-2253, Loss: 0.061449527740478516
  1%|▊                                                                               | 4/375 [01:06<1:42:42, 16.61s/it]Epoch-6, Step-2254, Loss: 0.056394513696432114
  1%|█                                                                               | 5/375 [01:23<1:42:41, 16.65s/it]Epoch-6, Step-2255, Loss: 0.055075328797101974
  2%|█▎                                                                              | 6/375 [01:39<1:42:11, 16.62s/it]Epoch-6,

 13%|██████████▌                                                                    | 50/375 [13:52<1:29:59, 16.61s/it]Epoch-6, Step-2300, Loss: 0.1722799390554428
 14%|██████████▋                                                                    | 51/375 [14:09<1:30:02, 16.68s/it]Epoch-6, Step-2301, Loss: 0.16071628034114838
 14%|██████████▉                                                                    | 52/375 [14:25<1:30:01, 16.72s/it]Epoch-6, Step-2302, Loss: 0.08312661200761795
 14%|███████████▏                                                                   | 53/375 [14:42<1:29:48, 16.73s/it]Epoch-6, Step-2303, Loss: 0.11357279866933823
 14%|███████████▍                                                                   | 54/375 [14:59<1:29:14, 16.68s/it]Epoch-6, Step-2304, Loss: 0.04168834164738655
 15%|███████████▌                                                                   | 55/375 [15:17<1:31:44, 17.20s/it]Epoch-6, Step-2305, Loss: 0.05386411026120186
 15%|██████

 26%|████████████████████▊                                                          | 99/375 [27:28<1:16:23, 16.61s/it]Epoch-6, Step-2349, Loss: 0.19892777502536774
 27%|████████████████████▊                                                         | 100/375 [27:44<1:16:01, 16.59s/it]Epoch-6, Step-2350, Loss: 0.06433393061161041
 27%|█████████████████████                                                         | 101/375 [28:01<1:15:47, 16.60s/it]Epoch-6, Step-2351, Loss: 0.04487264156341553
 27%|█████████████████████▏                                                        | 102/375 [28:17<1:15:16, 16.54s/it]Epoch-6, Step-2352, Loss: 0.09415265917778015
 27%|█████████████████████▍                                                        | 103/375 [28:34<1:15:15, 16.60s/it]Epoch-6, Step-2353, Loss: 0.18475441634655
 28%|█████████████████████▋                                                        | 104/375 [28:50<1:14:37, 16.52s/it]Epoch-6, Step-2354, Loss: 0.0720532089471817
 28%|█████████

 39%|██████████████████████████████▊                                               | 148/375 [41:04<1:04:03, 16.93s/it]Epoch-6, Step-2398, Loss: 0.20809277892112732
 40%|██████████████████████████████▉                                               | 149/375 [41:20<1:03:02, 16.74s/it]Epoch-6, Step-2399, Loss: 0.18522420525550842
 40%|███████████████████████████████▏                                              | 150/375 [41:37<1:02:31, 16.67s/it]Epoch-6, Step-2400, Loss: 0.04131310433149338
 40%|███████████████████████████████▍                                              | 151/375 [41:53<1:01:48, 16.56s/it]Epoch-6, Step-2401, Loss: 0.06922934204339981
 41%|███████████████████████████████▌                                              | 152/375 [42:09<1:01:32, 16.56s/it]Epoch-6, Step-2402, Loss: 0.08088158071041107
 41%|███████████████████████████████▊                                              | 153/375 [42:26<1:01:45, 16.69s/it]Epoch-6, Step-2403, Loss: 0.09277814626693726
 41%|█████

 53%|██████████████████████████████████████████▏                                     | 198/375 [54:58<49:10, 16.67s/it]Epoch-6, Step-2448, Loss: 0.06175394728779793
 53%|██████████████████████████████████████████▍                                     | 199/375 [55:15<49:00, 16.71s/it]Epoch-6, Step-2449, Loss: 0.13025404512882233
 53%|██████████████████████████████████████████▋                                     | 200/375 [55:31<48:30, 16.63s/it]Epoch-6, Step-2450, Loss: 0.1892857402563095
 54%|██████████████████████████████████████████▉                                     | 201/375 [55:48<48:13, 16.63s/it]Epoch-6, Step-2451, Loss: 0.05113114044070244
 54%|███████████████████████████████████████████                                     | 202/375 [56:04<47:42, 16.54s/it]Epoch-6, Step-2452, Loss: 0.07046589255332947
 54%|███████████████████████████████████████████▎                                    | 203/375 [56:21<47:26, 16.55s/it]Epoch-6, Step-2453, Loss: 0.11443112790584564
 54%|██████

 66%|███████████████████████████████████████████████████▍                          | 247/375 [1:08:30<35:28, 16.63s/it]Epoch-6, Step-2497, Loss: 0.08411131799221039
 66%|███████████████████████████████████████████████████▌                          | 248/375 [1:08:46<35:05, 16.58s/it]Epoch-6, Step-2498, Loss: 0.06444251537322998
 66%|███████████████████████████████████████████████████▊                          | 249/375 [1:09:03<34:55, 16.63s/it]Epoch-6, Step-2499, Loss: 0.09322396665811539
 67%|████████████████████████████████████████████████████                          | 250/375 [1:09:20<34:34, 16.59s/it]Epoch-6, Step-2500, Loss: 0.09106103330850601
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:09:36<34:07, 16.51s/it]Epoch-6, Step-2501, Loss: 0.044929053634405136
 67%|████████████████████████████████████████████████████▍                         | 252/375 [1:09:53<34:00, 16.59s/it]Epoch-6, Step-2502, Loss: 0.04162941500544548
 67%|████

 79%|█████████████████████████████████████████████████████████████▌                | 296/375 [1:22:03<21:49, 16.58s/it]Epoch-6, Step-2546, Loss: 0.1138506680727005
 79%|█████████████████████████████████████████████████████████████▊                | 297/375 [1:22:20<21:27, 16.50s/it]Epoch-6, Step-2547, Loss: 0.08122161030769348
 79%|█████████████████████████████████████████████████████████████▉                | 298/375 [1:22:36<21:10, 16.50s/it]Epoch-6, Step-2548, Loss: 0.050533510744571686
 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:22:53<21:10, 16.72s/it]Epoch-6, Step-2549, Loss: 0.07383311539888382
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:23:10<20:50, 16.68s/it]Epoch-6, Step-2550, Loss: 0.1613200306892395
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:23:26<20:30, 16.63s/it]Epoch-6, Step-2551, Loss: 0.09077741205692291
 81%|██████

 92%|███████████████████████████████████████████████████████████████████████▊      | 345/375 [1:35:37<08:15, 16.52s/it]Epoch-6, Step-2595, Loss: 0.08991584926843643
 92%|███████████████████████████████████████████████████████████████████████▉      | 346/375 [1:35:54<07:58, 16.51s/it]Epoch-6, Step-2596, Loss: 0.10254523903131485
 93%|████████████████████████████████████████████████████████████████████████▏     | 347/375 [1:36:10<07:42, 16.50s/it]Epoch-6, Step-2597, Loss: 0.1045418530702591
 93%|████████████████████████████████████████████████████████████████████████▍     | 348/375 [1:36:27<07:26, 16.53s/it]Epoch-6, Step-2598, Loss: 0.07517849653959274
 93%|████████████████████████████████████████████████████████████████████████▌     | 349/375 [1:36:43<07:10, 16.56s/it]Epoch-6, Step-2599, Loss: 0.10917999595403671
 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:37:00<06:55, 16.61s/it]Epoch-6, Step-2600, Loss: 0.11731648445129395
 94%|██████

Epoch 6, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8326666666666667

precision: 0.540680473372781

recall: 0.6561938958707361

f1: 0.5928629359286293

[[4265  621]
 [ 383  731]]
              precision    recall  f1-score   support

           0       0.92      0.87      0.89      4886
           1       0.54      0.66      0.59      1114

    accuracy                           0.83      6000
   macro avg       0.73      0.76      0.74      6000
weighted avg       0.85      0.83      0.84      6000



Epoch-7, Step-2625, Loss: 0.047335390001535416
  0%|▏                                                                               | 1/375 [00:16<1:43:24, 16.59s/it]Epoch-7, Step-2626, Loss: 0.042385172098875046
  1%|▍                                                                               | 2/375 [00:33<1:44:21, 16.79s/it]Epoch-7, Step-2627, Loss: 0.23312358558177948
  1%|▋                                                                               | 3/375 [00:50<1:43:47, 16.74s/it]Epoch-7, Step-2628, Loss: 0.11023367941379547
  1%|▊                                                                               | 4/375 [01:07<1:43:40, 16.77s/it]Epoch-7, Step-2629, Loss: 0.04631555452942848
  1%|█                                                                               | 5/375 [01:23<1:42:49, 16.67s/it]Epoch-7, Step-2630, Loss: 0.07378805428743362
  2%|█▎                                                                              | 6/375 [01:40<1:42:28, 16.66s/it]Epoch-7,

 13%|██████████▌                                                                    | 50/375 [13:53<1:30:43, 16.75s/it]Epoch-7, Step-2675, Loss: 0.12272638082504272
 14%|██████████▋                                                                    | 51/375 [14:10<1:30:31, 16.76s/it]Epoch-7, Step-2676, Loss: 0.07180031388998032
 14%|██████████▉                                                                    | 52/375 [14:27<1:30:05, 16.74s/it]Epoch-7, Step-2677, Loss: 0.15254198014736176
 14%|███████████▏                                                                   | 53/375 [14:44<1:30:32, 16.87s/it]Epoch-7, Step-2678, Loss: 0.054074034094810486
 14%|███████████▍                                                                   | 54/375 [15:00<1:29:38, 16.76s/it]Epoch-7, Step-2679, Loss: 0.040815308690071106
 15%|███████████▌                                                                   | 55/375 [15:17<1:28:49, 16.66s/it]Epoch-7, Step-2680, Loss: 0.04960514232516289
 15%|███

 26%|████████████████████▊                                                          | 99/375 [27:29<1:16:24, 16.61s/it]Epoch-7, Step-2724, Loss: 0.015939965844154358
 27%|████████████████████▊                                                         | 100/375 [27:46<1:16:28, 16.68s/it]Epoch-7, Step-2725, Loss: 0.03748286888003349
 27%|█████████████████████                                                         | 101/375 [28:02<1:16:13, 16.69s/it]Epoch-7, Step-2726, Loss: 0.06580255925655365
 27%|█████████████████████▏                                                        | 102/375 [28:19<1:16:26, 16.80s/it]Epoch-7, Step-2727, Loss: 0.08720308542251587
 27%|█████████████████████▍                                                        | 103/375 [28:36<1:15:58, 16.76s/it]Epoch-7, Step-2728, Loss: 0.11722641438245773
 28%|█████████████████████▋                                                        | 104/375 [28:53<1:15:48, 16.78s/it]Epoch-7, Step-2729, Loss: 0.08133865892887115
 28%|████

 39%|██████████████████████████████▊                                               | 148/375 [41:03<1:02:29, 16.52s/it]Epoch-7, Step-2773, Loss: 0.025954240933060646
 40%|██████████████████████████████▉                                               | 149/375 [41:20<1:02:00, 16.46s/it]Epoch-7, Step-2774, Loss: 0.037828583270311356
 40%|███████████████████████████████▏                                              | 150/375 [41:36<1:02:08, 16.57s/it]Epoch-7, Step-2775, Loss: 0.07055075466632843
 40%|███████████████████████████████▍                                              | 151/375 [41:53<1:01:48, 16.56s/it]Epoch-7, Step-2776, Loss: 0.12517724931240082
 41%|███████████████████████████████▌                                              | 152/375 [42:09<1:01:13, 16.47s/it]Epoch-7, Step-2777, Loss: 0.052994005382061005
 41%|███████████████████████████████▊                                              | 153/375 [42:26<1:00:48, 16.43s/it]Epoch-7, Step-2778, Loss: 0.02486533671617508
 41%|██

 53%|██████████████████████████████████████████                                      | 197/375 [54:40<49:47, 16.78s/it]Epoch-7, Step-2822, Loss: 0.08628431707620621
 53%|██████████████████████████████████████████▏                                     | 198/375 [54:57<49:12, 16.68s/it]Epoch-7, Step-2823, Loss: 0.04095283895730972
 53%|██████████████████████████████████████████▍                                     | 199/375 [55:13<48:49, 16.64s/it]Epoch-7, Step-2824, Loss: 0.08868392556905746
 53%|██████████████████████████████████████████▋                                     | 200/375 [55:29<48:15, 16.55s/it]Epoch-7, Step-2825, Loss: 0.09112537652254105
 54%|██████████████████████████████████████████▉                                     | 201/375 [55:46<48:14, 16.63s/it]Epoch-7, Step-2826, Loss: 0.07476381212472916
 54%|███████████████████████████████████████████                                     | 202/375 [56:03<47:49, 16.59s/it]Epoch-7, Step-2827, Loss: 0.0662575215101242
 54%|██████

 66%|███████████████████████████████████████████████████▏                          | 246/375 [1:08:12<35:35, 16.55s/it]Epoch-7, Step-2871, Loss: 0.044386040419340134
 66%|███████████████████████████████████████████████████▍                          | 247/375 [1:08:28<35:12, 16.50s/it]Epoch-7, Step-2872, Loss: 0.06337107717990875
 66%|███████████████████████████████████████████████████▌                          | 248/375 [1:08:45<34:59, 16.53s/it]Epoch-7, Step-2873, Loss: 0.12564919888973236
 66%|███████████████████████████████████████████████████▊                          | 249/375 [1:09:02<34:46, 16.56s/it]Epoch-7, Step-2874, Loss: 0.2148652970790863
 67%|████████████████████████████████████████████████████                          | 250/375 [1:09:18<34:25, 16.52s/it]Epoch-7, Step-2875, Loss: 0.0673956573009491
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:09:35<34:10, 16.54s/it]Epoch-7, Step-2876, Loss: 0.04034427925944328
 67%|██████

 79%|█████████████████████████████████████████████████████████████▎                | 295/375 [1:21:42<22:07, 16.59s/it]Epoch-7, Step-2920, Loss: 0.0691668838262558
 79%|█████████████████████████████████████████████████████████████▌                | 296/375 [1:22:00<22:20, 16.97s/it]Epoch-7, Step-2921, Loss: 0.08153513073921204
 79%|█████████████████████████████████████████████████████████████▊                | 297/375 [1:22:17<21:59, 16.91s/it]Epoch-7, Step-2922, Loss: 0.08785595744848251
 79%|█████████████████████████████████████████████████████████████▉                | 298/375 [1:22:34<21:34, 16.82s/it]Epoch-7, Step-2923, Loss: 0.10125866532325745
 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:22:50<21:06, 16.67s/it]Epoch-7, Step-2924, Loss: 0.16384601593017578
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:23:07<20:49, 16.66s/it]Epoch-7, Step-2925, Loss: 0.08154002577066422
 80%|██████

 92%|███████████████████████████████████████████████████████████████████████▌      | 344/375 [1:35:18<08:35, 16.62s/it]Epoch-7, Step-2969, Loss: 0.20294006168842316
 92%|███████████████████████████████████████████████████████████████████████▊      | 345/375 [1:35:34<08:17, 16.60s/it]Epoch-7, Step-2970, Loss: 0.11804971098899841
 92%|███████████████████████████████████████████████████████████████████████▉      | 346/375 [1:35:51<07:59, 16.53s/it]Epoch-7, Step-2971, Loss: 0.041090983897447586
 93%|████████████████████████████████████████████████████████████████████████▏     | 347/375 [1:36:07<07:42, 16.52s/it]Epoch-7, Step-2972, Loss: 0.07308829575777054
 93%|████████████████████████████████████████████████████████████████████████▍     | 348/375 [1:36:24<07:29, 16.64s/it]Epoch-7, Step-2973, Loss: 0.12693603336811066
 93%|████████████████████████████████████████████████████████████████████████▌     | 349/375 [1:36:41<07:11, 16.61s/it]Epoch-7, Step-2974, Loss: 0.07347891479730606
 93%|████

Epoch 7, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8521666666666666

precision: 0.6116027531956736

recall: 0.5583482944344704

f1: 0.5837634913186298

[[4491  395]
 [ 492  622]]
              precision    recall  f1-score   support

           0       0.90      0.92      0.91      4886
           1       0.61      0.56      0.58      1114

    accuracy                           0.85      6000
   macro avg       0.76      0.74      0.75      6000
weighted avg       0.85      0.85      0.85      6000



Epoch-8, Step-3000, Loss: 0.032120998948812485
  0%|▏                                                                               | 1/375 [00:16<1:43:40, 16.63s/it]Epoch-8, Step-3001, Loss: 0.04603848606348038
  1%|▍                                                                               | 2/375 [00:33<1:43:04, 16.58s/it]Epoch-8, Step-3002, Loss: 0.01868801936507225
  1%|▋                                                                               | 3/375 [00:49<1:43:05, 16.63s/it]Epoch-8, Step-3003, Loss: 0.04197381064295769
  1%|▊                                                                               | 4/375 [01:06<1:42:32, 16.58s/it]Epoch-8, Step-3004, Loss: 0.02445562370121479
  1%|█                                                                               | 5/375 [01:22<1:42:16, 16.59s/it]Epoch-8, Step-3005, Loss: 0.09157624840736389
  2%|█▎                                                                              | 6/375 [01:39<1:41:48, 16.55s/it]Epoch-8, 

 13%|██████████▌                                                                    | 50/375 [13:51<1:29:47, 16.58s/it]Epoch-8, Step-3050, Loss: 0.031635675579309464
 14%|██████████▋                                                                    | 51/375 [14:08<1:29:19, 16.54s/it]Epoch-8, Step-3051, Loss: 0.039520956575870514
 14%|██████████▉                                                                    | 52/375 [14:24<1:29:06, 16.55s/it]Epoch-8, Step-3052, Loss: 0.024033278226852417
 14%|███████████▏                                                                   | 53/375 [14:41<1:28:31, 16.50s/it]Epoch-8, Step-3053, Loss: 0.10060842335224152
 14%|███████████▍                                                                   | 54/375 [14:57<1:28:07, 16.47s/it]Epoch-8, Step-3054, Loss: 0.054483551532030106
 15%|███████████▌                                                                   | 55/375 [15:14<1:28:10, 16.53s/it]Epoch-8, Step-3055, Loss: 0.06374909728765488
 15%|█

 26%|████████████████████▊                                                          | 99/375 [27:24<1:16:10, 16.56s/it]Epoch-8, Step-3099, Loss: 0.04886302351951599
 27%|████████████████████▊                                                         | 100/375 [27:41<1:15:47, 16.54s/it]Epoch-8, Step-3100, Loss: 0.023371387273073196
 27%|█████████████████████                                                         | 101/375 [27:57<1:15:21, 16.50s/it]Epoch-8, Step-3101, Loss: 0.017285633832216263
 27%|█████████████████████▏                                                        | 102/375 [28:14<1:15:16, 16.54s/it]Epoch-8, Step-3102, Loss: 0.0379306934773922
 27%|█████████████████████▍                                                        | 103/375 [28:32<1:17:22, 17.07s/it]Epoch-8, Step-3103, Loss: 0.14056812226772308
 28%|█████████████████████▋                                                        | 104/375 [28:49<1:16:30, 16.94s/it]Epoch-8, Step-3104, Loss: 0.03781720995903015
 28%|████

 39%|██████████████████████████████▊                                               | 148/375 [40:59<1:03:04, 16.67s/it]Epoch-8, Step-3148, Loss: 0.056664709001779556
 40%|██████████████████████████████▉                                               | 149/375 [41:15<1:02:36, 16.62s/it]Epoch-8, Step-3149, Loss: 0.04886847734451294
 40%|███████████████████████████████▏                                              | 150/375 [41:32<1:02:12, 16.59s/it]Epoch-8, Step-3150, Loss: 0.036830317229032516
 40%|███████████████████████████████▍                                              | 151/375 [41:48<1:02:01, 16.62s/it]Epoch-8, Step-3151, Loss: 0.10911522805690765
 41%|███████████████████████████████▌                                              | 152/375 [42:05<1:01:39, 16.59s/it]Epoch-8, Step-3152, Loss: 0.11598581820726395
 41%|███████████████████████████████▊                                              | 153/375 [42:21<1:01:31, 16.63s/it]Epoch-8, Step-3153, Loss: 0.028962187469005585
 41%|██

 53%|██████████████████████████████████████████                                      | 197/375 [54:35<51:12, 17.26s/it]Epoch-8, Step-3197, Loss: 0.07546362280845642
 53%|██████████████████████████████████████████▏                                     | 198/375 [54:51<50:24, 17.08s/it]Epoch-8, Step-3198, Loss: 0.1091880351305008
 53%|██████████████████████████████████████████▍                                     | 199/375 [55:08<49:35, 16.91s/it]Epoch-8, Step-3199, Loss: 0.07069192081689835
 53%|██████████████████████████████████████████▋                                     | 200/375 [55:24<49:03, 16.82s/it]Epoch-8, Step-3200, Loss: 0.12205956131219864
 54%|██████████████████████████████████████████▉                                     | 201/375 [55:41<48:38, 16.77s/it]Epoch-8, Step-3201, Loss: 0.049293603748083115
 54%|███████████████████████████████████████████                                     | 202/375 [55:57<48:04, 16.67s/it]Epoch-8, Step-3202, Loss: 0.038586799055337906
 54%|████

 66%|███████████████████████████████████████████████████▏                          | 246/375 [1:08:14<35:36, 16.56s/it]Epoch-8, Step-3246, Loss: 0.08864437788724899
 66%|███████████████████████████████████████████████████▍                          | 247/375 [1:08:30<35:23, 16.59s/it]Epoch-8, Step-3247, Loss: 0.04316015541553497
 66%|███████████████████████████████████████████████████▌                          | 248/375 [1:08:47<35:08, 16.60s/it]Epoch-8, Step-3248, Loss: 0.016301320865750313
 66%|███████████████████████████████████████████████████▊                          | 249/375 [1:09:04<35:01, 16.68s/it]Epoch-8, Step-3249, Loss: 0.03010849840939045
 67%|████████████████████████████████████████████████████                          | 250/375 [1:09:21<34:51, 16.74s/it]Epoch-8, Step-3250, Loss: 0.04938649386167526
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:09:37<34:30, 16.69s/it]Epoch-8, Step-3251, Loss: 0.027238773182034492
 67%|███

 79%|█████████████████████████████████████████████████████████████▎                | 295/375 [1:21:46<22:08, 16.60s/it]Epoch-8, Step-3295, Loss: 0.08133812248706818
 79%|█████████████████████████████████████████████████████████████▌                | 296/375 [1:22:03<21:46, 16.54s/it]Epoch-8, Step-3296, Loss: 0.04682265967130661
 79%|█████████████████████████████████████████████████████████████▊                | 297/375 [1:22:20<21:41, 16.69s/it]Epoch-8, Step-3297, Loss: 0.11389205604791641
 79%|█████████████████████████████████████████████████████████████▉                | 298/375 [1:22:36<21:22, 16.66s/it]Epoch-8, Step-3298, Loss: 0.08239719271659851
 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:22:53<21:04, 16.63s/it]Epoch-8, Step-3299, Loss: 0.055710893124341965
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:23:09<20:46, 16.62s/it]Epoch-8, Step-3300, Loss: 0.03638361021876335
 80%|████

 92%|███████████████████████████████████████████████████████████████████████▌      | 344/375 [1:35:21<08:34, 16.61s/it]Epoch-8, Step-3344, Loss: 0.03104810044169426
 92%|███████████████████████████████████████████████████████████████████████▊      | 345/375 [1:35:38<08:19, 16.66s/it]Epoch-8, Step-3345, Loss: 0.0493706576526165
 92%|███████████████████████████████████████████████████████████████████████▉      | 346/375 [1:35:54<08:01, 16.61s/it]Epoch-8, Step-3346, Loss: 0.05018147826194763
 93%|████████████████████████████████████████████████████████████████████████▏     | 347/375 [1:36:11<07:45, 16.62s/it]Epoch-8, Step-3347, Loss: 0.13984757661819458
 93%|████████████████████████████████████████████████████████████████████████▍     | 348/375 [1:36:27<07:27, 16.58s/it]Epoch-8, Step-3348, Loss: 0.09022418409585953
 93%|████████████████████████████████████████████████████████████████████████▌     | 349/375 [1:36:44<07:10, 16.56s/it]Epoch-8, Step-3349, Loss: 0.0444280281662941
 93%|███████

Epoch 8, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8353333333333334

precision: 0.54921875

recall: 0.6310592459605027

f1: 0.5873015873015872

[[4309  577]
 [ 411  703]]
              precision    recall  f1-score   support

           0       0.91      0.88      0.90      4886
           1       0.55      0.63      0.59      1114

    accuracy                           0.84      6000
   macro avg       0.73      0.76      0.74      6000
weighted avg       0.85      0.84      0.84      6000



Epoch-9, Step-3375, Loss: 0.05489785224199295
  0%|▏                                                                               | 1/375 [00:16<1:42:15, 16.41s/it]Epoch-9, Step-3376, Loss: 0.02580450102686882
  1%|▍                                                                               | 2/375 [00:33<1:42:51, 16.54s/it]Epoch-9, Step-3377, Loss: 0.050942398607730865
  1%|▋                                                                               | 3/375 [00:49<1:42:30, 16.53s/it]Epoch-9, Step-3378, Loss: 0.06497503072023392
  1%|▊                                                                               | 4/375 [01:06<1:42:51, 16.63s/it]Epoch-9, Step-3379, Loss: 0.007624642923474312
  1%|█                                                                               | 5/375 [01:23<1:42:51, 16.68s/it]Epoch-9, Step-3380, Loss: 0.04554226994514465
  2%|█▎                                                                              | 6/375 [01:39<1:42:34, 16.68s/it]Epoch-9,

 13%|██████████▌                                                                    | 50/375 [13:50<1:29:56, 16.60s/it]Epoch-9, Step-3425, Loss: 0.045416973531246185
 14%|██████████▋                                                                    | 51/375 [14:07<1:31:16, 16.90s/it]Epoch-9, Step-3426, Loss: 0.03763234615325928
 14%|██████████▉                                                                    | 52/375 [14:24<1:30:13, 16.76s/it]Epoch-9, Step-3427, Loss: 0.02324201911687851
 14%|███████████▏                                                                   | 53/375 [14:41<1:29:52, 16.75s/it]Epoch-9, Step-3428, Loss: 0.023965639993548393
 14%|███████████▍                                                                   | 54/375 [14:57<1:29:11, 16.67s/it]Epoch-9, Step-3429, Loss: 0.035026680678129196
 15%|███████████▌                                                                   | 55/375 [15:14<1:28:57, 16.68s/it]Epoch-9, Step-3430, Loss: 0.06926967203617096
 15%|██

 26%|████████████████████▊                                                          | 99/375 [27:37<1:19:39, 17.32s/it]Epoch-9, Step-3474, Loss: 0.0040549119003117085
 27%|████████████████████▊                                                         | 100/375 [27:54<1:19:05, 17.26s/it]Epoch-9, Step-3475, Loss: 0.04151465743780136
 27%|█████████████████████                                                         | 101/375 [28:12<1:18:45, 17.25s/it]Epoch-9, Step-3476, Loss: 0.027115633711218834
 27%|█████████████████████▏                                                        | 102/375 [28:29<1:18:26, 17.24s/it]Epoch-9, Step-3477, Loss: 0.053406331688165665
 27%|█████████████████████▍                                                        | 103/375 [28:46<1:18:23, 17.29s/it]Epoch-9, Step-3478, Loss: 0.06295154988765717
 28%|█████████████████████▋                                                        | 104/375 [29:03<1:17:55, 17.25s/it]Epoch-9, Step-3479, Loss: 0.028936654329299927
 28%|

 39%|██████████████████████████████▊                                               | 148/375 [41:44<1:05:00, 17.18s/it]Epoch-9, Step-3523, Loss: 0.03776035085320473
 40%|██████████████████████████████▉                                               | 149/375 [42:01<1:04:35, 17.15s/it]Epoch-9, Step-3524, Loss: 0.025662031024694443
 40%|███████████████████████████████▏                                              | 150/375 [42:18<1:04:16, 17.14s/it]Epoch-9, Step-3525, Loss: 0.048815883696079254
 40%|███████████████████████████████▍                                              | 151/375 [42:36<1:04:13, 17.20s/it]Epoch-9, Step-3526, Loss: 0.02502005361020565
 41%|███████████████████████████████▌                                              | 152/375 [42:53<1:03:46, 17.16s/it]Epoch-9, Step-3527, Loss: 0.02196885645389557
 41%|███████████████████████████████▊                                              | 153/375 [43:10<1:03:20, 17.12s/it]Epoch-9, Step-3528, Loss: 0.07114704698324203
 41%|███

 53%|██████████████████████████████████████████                                      | 197/375 [55:47<51:13, 17.27s/it]Epoch-9, Step-3572, Loss: 0.10808222740888596
 53%|██████████████████████████████████████████▏                                     | 198/375 [56:04<50:40, 17.18s/it]Epoch-9, Step-3573, Loss: 0.07167989760637283
 53%|██████████████████████████████████████████▍                                     | 199/375 [56:21<50:26, 17.19s/it]Epoch-9, Step-3574, Loss: 0.030664440244436264
 53%|██████████████████████████████████████████▋                                     | 200/375 [56:38<50:01, 17.15s/it]Epoch-9, Step-3575, Loss: 0.05319276079535484
 54%|██████████████████████████████████████████▉                                     | 201/375 [56:55<49:50, 17.18s/it]Epoch-9, Step-3576, Loss: 0.014241483993828297
 54%|███████████████████████████████████████████                                     | 202/375 [57:12<49:23, 17.13s/it]Epoch-9, Step-3577, Loss: 0.024231676012277603
 54%|██

 66%|███████████████████████████████████████████████████▏                          | 246/375 [1:09:53<36:24, 16.94s/it]Epoch-9, Step-3621, Loss: 0.05800121650099754
 66%|███████████████████████████████████████████████████▍                          | 247/375 [1:10:10<36:09, 16.95s/it]Epoch-9, Step-3622, Loss: 0.015407603234052658
 66%|███████████████████████████████████████████████████▌                          | 248/375 [1:10:27<35:42, 16.87s/it]Epoch-9, Step-3623, Loss: 0.03843482583761215
 66%|███████████████████████████████████████████████████▊                          | 249/375 [1:10:43<35:14, 16.78s/it]Epoch-9, Step-3624, Loss: 0.10408072173595428
 67%|████████████████████████████████████████████████████                          | 250/375 [1:11:00<34:52, 16.74s/it]Epoch-9, Step-3625, Loss: 0.05347514525055885
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:11:17<34:33, 16.72s/it]Epoch-9, Step-3626, Loss: 0.011083444580435753
 67%|███

 79%|█████████████████████████████████████████████████████████████▎                | 295/375 [1:23:28<22:01, 16.52s/it]Epoch-9, Step-3670, Loss: 0.013684331439435482
 79%|█████████████████████████████████████████████████████████████▌                | 296/375 [1:23:45<21:44, 16.52s/it]Epoch-9, Step-3671, Loss: 0.04507404565811157
 79%|█████████████████████████████████████████████████████████████▊                | 297/375 [1:24:01<21:27, 16.51s/it]Epoch-9, Step-3672, Loss: 0.010865111835300922
 79%|█████████████████████████████████████████████████████████████▉                | 298/375 [1:24:18<21:17, 16.59s/it]Epoch-9, Step-3673, Loss: 0.024836475029587746
 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:24:35<21:04, 16.63s/it]Epoch-9, Step-3674, Loss: 0.04501911997795105
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:24:51<20:49, 16.66s/it]Epoch-9, Step-3675, Loss: 0.035701069980859756
 80%|█

 92%|███████████████████████████████████████████████████████████████████████▌      | 344/375 [1:37:01<08:30, 16.46s/it]Epoch-9, Step-3719, Loss: 0.1123739704489708
 92%|███████████████████████████████████████████████████████████████████████▊      | 345/375 [1:37:18<08:13, 16.46s/it]Epoch-9, Step-3720, Loss: 0.19230318069458008
 92%|███████████████████████████████████████████████████████████████████████▉      | 346/375 [1:37:34<07:59, 16.53s/it]Epoch-9, Step-3721, Loss: 0.05843367800116539
 93%|████████████████████████████████████████████████████████████████████████▏     | 347/375 [1:37:51<07:41, 16.48s/it]Epoch-9, Step-3722, Loss: 0.04200585559010506
 93%|████████████████████████████████████████████████████████████████████████▍     | 348/375 [1:38:07<07:25, 16.51s/it]Epoch-9, Step-3723, Loss: 0.030605124309659004
 93%|████████████████████████████████████████████████████████████████████████▌     | 349/375 [1:38:24<07:07, 16.45s/it]Epoch-9, Step-3724, Loss: 0.029169650748372078
 93%|████

Epoch 9, start evaluating.
accuracy: 0.8508333333333333

precision: 0.6026241799437676

recall: 0.5771992818671454

f1: 0.5896377808344796

[[4462  424]
 [ 471  643]]
              precision    recall  f1-score   support

           0       0.90      0.91      0.91      4886
           1       0.60      0.58      0.59      1114

    accuracy                           0.85      6000
   macro avg       0.75      0.75      0.75      6000
weighted avg       0.85      0.85      0.85      6000



In [120]:
def predict(model, tokenizer, text):
    encoding = tokenizer(text,
                         return_tensors="pt",
                         max_length=128,
                         truncation=True,
                         padding=True)
    encoding = {k:v.to(device) for  k,v in encoding.items()}
    outputs = model(**encoding)
    #pred = id2label[torch.argmax(outputs[0], dim=-1).numpy()[0]]
    pred = id2label[torch.argmax(outputs[0], dim=-1).cpu().detach().numpy()[0]]
    return pred

In [121]:
tokenizer = BertTokenizer.from_pretrained("model_best")
model = BertForSequenceClassification.from_pretrained(
    "model_best", num_labels=len(label2id))
model.to(device) 

BertForSequenceClassification(
  (bert): BertModel(
    (embeddings): BertEmbeddings(
      (word_embeddings): Embedding(42000, 768, padding_idx=0)
      (position_embeddings): Embedding(512, 768)
      (token_type_embeddings): Embedding(2, 768)
      (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (encoder): BertEncoder(
      (layer): ModuleList(
        (0): BertLayer(
          (attention): BertAttention(
            (self): BertSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1, inplace=False)
            )
            (output): BertSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
              (LayerNorm): LayerNorm((768,), eps=1e-12, element

In [125]:
import numpy as np
import pickle
result_dict = []
for root, dirs, files in os.walk('test', topdown=True):
    for name in files:
        print(f'process file: {name}')
        with open(os.path.join(root, name), 'r',encoding='utf8') as f:
            lines = f.readlines()
    for idx, line in enumerate(lines):
        line = line.strip()
        if not line:
            continue
        text = line
        pred = predict(model,tokenizer,line)
        result_dict.append(pred)
np.save('preds.npy',result_dict)

process file: 20210623.csv


In [129]:
result_dict = np.load('preds.npy', allow_pickle=True)