In [7]:
!pip install transformers -i https://pypi.tuna.tsinghua.edu.cn/simple
!pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple
!pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
!pip install scikit_learn -i https://pypi.tuna.tsinghua.edu.cn/simple

Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple


In [8]:
from transformers import BertTokenizer, BertForSequenceClassification
from torch.utils.data import DataLoader
from transformers import AdamW
import pandas as pd
import os
import torch
import torch.nn as nn
from torch.nn import CrossEntropyLoss
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, roc_auc_score, classification_report
from sklearn.model_selection import train_test_split
from sklearn import preprocessing
from tqdm import tqdm
import json
from collections import OrderedDict
from datetime import datetime
import logging
logging.basicConfig(level=logging.INFO, format='%(message)s')

In [9]:
# huggingface 分词器，wordpiece
tokenizer = BertTokenizer.from_pretrained("kykim/bert-kor-base")

In [10]:
### 读入数据
def read_data(file):
    texts = []
    labels = []
    data = pd.read_excel(file, engine='openpyxl')
    for row in data.itertuples():
        label = getattr(row, 'label')
        review = str(getattr(row, 'review'))[1:-1]
        texts.append(review)
        labels.append(label)
    assert len(texts) == len(labels)
    return texts, labels

In [11]:
texts, labels = read_data('Ko.xlsx')

In [12]:
len(texts)

30000

In [13]:
###  训练集和验证集
train_texts, val_texts, train_labels, val_labels = train_test_split(
    texts, labels, test_size=0.2, random_state=43, stratify=labels)

In [14]:
len(train_labels),len(val_labels),len(train_texts),len(val_texts)

(24000, 6000, 24000, 6000)

In [15]:
train_texts[:10]

['제 엘리트 체육은 지양할때다 저개 뭐냐??개판이',
 '번건 잘했다고 본',
 '관중 경기 아니였나요?',
 'c에서 박석민외3명에게 구상권 신청할듯네명은 거지될',
 '여자 쌍둥이 자매를 며느리삼고싶다했다는데... 에휴 그만합시다 이러다 김연경선수 갈굴까 걱정됩니',
 '포츠와 정치를 연관짓는다고 한국정치인 비판하는 일본놈들.... 양심있으면 반성하',
 '자호구 없애라. 경기 더럽게 재미없다. 몸통 펑!!하고 소리나도 점수 안오르고 진짜 뭐냐? 예전처럼 심판 몇명이서 스위치 눌러',
 '본 올림픽 부정적으로 보다만 하다가 중계는 뭔 중계냐? 대한민국의 언론수준과 이에 놀아나는 생각없는 국민들...참으로 가볍고 가볍워...ㅜ ',
 '능하면 정권을 탐하지 말아야지----- 4년 내내 상대를 까다가 ---- 올림픽 놀러가려고 대접해달면----- 니라면 하겠냐-----죽창이 뭐냐---- 조선시대냐? 공산당이냐????--- 북한넘들 지주들 죽창으로 찔러죽였던--',
 '도 방문하고 꼭 방일하기를..']

In [16]:
train_labels[:10]

[0, 1, 0, 0, 1, 0, 0, 0, 0, 1]

In [17]:
###  求最大长度，为后面分词做准备
max_len = max([len(item) for item in train_texts])
print(max_len)

max_len = max([len(item) for item in val_texts])
print(max_len)

298
298


In [18]:
### label和id进行映射
label2id = OrderedDict({item: idx for idx, item in enumerate(set(train_labels + val_labels))})
id2label = OrderedDict({v: k for k, v in label2id.items()})

In [19]:
#  训练集和验证集 分词
train_encodings = tokenizer(train_texts,
                            truncation=True,
                            padding=True,
                            max_length=128)
val_encodings = tokenizer(val_texts,
                          truncation=True,
                          padding=True,
                          max_length=128)

In [20]:
# PyTorch Dataset  创建Dataset
class CuDataset(torch.utils.data.Dataset):
    def __init__(self, encodings, labels):
        self.encodings = encodings
        self.labels = labels

    def __getitem__(self, idx):
        idx = int(idx)
        item = {
            key: torch.tensor(val[idx])
            for key, val in self.encodings.items()
        }
        item['labels'] = torch.tensor(label2id[self.labels[idx]])
        return item

    def __len__(self):
        return len(self.labels)

In [21]:
train_dataset = CuDataset(train_encodings, train_labels)
val_dataset = CuDataset(val_encodings, val_labels)

In [22]:
#  创建Dataloader
batch_size = 64
train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
eval_loader = DataLoader(val_dataset, batch_size=batch_size, shuffle=False)

### 加载模型

In [23]:
device = torch.device('cuda:0') if torch.cuda.is_available() else torch.device(
    'cpu')  # 使用cpu或者gpu
model = BertForSequenceClassification.from_pretrained(
    "kykim/bert-kor-base", num_labels=len(label2id))  #来加载模型，那么线性层 + 激活函数的权重就会随机初始化。我们的目的，就是通过微调，学习到线性层 + 激活函数的权重。
model.to(device)
model.train()

Some weights of the model checkpoint at kykim/bert-kor-base were not used when initializing BertForSequenceClassification: ['cls.predictions.decoder.weight', 'cls.predictions.transform.dense.weight', 'cls.predictions.bias', 'cls.predictions.transform.LayerNorm.bias', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.seq_relationship.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of BertForSequenceClassification were not initia

BertForSequenceClassification(
  (bert): BertModel(
    (embeddings): BertEmbeddings(
      (word_embeddings): Embedding(42000, 768, padding_idx=0)
      (position_embeddings): Embedding(512, 768)
      (token_type_embeddings): Embedding(2, 768)
      (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (encoder): BertEncoder(
      (layer): ModuleList(
        (0): BertLayer(
          (attention): BertAttention(
            (self): BertSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1, inplace=False)
            )
            (output): BertSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
              (LayerNorm): LayerNorm((768,), eps=1e-12, element

In [24]:
### 计算Accuracy，Precision，Recall，F1 score，confusion_matrix，classification_report
def compute_metrics(labels, preds):
    accuracy = accuracy_score(labels, preds)
    precision = precision_score(labels, preds)
    recall = recall_score(labels, preds)
    f1 = f1_score(labels, preds)
    print(f'accuracy: {accuracy}\n')
    print(f'precision: {precision}\n')
    print(f'recall: {recall}\n')
    print(f'f1: {f1}\n')
    print(confusion_matrix(labels, preds))
    print(classification_report(labels, preds))
    return f1

### 13.评估模型

In [25]:
@torch.no_grad()
def eval_model(model, eval_loader):
    model.eval()
    labels = []
    preds = []
    for idx, batch in enumerate(eval_loader):
        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        labels.extend(batch['labels'].numpy())
        outputs = model(input_ids,attention_mask=attention_mask)  # 输出所有概率
        preds.extend(torch.argmax(outputs[0], dim=-1).cpu().numpy())  # 拿到标签
    f1 = compute_metrics(labels, preds)
    model.train()
    return f1

### 14.训练模型

In [26]:
optim = AdamW(model.parameters(), lr=1e-5)  # 声明优化器
step = 0
best_f1 = 0
epoch = 10
for epoch in range(epoch):
    for idx, batch in tqdm(enumerate(train_loader),
                           total=len(train_texts) // batch_size):
        optim.zero_grad()
        input_ids = batch['input_ids'].to(device)
        labels = batch['labels'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        outputs = model(input_ids=input_ids, labels=labels, attention_mask=attention_mask)
        loss = outputs[0]  # 计算Loss
        logging.info(
            f'Epoch-{epoch}, Step-{step}, Loss: {loss.cpu().detach().numpy()}')
        step += 1
        loss.backward()
        optim.step()

    print(f'Epoch {epoch}, start evaluating.')
    f1 = eval_model(model, eval_loader)  # 评估模型
    if f1 > best_f1:
        print(f'best_f1: {f1}')
        model.save_pretrained('model_best')  # 保存模型
        tokenizer.save_pretrained('model_best')
        best_f1 = f1

  0%|                                                                                          | 0/375 [00:00<?, ?it/s]Epoch-0, Step-0, Loss: 0.7664825916290283
  0%|▏                                                                               | 1/375 [00:15<1:36:41, 15.51s/it]Epoch-0, Step-1, Loss: 0.6433071494102478
  1%|▍                                                                               | 2/375 [00:30<1:36:13, 15.48s/it]Epoch-0, Step-2, Loss: 0.5641935467720032
  1%|▋                                                                               | 3/375 [00:47<1:40:02, 16.14s/it]Epoch-0, Step-3, Loss: 0.4880148768424988
  1%|▊                                                                               | 4/375 [01:04<1:40:51, 16.31s/it]Epoch-0, Step-4, Loss: 0.5526675581932068
  1%|█                                                                               | 5/375 [01:19<1:37:21, 15.79s/it]Epoch-0, Step-5, Loss: 0.523169219493866
  2%|█▎                            

 27%|████████████████████▊                                                         | 100/375 [26:05<1:13:41, 16.08s/it]Epoch-0, Step-100, Loss: 0.19240108132362366
 27%|█████████████████████                                                         | 101/375 [26:22<1:14:32, 16.32s/it]Epoch-0, Step-101, Loss: 0.471841961145401
 27%|█████████████████████▏                                                        | 102/375 [26:39<1:15:10, 16.52s/it]Epoch-0, Step-102, Loss: 0.3268498182296753
 27%|█████████████████████▍                                                        | 103/375 [26:56<1:15:52, 16.74s/it]Epoch-0, Step-103, Loss: 0.29000556468963623
 28%|█████████████████████▋                                                        | 104/375 [27:12<1:14:54, 16.58s/it]Epoch-0, Step-104, Loss: 0.38894355297088623
 28%|█████████████████████▊                                                        | 105/375 [27:28<1:13:44, 16.39s/it]Epoch-0, Step-105, Loss: 0.32192203402519226
 28%|██████████████

 53%|██████████████████████████████████████████▋                                     | 200/375 [52:13<45:32, 15.61s/it]Epoch-0, Step-200, Loss: 0.42411768436431885
 54%|██████████████████████████████████████████▉                                     | 201/375 [52:28<45:06, 15.55s/it]Epoch-0, Step-201, Loss: 0.37737664580345154
 54%|███████████████████████████████████████████                                     | 202/375 [52:44<45:06, 15.65s/it]Epoch-0, Step-202, Loss: 0.3970523774623871
 54%|███████████████████████████████████████████▎                                    | 203/375 [52:59<44:36, 15.56s/it]Epoch-0, Step-203, Loss: 0.3852390646934509
 54%|███████████████████████████████████████████▌                                    | 204/375 [53:15<44:40, 15.68s/it]Epoch-0, Step-204, Loss: 0.4536534249782562
 55%|███████████████████████████████████████████▋                                    | 205/375 [53:30<44:05, 15.56s/it]Epoch-0, Step-205, Loss: 0.3214353322982788
 55%|███████████████

 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:17:57<19:45, 15.81s/it]Epoch-0, Step-300, Loss: 0.2582835555076599
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:18:14<19:48, 16.06s/it]Epoch-0, Step-301, Loss: 0.4187733829021454
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:18:30<19:24, 15.95s/it]Epoch-0, Step-302, Loss: 0.2880464196205139
 81%|███████████████████████████████████████████████████████████████               | 303/375 [1:18:45<18:59, 15.83s/it]Epoch-0, Step-303, Loss: 0.292404443025589
 81%|███████████████████████████████████████████████████████████████▏              | 304/375 [1:19:01<18:36, 15.72s/it]Epoch-0, Step-304, Loss: 0.3869961202144623
 81%|███████████████████████████████████████████████████████████████▍              | 305/375 [1:19:16<18:20, 15.72s/it]Epoch-0, Step-305, Loss: 0.2750316858291626
 82%|██████████████████

Epoch 0, start evaluating.
accuracy: 0.872

precision: 0.6913716814159292

recall: 0.5610412926391383

f1: 0.6194251734390487

[[4607  279]
 [ 489  625]]
              precision    recall  f1-score   support

           0       0.90      0.94      0.92      4886
           1       0.69      0.56      0.62      1114

    accuracy                           0.87      6000
   macro avg       0.80      0.75      0.77      6000
weighted avg       0.86      0.87      0.87      6000

best_f1: 0.6194251734390487


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]Epoch-1, Step-375, Loss: 0.30983883142471313
  0%|▏                                                                               | 1/375 [00:15<1:35:37, 15.34s/it]Epoch-1, Step-376, Loss: 0.2059914469718933
  1%|▍                                                                               | 2/375 [00:30<1:34:24, 15.19s/it]Epoch-1, Step-377, Loss: 0.4298471212387085
  1%|▋                                                                               | 3/375 [00:45<1:33:19, 15.05s/it]Epoch-1, Step-378, Loss: 0.24711117148399353
  1%|▊                                                                               | 4/375 [01:00<1:33:05, 15.05s/it]Epoch-1, Step-379, Loss: 0.31527942419052124
  1%|█                                                                               | 5/375 [01:15<1:32:38, 15.02s/it]Epoch-1, Step-380, Loss: 0.1946757286787033
  2%|█▎            

 27%|████████████████████▊                                                         | 100/375 [25:52<1:10:21, 15.35s/it]Epoch-1, Step-475, Loss: 0.2869800925254822
 27%|█████████████████████                                                         | 101/375 [26:09<1:12:48, 15.94s/it]Epoch-1, Step-476, Loss: 0.29371121525764465
 27%|█████████████████████▏                                                        | 102/375 [26:25<1:12:42, 15.98s/it]Epoch-1, Step-477, Loss: 0.23595084249973297
 27%|█████████████████████▍                                                        | 103/375 [26:41<1:11:46, 15.83s/it]Epoch-1, Step-478, Loss: 0.3268575370311737
 28%|█████████████████████▋                                                        | 104/375 [26:56<1:10:53, 15.69s/it]Epoch-1, Step-479, Loss: 0.513431191444397
 28%|█████████████████████▊                                                        | 105/375 [27:12<1:11:08, 15.81s/it]Epoch-1, Step-480, Loss: 0.3968895375728607
 28%|████████████████

 53%|██████████████████████████████████████████▋                                     | 200/375 [51:33<45:34, 15.62s/it]Epoch-1, Step-575, Loss: 0.2468351423740387
 54%|██████████████████████████████████████████▉                                     | 201/375 [51:48<44:57, 15.50s/it]Epoch-1, Step-576, Loss: 0.31044965982437134
 54%|███████████████████████████████████████████                                     | 202/375 [52:03<44:22, 15.39s/it]Epoch-1, Step-577, Loss: 0.27816298604011536
 54%|███████████████████████████████████████████▎                                    | 203/375 [52:19<44:05, 15.38s/it]Epoch-1, Step-578, Loss: 0.30972597002983093
 54%|███████████████████████████████████████████▌                                    | 204/375 [52:34<43:32, 15.28s/it]Epoch-1, Step-579, Loss: 0.5086596608161926
 55%|███████████████████████████████████████████▋                                    | 205/375 [52:49<43:14, 15.26s/it]Epoch-1, Step-580, Loss: 0.2996186912059784
 55%|██████████████

 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:17:59<19:32, 15.64s/it]Epoch-1, Step-675, Loss: 0.43634387850761414
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:18:14<19:03, 15.45s/it]Epoch-1, Step-676, Loss: 0.33697929978370667
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:18:29<18:36, 15.30s/it]Epoch-1, Step-677, Loss: 0.3814517557621002
 81%|███████████████████████████████████████████████████████████████               | 303/375 [1:18:44<18:10, 15.15s/it]Epoch-1, Step-678, Loss: 0.23631437122821808
 81%|███████████████████████████████████████████████████████████████▏              | 304/375 [1:18:58<17:49, 15.07s/it]Epoch-1, Step-679, Loss: 0.22879068553447723
 81%|███████████████████████████████████████████████████████████████▍              | 305/375 [1:19:13<17:28, 14.98s/it]Epoch-1, Step-680, Loss: 0.3530162274837494
 82%|█████████████

Epoch 1, start evaluating.
accuracy: 0.8735

precision: 0.6927252985884907

recall: 0.5727109515260324

f1: 0.6270270270270271

[[4603  283]
 [ 476  638]]
              precision    recall  f1-score   support

           0       0.91      0.94      0.92      4886
           1       0.69      0.57      0.63      1114

    accuracy                           0.87      6000
   macro avg       0.80      0.76      0.78      6000
weighted avg       0.87      0.87      0.87      6000

best_f1: 0.6270270270270271


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]Epoch-2, Step-750, Loss: 0.21232572197914124
  0%|▏                                                                               | 1/375 [00:16<1:39:48, 16.01s/it]Epoch-2, Step-751, Loss: 0.24619221687316895
  1%|▍                                                                               | 2/375 [00:32<1:40:43, 16.20s/it]Epoch-2, Step-752, Loss: 0.2789188027381897
  1%|▋                                                                               | 3/375 [00:49<1:42:01, 16.45s/it]Epoch-2, Step-753, Loss: 0.3046736717224121
  1%|▊                                                                               | 4/375 [01:04<1:39:34, 16.10s/it]Epoch-2, Step-754, Loss: 0.3297226130962372
  1%|█                                                                               | 5/375 [01:19<1:37:11, 15.76s/it]Epoch-2, Step-755, Loss: 0.22121752798557281
  2%|█▎            

 27%|████████████████████▊                                                         | 100/375 [25:35<1:10:17, 15.34s/it]Epoch-2, Step-850, Loss: 0.5026464462280273
 27%|█████████████████████                                                         | 101/375 [25:52<1:11:29, 15.65s/it]Epoch-2, Step-851, Loss: 0.32288673520088196
 27%|█████████████████████▏                                                        | 102/375 [26:07<1:10:43, 15.55s/it]Epoch-2, Step-852, Loss: 0.19807882606983185
 27%|█████████████████████▍                                                        | 103/375 [26:22<1:09:44, 15.38s/it]Epoch-2, Step-853, Loss: 0.4708805978298187
 28%|█████████████████████▋                                                        | 104/375 [26:37<1:08:48, 15.24s/it]Epoch-2, Step-854, Loss: 0.27805429697036743
 28%|█████████████████████▊                                                        | 105/375 [26:52<1:08:19, 15.18s/it]Epoch-2, Step-855, Loss: 0.38753312826156616
 28%|█████████████

 53%|██████████████████████████████████████████▋                                     | 200/375 [50:54<44:45, 15.35s/it]Epoch-2, Step-950, Loss: 0.3124198317527771
 54%|██████████████████████████████████████████▉                                     | 201/375 [51:09<44:16, 15.27s/it]Epoch-2, Step-951, Loss: 0.24115285277366638
 54%|███████████████████████████████████████████                                     | 202/375 [51:25<44:30, 15.44s/it]Epoch-2, Step-952, Loss: 0.28973788022994995
 54%|███████████████████████████████████████████▎                                    | 203/375 [51:40<44:01, 15.36s/it]Epoch-2, Step-953, Loss: 0.29728370904922485
 54%|███████████████████████████████████████████▌                                    | 204/375 [51:56<44:01, 15.44s/it]Epoch-2, Step-954, Loss: 0.23497015237808228
 55%|███████████████████████████████████████████▋                                    | 205/375 [52:11<43:30, 15.36s/it]Epoch-2, Step-955, Loss: 0.2566925585269928
 55%|█████████████

 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:15:59<18:42, 14.96s/it]Epoch-2, Step-1050, Loss: 0.2877950668334961
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:16:15<18:33, 15.05s/it]Epoch-2, Step-1051, Loss: 0.3616164028644562
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:16:29<18:09, 14.92s/it]Epoch-2, Step-1052, Loss: 0.27320975065231323
 81%|███████████████████████████████████████████████████████████████               | 303/375 [1:16:45<18:01, 15.03s/it]Epoch-2, Step-1053, Loss: 0.26733219623565674
 81%|███████████████████████████████████████████████████████████████▏              | 304/375 [1:16:59<17:39, 14.92s/it]Epoch-2, Step-1054, Loss: 0.2160578817129135
 81%|███████████████████████████████████████████████████████████████▍              | 305/375 [1:17:15<17:32, 15.04s/it]Epoch-2, Step-1055, Loss: 0.19079962372779846
 82%|████████

 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:28:31<06:24, 15.37s/it]Epoch-2, Step-1100, Loss: 0.13605324923992157
 94%|█████████████████████████████████████████████████████████████████████████     | 351/375 [1:28:45<06:04, 15.18s/it]Epoch-2, Step-1101, Loss: 0.21760673820972443
 94%|█████████████████████████████████████████████████████████████████████████▏    | 352/375 [1:29:00<05:45, 15.02s/it]Epoch-2, Step-1102, Loss: 0.2600259482860565
 94%|█████████████████████████████████████████████████████████████████████████▍    | 353/375 [1:29:15<05:29, 14.96s/it]Epoch-2, Step-1103, Loss: 0.3124440312385559
 94%|█████████████████████████████████████████████████████████████████████████▋    | 354/375 [1:29:30<05:13, 14.93s/it]Epoch-2, Step-1104, Loss: 0.22456522285938263
 95%|█████████████████████████████████████████████████████████████████████████▊    | 355/375 [1:29:45<04:58, 14.94s/it]Epoch-2, Step-1105, Loss: 0.20429418981075287
 95%|███████

Epoch 2, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8698333333333333

precision: 0.689419795221843

recall: 0.5439856373429084

f1: 0.6081284495735072

[[4613  273]
 [ 508  606]]
              precision    recall  f1-score   support

           0       0.90      0.94      0.92      4886
           1       0.69      0.54      0.61      1114

    accuracy                           0.87      6000
   macro avg       0.80      0.74      0.77      6000
weighted avg       0.86      0.87      0.86      6000



Epoch-3, Step-1125, Loss: 0.27757173776626587
  0%|▏                                                                               | 1/375 [00:14<1:31:52, 14.74s/it]Epoch-3, Step-1126, Loss: 0.16336624324321747
  1%|▍                                                                               | 2/375 [00:30<1:34:33, 15.21s/it]Epoch-3, Step-1127, Loss: 0.2758599519729614
  1%|▋                                                                               | 3/375 [00:45<1:35:22, 15.38s/it]Epoch-3, Step-1128, Loss: 0.2077176421880722
  1%|▊                                                                               | 4/375 [01:02<1:36:56, 15.68s/it]Epoch-3, Step-1129, Loss: 0.10017134249210358
  1%|█                                                                               | 5/375 [01:16<1:34:48, 15.37s/it]Epoch-3, Step-1130, Loss: 0.122856006026268
  2%|█▎                                                                              | 6/375 [01:31<1:33:11, 15.15s/it]Epoch-3, Step-

 27%|████████████████████▊                                                         | 100/375 [26:18<1:27:26, 19.08s/it]Epoch-3, Step-1225, Loss: 0.24944797158241272
 27%|█████████████████████                                                         | 101/375 [26:38<1:28:52, 19.46s/it]Epoch-3, Step-1226, Loss: 0.2632467448711395
 27%|█████████████████████▏                                                        | 102/375 [26:58<1:28:59, 19.56s/it]Epoch-3, Step-1227, Loss: 0.27129867672920227
 27%|█████████████████████▍                                                        | 103/375 [27:17<1:28:02, 19.42s/it]Epoch-3, Step-1228, Loss: 0.29243049025535583
 28%|█████████████████████▋                                                        | 104/375 [27:36<1:27:31, 19.38s/it]Epoch-3, Step-1229, Loss: 0.263852059841156
 28%|█████████████████████▊                                                        | 105/375 [27:55<1:26:35, 19.24s/it]Epoch-3, Step-1230, Loss: 0.30689486861228943
 28%|████████

 40%|███████████████████████████████▏                                              | 150/375 [42:33<1:13:18, 19.55s/it]Epoch-3, Step-1275, Loss: 0.24224363267421722
 40%|███████████████████████████████▍                                              | 151/375 [42:52<1:12:34, 19.44s/it]Epoch-3, Step-1276, Loss: 0.26018673181533813
 41%|███████████████████████████████▌                                              | 152/375 [43:11<1:12:09, 19.41s/it]Epoch-3, Step-1277, Loss: 0.3907966911792755
 41%|███████████████████████████████▊                                              | 153/375 [43:31<1:11:34, 19.35s/it]Epoch-3, Step-1278, Loss: 0.1959562748670578
 41%|████████████████████████████████                                              | 154/375 [43:50<1:11:14, 19.34s/it]Epoch-3, Step-1279, Loss: 0.24885106086730957
 41%|████████████████████████████████▏                                             | 155/375 [44:09<1:10:47, 19.31s/it]Epoch-3, Step-1280, Loss: 0.10023749619722366
 42%|███████

 53%|██████████████████████████████████████████▋                                     | 200/375 [58:47<57:11, 19.61s/it]Epoch-3, Step-1325, Loss: 0.12259109318256378
 54%|██████████████████████████████████████████▉                                     | 201/375 [59:06<56:46, 19.58s/it]Epoch-3, Step-1326, Loss: 0.35044580698013306
 54%|███████████████████████████████████████████                                     | 202/375 [59:26<56:36, 19.63s/it]Epoch-3, Step-1327, Loss: 0.22206102311611176
 54%|███████████████████████████████████████████▎                                    | 203/375 [59:46<56:15, 19.62s/it]Epoch-3, Step-1328, Loss: 0.2665828466415405
 54%|██████████████████████████████████████████▍                                   | 204/375 [1:00:05<56:02, 19.66s/it]Epoch-3, Step-1329, Loss: 0.19656123220920563
 55%|██████████████████████████████████████████▋                                   | 205/375 [1:00:25<55:47, 19.69s/it]Epoch-3, Step-1330, Loss: 0.11920060962438583
 55%|██████

 67%|████████████████████████████████████████████████████                          | 250/375 [1:15:01<40:40, 19.53s/it]Epoch-3, Step-1375, Loss: 0.1292111724615097
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:15:20<40:09, 19.43s/it]Epoch-3, Step-1376, Loss: 0.15111874043941498
 67%|████████████████████████████████████████████████████▍                         | 252/375 [1:15:40<39:49, 19.43s/it]Epoch-3, Step-1377, Loss: 0.1791684776544571
 67%|████████████████████████████████████████████████████▌                         | 253/375 [1:15:59<39:23, 19.37s/it]Epoch-3, Step-1378, Loss: 0.1617957055568695
 68%|████████████████████████████████████████████████████▊                         | 254/375 [1:16:18<39:03, 19.36s/it]Epoch-3, Step-1379, Loss: 0.20514772832393646
 68%|█████████████████████████████████████████████████████                         | 255/375 [1:16:37<38:38, 19.32s/it]Epoch-3, Step-1380, Loss: 0.12491002678871155
 68%|████████

 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:31:17<24:11, 19.36s/it]Epoch-3, Step-1425, Loss: 0.11543865501880646
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:31:36<23:47, 19.29s/it]Epoch-3, Step-1426, Loss: 0.2688848674297333
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:31:55<23:29, 19.30s/it]Epoch-3, Step-1427, Loss: 0.15714721381664276
 81%|███████████████████████████████████████████████████████████████               | 303/375 [1:32:15<23:18, 19.42s/it]Epoch-3, Step-1428, Loss: 0.23589427769184113
 81%|███████████████████████████████████████████████████████████████▏              | 304/375 [1:32:34<22:53, 19.34s/it]Epoch-3, Step-1429, Loss: 0.21520167589187622
 81%|███████████████████████████████████████████████████████████████▍              | 305/375 [1:32:53<22:34, 19.34s/it]Epoch-3, Step-1430, Loss: 0.12645825743675232
 82%|██████

 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:47:34<08:11, 19.66s/it]Epoch-3, Step-1475, Loss: 0.26308202743530273
 94%|█████████████████████████████████████████████████████████████████████████     | 351/375 [1:47:53<07:48, 19.54s/it]Epoch-3, Step-1476, Loss: 0.22600863873958588
 94%|█████████████████████████████████████████████████████████████████████████▏    | 352/375 [1:48:13<07:30, 19.60s/it]Epoch-3, Step-1477, Loss: 0.18954069912433624
 94%|█████████████████████████████████████████████████████████████████████████▍    | 353/375 [1:48:33<07:12, 19.68s/it]Epoch-3, Step-1478, Loss: 0.18766552209854126
 94%|█████████████████████████████████████████████████████████████████████████▋    | 354/375 [1:48:53<06:54, 19.72s/it]Epoch-3, Step-1479, Loss: 0.17750149965286255
 95%|█████████████████████████████████████████████████████████████████████████▊    | 355/375 [1:49:13<06:36, 19.83s/it]Epoch-3, Step-1480, Loss: 0.21765831112861633
 95%|█████

Epoch 3, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8515

precision: 0.5916187345932621

recall: 0.6463195691202872

f1: 0.6177606177606177

[[4389  497]
 [ 394  720]]
              precision    recall  f1-score   support

           0       0.92      0.90      0.91      4886
           1       0.59      0.65      0.62      1114

    accuracy                           0.85      6000
   macro avg       0.75      0.77      0.76      6000
weighted avg       0.86      0.85      0.85      6000



Epoch-4, Step-1500, Loss: 0.2422596514225006
  0%|▏                                                                               | 1/375 [00:19<2:01:21, 19.47s/it]Epoch-4, Step-1501, Loss: 0.1815994381904602
  1%|▍                                                                               | 2/375 [00:38<2:00:18, 19.35s/it]Epoch-4, Step-1502, Loss: 0.15989629924297333
  1%|▋                                                                               | 3/375 [00:58<2:00:52, 19.50s/it]Epoch-4, Step-1503, Loss: 0.09579496830701828
  1%|▊                                                                               | 4/375 [01:17<2:00:23, 19.47s/it]Epoch-4, Step-1504, Loss: 0.11674456298351288
  1%|█                                                                               | 5/375 [01:37<2:00:04, 19.47s/it]Epoch-4, Step-1505, Loss: 0.18832586705684662
  2%|█▎                                                                              | 6/375 [01:56<2:00:09, 19.54s/it]Epoch-4, Ste

 26%|████████████████████▊                                                          | 99/375 [32:13<1:29:15, 19.40s/it]Epoch-4, Step-1599, Loss: 0.1884259730577469
 27%|████████████████████▊                                                         | 100/375 [32:33<1:29:18, 19.49s/it]Epoch-4, Step-1600, Loss: 0.13081124424934387
 27%|█████████████████████                                                         | 101/375 [32:52<1:28:46, 19.44s/it]Epoch-4, Step-1601, Loss: 0.2266450971364975
 27%|█████████████████████▏                                                        | 102/375 [33:12<1:28:41, 19.49s/it]Epoch-4, Step-1602, Loss: 0.22561275959014893
 27%|█████████████████████▍                                                        | 103/375 [33:31<1:28:00, 19.42s/it]Epoch-4, Step-1603, Loss: 0.08917384594678879
 28%|█████████████████████▋                                                        | 104/375 [33:51<1:27:52, 19.46s/it]Epoch-4, Step-1604, Loss: 0.23909534513950348
 28%|███████

 40%|██████████████████████████████▉                                               | 149/375 [48:18<1:13:10, 19.43s/it]Epoch-4, Step-1649, Loss: 0.27295374870300293
 40%|███████████████████████████████▏                                              | 150/375 [48:38<1:12:58, 19.46s/it]Epoch-4, Step-1650, Loss: 0.22047755122184753
 40%|███████████████████████████████▍                                              | 151/375 [48:58<1:12:55, 19.53s/it]Epoch-4, Step-1651, Loss: 0.09174491465091705
 41%|███████████████████████████████▌                                              | 152/375 [49:17<1:12:17, 19.45s/it]Epoch-4, Step-1652, Loss: 0.10174686461687088
 41%|███████████████████████████████▊                                              | 153/375 [49:36<1:12:14, 19.53s/it]Epoch-4, Step-1653, Loss: 0.0989636778831482
 41%|████████████████████████████████                                              | 154/375 [49:56<1:11:44, 19.48s/it]Epoch-4, Step-1654, Loss: 0.06484253704547882
 41%|██████

 53%|█████████████████████████████████████████▍                                    | 199/375 [1:04:28<56:07, 19.13s/it]Epoch-4, Step-1699, Loss: 0.2445652335882187
 53%|█████████████████████████████████████████▌                                    | 200/375 [1:04:48<55:51, 19.15s/it]Epoch-4, Step-1700, Loss: 0.21048972010612488
 54%|█████████████████████████████████████████▊                                    | 201/375 [1:05:07<55:38, 19.18s/it]Epoch-4, Step-1701, Loss: 0.17984740436077118
 54%|██████████████████████████████████████████                                    | 202/375 [1:05:26<55:23, 19.21s/it]Epoch-4, Step-1702, Loss: 0.24202695488929749
 54%|██████████████████████████████████████████▏                                   | 203/375 [1:05:45<55:08, 19.23s/it]Epoch-4, Step-1703, Loss: 0.2298661768436432
 54%|██████████████████████████████████████████▍                                   | 204/375 [1:06:05<54:52, 19.26s/it]Epoch-4, Step-1704, Loss: 0.18108823895454407
 55%|███████

 66%|███████████████████████████████████████████████████▊                          | 249/375 [1:20:42<40:56, 19.49s/it]Epoch-4, Step-1749, Loss: 0.18115678429603577
 67%|████████████████████████████████████████████████████                          | 250/375 [1:21:01<40:32, 19.46s/it]Epoch-4, Step-1750, Loss: 0.07720688730478287
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:21:21<40:16, 19.49s/it]Epoch-4, Step-1751, Loss: 0.2281292825937271
 67%|████████████████████████████████████████████████████▍                         | 252/375 [1:21:40<39:53, 19.46s/it]Epoch-4, Step-1752, Loss: 0.16522198915481567
 67%|████████████████████████████████████████████████████▌                         | 253/375 [1:21:59<39:30, 19.43s/it]Epoch-4, Step-1753, Loss: 0.2554158866405487
 68%|████████████████████████████████████████████████████▊                         | 254/375 [1:22:19<39:23, 19.53s/it]Epoch-4, Step-1754, Loss: 0.14020171761512756
 68%|███████

 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:36:50<24:49, 19.59s/it]Epoch-4, Step-1799, Loss: 0.09621571004390717
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:37:09<24:29, 19.59s/it]Epoch-4, Step-1800, Loss: 0.31657809019088745
 80%|██████████████████████████████████████████████████████████████▌               | 301/375 [1:37:29<24:10, 19.61s/it]Epoch-4, Step-1801, Loss: 0.10337892174720764
 81%|██████████████████████████████████████████████████████████████▊               | 302/375 [1:37:49<23:54, 19.65s/it]Epoch-4, Step-1802, Loss: 0.11276036500930786
 81%|███████████████████████████████████████████████████████████████               | 303/375 [1:38:08<23:35, 19.66s/it]Epoch-4, Step-1803, Loss: 0.25071510672569275
 81%|███████████████████████████████████████████████████████████████▏              | 304/375 [1:38:28<23:08, 19.56s/it]Epoch-4, Step-1804, Loss: 0.19724692404270172
 81%|█████

 93%|████████████████████████████████████████████████████████████████████████▌     | 349/375 [1:53:00<08:20, 19.24s/it]Epoch-4, Step-1849, Loss: 0.25053298473358154
 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:53:20<08:01, 19.25s/it]Epoch-4, Step-1850, Loss: 0.3545821011066437
 94%|█████████████████████████████████████████████████████████████████████████     | 351/375 [1:53:39<07:41, 19.23s/it]Epoch-4, Step-1851, Loss: 0.19852185249328613
 94%|█████████████████████████████████████████████████████████████████████████▏    | 352/375 [1:53:58<07:21, 19.21s/it]Epoch-4, Step-1852, Loss: 0.17019249498844147
 94%|█████████████████████████████████████████████████████████████████████████▍    | 353/375 [1:54:17<07:01, 19.18s/it]Epoch-4, Step-1853, Loss: 0.25900012254714966
 94%|█████████████████████████████████████████████████████████████████████████▋    | 354/375 [1:54:36<06:43, 19.19s/it]Epoch-4, Step-1854, Loss: 0.2944720983505249
 95%|███████

Epoch 4, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.832

precision: 0.5378031383737518

recall: 0.6768402154398564

f1: 0.5993640699523052

[[4238  648]
 [ 360  754]]
              precision    recall  f1-score   support

           0       0.92      0.87      0.89      4886
           1       0.54      0.68      0.60      1114

    accuracy                           0.83      6000
   macro avg       0.73      0.77      0.75      6000
weighted avg       0.85      0.83      0.84      6000



Epoch-5, Step-1875, Loss: 0.1783570945262909
  0%|▏                                                                               | 1/375 [00:19<1:59:21, 19.15s/it]Epoch-5, Step-1876, Loss: 0.09910910576581955
  1%|▍                                                                               | 2/375 [00:38<2:00:42, 19.42s/it]Epoch-5, Step-1877, Loss: 0.1786198616027832
  1%|▋                                                                               | 3/375 [00:58<2:00:07, 19.37s/it]Epoch-5, Step-1878, Loss: 0.10633312165737152
  1%|▊                                                                               | 4/375 [01:17<1:59:32, 19.33s/it]Epoch-5, Step-1879, Loss: 0.1268647462129593
  1%|█                                                                               | 5/375 [01:36<1:59:37, 19.40s/it]Epoch-5, Step-1880, Loss: 0.09439550340175629
  2%|█▎                                                                              | 6/375 [01:56<2:00:31, 19.60s/it]Epoch-5, Step

 27%|████████████████████▊                                                         | 100/375 [32:28<1:29:06, 19.44s/it]Epoch-5, Step-1975, Loss: 0.12145733088254929
 27%|█████████████████████                                                         | 101/375 [32:48<1:29:03, 19.50s/it]Epoch-5, Step-1976, Loss: 0.029297074303030968
 27%|█████████████████████▏                                                        | 102/375 [33:07<1:28:52, 19.53s/it]Epoch-5, Step-1977, Loss: 0.06656818091869354
 27%|█████████████████████▍                                                        | 103/375 [33:27<1:28:36, 19.55s/it]Epoch-5, Step-1978, Loss: 0.08480270206928253
 28%|█████████████████████▋                                                        | 104/375 [33:47<1:28:39, 19.63s/it]Epoch-5, Step-1979, Loss: 0.13618893921375275
 28%|█████████████████████▊                                                        | 105/375 [34:06<1:27:57, 19.55s/it]Epoch-5, Step-1980, Loss: 0.04073799401521683
 28%|████

 53%|█████████████████████████████████████████▍                                    | 199/375 [1:04:50<57:44, 19.68s/it]Epoch-5, Step-2074, Loss: 0.06959482282400131
 53%|█████████████████████████████████████████▌                                    | 200/375 [1:05:10<57:30, 19.72s/it]Epoch-5, Step-2075, Loss: 0.15890498459339142
 54%|█████████████████████████████████████████▊                                    | 201/375 [1:05:30<57:35, 19.86s/it]Epoch-5, Step-2076, Loss: 0.12851719558238983
 54%|██████████████████████████████████████████                                    | 202/375 [1:05:50<56:54, 19.74s/it]Epoch-5, Step-2077, Loss: 0.09344945102930069
 54%|██████████████████████████████████████████▏                                   | 203/375 [1:06:09<56:29, 19.71s/it]Epoch-5, Step-2078, Loss: 0.17025579512119293
 54%|██████████████████████████████████████████▍                                   | 204/375 [1:06:29<55:58, 19.64s/it]Epoch-5, Step-2079, Loss: 0.0639452263712883
 55%|██████

 66%|███████████████████████████████████████████████████▊                          | 249/375 [1:21:06<41:08, 19.59s/it]Epoch-5, Step-2124, Loss: 0.21088145673274994
 67%|████████████████████████████████████████████████████                          | 250/375 [1:21:26<40:55, 19.65s/it]Epoch-5, Step-2125, Loss: 0.1331750899553299
 67%|████████████████████████████████████████████████████▏                         | 251/375 [1:21:45<40:24, 19.56s/it]Epoch-5, Step-2126, Loss: 0.1618669182062149
 67%|████████████████████████████████████████████████████▍                         | 252/375 [1:22:05<40:13, 19.62s/it]Epoch-5, Step-2127, Loss: 0.11395514756441116
 67%|████████████████████████████████████████████████████▌                         | 253/375 [1:22:24<39:58, 19.66s/it]Epoch-5, Step-2128, Loss: 0.15380699932575226
 68%|████████████████████████████████████████████████████▊                         | 254/375 [1:22:44<39:31, 19.60s/it]Epoch-5, Step-2129, Loss: 0.1611875742673874
 68%|████████

 93%|████████████████████████████████████████████████████████████████████████▍     | 348/375 [1:53:23<08:58, 19.94s/it]Epoch-5, Step-2223, Loss: 0.09991485625505447
 93%|████████████████████████████████████████████████████████████████████████▌     | 349/375 [1:53:43<08:38, 19.94s/it]Epoch-5, Step-2224, Loss: 0.05977645143866539
 93%|████████████████████████████████████████████████████████████████████████▊     | 350/375 [1:54:02<08:14, 19.76s/it]Epoch-5, Step-2225, Loss: 0.13295966386795044
 94%|█████████████████████████████████████████████████████████████████████████     | 351/375 [1:54:22<07:56, 19.87s/it]Epoch-5, Step-2226, Loss: 0.22558237612247467
 94%|█████████████████████████████████████████████████████████████████████████▏    | 352/375 [1:54:42<07:37, 19.91s/it]Epoch-5, Step-2227, Loss: 0.20590601861476898
 94%|█████████████████████████████████████████████████████████████████████████▍    | 353/375 [1:55:02<07:14, 19.73s/it]Epoch-5, Step-2228, Loss: 0.19328564405441284
 94%|█████

Epoch 5, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8525

precision: 0.6137040714995035

recall: 0.5547576301615799

f1: 0.5827439886845828

[[4497  389]
 [ 496  618]]
              precision    recall  f1-score   support

           0       0.90      0.92      0.91      4886
           1       0.61      0.55      0.58      1114

    accuracy                           0.85      6000
   macro avg       0.76      0.74      0.75      6000
weighted avg       0.85      0.85      0.85      6000



Epoch-6, Step-2250, Loss: 0.11234260350465775
  0%|▏                                                                               | 1/375 [00:19<2:01:44, 19.53s/it]Epoch-6, Step-2251, Loss: 0.04369021952152252
  1%|▍                                                                               | 2/375 [00:38<2:00:52, 19.44s/it]Epoch-6, Step-2252, Loss: 0.06207999959588051
  1%|▋                                                                               | 3/375 [00:58<2:01:26, 19.59s/it]Epoch-6, Step-2253, Loss: 0.05209524556994438
  1%|▊                                                                               | 4/375 [01:18<2:00:51, 19.55s/it]Epoch-6, Step-2254, Loss: 0.116872139275074
  1%|█                                                                               | 5/375 [01:37<2:01:05, 19.64s/it]Epoch-6, Step-2255, Loss: 0.11410177499055862
  2%|█▎                                                                              | 6/375 [01:57<2:01:04, 19.69s/it]Epoch-6, Ste

 26%|████████████████████▊                                                          | 99/375 [30:02<1:17:24, 16.83s/it]Epoch-6, Step-2349, Loss: 0.10328927636146545
 27%|████████████████████▊                                                         | 100/375 [30:19<1:17:38, 16.94s/it]Epoch-6, Step-2350, Loss: 0.08571077138185501
 27%|█████████████████████                                                         | 101/375 [30:36<1:16:55, 16.85s/it]Epoch-6, Step-2351, Loss: 0.0180337093770504
 27%|█████████████████████▏                                                        | 102/375 [30:52<1:15:56, 16.69s/it]Epoch-6, Step-2352, Loss: 0.04058827459812164
 27%|█████████████████████▍                                                        | 103/375 [31:09<1:15:40, 16.69s/it]Epoch-6, Step-2353, Loss: 0.09955496340990067
 28%|█████████████████████▋                                                        | 104/375 [31:25<1:15:17, 16.67s/it]Epoch-6, Step-2354, Loss: 0.03386949747800827
 28%|██████

 53%|██████████████████████████████████████████                                      | 197/375 [56:02<47:10, 15.90s/it]Epoch-6, Step-2447, Loss: 0.04165862500667572
 53%|██████████████████████████████████████████▏                                     | 198/375 [56:18<47:02, 15.95s/it]Epoch-6, Step-2448, Loss: 0.035011760890483856
 53%|██████████████████████████████████████████▍                                     | 199/375 [56:34<46:21, 15.80s/it]Epoch-6, Step-2449, Loss: 0.02028587833046913
 53%|██████████████████████████████████████████▋                                     | 200/375 [56:50<46:25, 15.92s/it]Epoch-6, Step-2450, Loss: 0.14308597147464752
 54%|██████████████████████████████████████████▉                                     | 201/375 [57:06<46:01, 15.87s/it]Epoch-6, Step-2451, Loss: 0.10073690116405487
 54%|███████████████████████████████████████████                                     | 202/375 [57:22<46:09, 16.01s/it]Epoch-6, Step-2452, Loss: 0.09040804952383041
 54%|████

 79%|█████████████████████████████████████████████████████████████▎                | 295/375 [1:21:12<20:28, 15.35s/it]Epoch-6, Step-2545, Loss: 0.18806472420692444
 79%|█████████████████████████████████████████████████████████████▌                | 296/375 [1:21:28<20:10, 15.33s/it]Epoch-6, Step-2546, Loss: 0.1313585638999939
 79%|█████████████████████████████████████████████████████████████▊                | 297/375 [1:21:43<19:53, 15.30s/it]Epoch-6, Step-2547, Loss: 0.15674450993537903
 79%|█████████████████████████████████████████████████████████████▉                | 298/375 [1:21:58<19:39, 15.31s/it]Epoch-6, Step-2548, Loss: 0.11835990846157074
 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:22:13<19:20, 15.27s/it]Epoch-6, Step-2549, Loss: 0.1214754730463028
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:22:29<19:09, 15.33s/it]Epoch-6, Step-2550, Loss: 0.12533536553382874
 80%|███████

Epoch 6, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.851

precision: 0.6141078838174274

recall: 0.5314183123877917

f1: 0.5697786333012512

[[4514  372]
 [ 522  592]]
              precision    recall  f1-score   support

           0       0.90      0.92      0.91      4886
           1       0.61      0.53      0.57      1114

    accuracy                           0.85      6000
   macro avg       0.76      0.73      0.74      6000
weighted avg       0.84      0.85      0.85      6000



Epoch-7, Step-2625, Loss: 0.06629049777984619
  0%|▏                                                                               | 1/375 [00:15<1:33:56, 15.07s/it]Epoch-7, Step-2626, Loss: 0.07074414193630219
  1%|▍                                                                               | 2/375 [00:31<1:37:08, 15.63s/it]Epoch-7, Step-2627, Loss: 0.08237035572528839
  1%|▋                                                                               | 3/375 [00:47<1:39:45, 16.09s/it]Epoch-7, Step-2628, Loss: 0.09074661135673523
  1%|▊                                                                               | 4/375 [01:04<1:41:53, 16.48s/it]Epoch-7, Step-2629, Loss: 0.04559994861483574
  1%|█                                                                               | 5/375 [01:20<1:40:53, 16.36s/it]Epoch-7, Step-2630, Loss: 0.019743360579013824
  2%|█▎                                                                              | 6/375 [01:36<1:39:02, 16.10s/it]Epoch-7, 

 26%|████████████████████▊                                                          | 99/375 [25:37<1:10:19, 15.29s/it]Epoch-7, Step-2724, Loss: 0.06126876920461655
 27%|████████████████████▊                                                         | 100/375 [25:52<1:09:55, 15.26s/it]Epoch-7, Step-2725, Loss: 0.09094597399234772
 27%|█████████████████████                                                         | 101/375 [26:07<1:09:29, 15.22s/it]Epoch-7, Step-2726, Loss: 0.062403060495853424
 27%|█████████████████████▏                                                        | 102/375 [26:22<1:08:56, 15.15s/it]Epoch-7, Step-2727, Loss: 0.07787773758172989
 27%|█████████████████████▍                                                        | 103/375 [26:38<1:08:42, 15.15s/it]Epoch-7, Step-2728, Loss: 0.04856452718377113
 28%|█████████████████████▋                                                        | 104/375 [26:53<1:08:32, 15.18s/it]Epoch-7, Step-2729, Loss: 0.038653306663036346
 28%|███

 53%|██████████████████████████████████████████                                      | 197/375 [51:00<49:26, 16.67s/it]Epoch-7, Step-2822, Loss: 0.06707709282636642
 53%|██████████████████████████████████████████▏                                     | 198/375 [51:17<48:56, 16.59s/it]Epoch-7, Step-2823, Loss: 0.06852856278419495
 53%|██████████████████████████████████████████▍                                     | 199/375 [51:34<48:47, 16.63s/it]Epoch-7, Step-2824, Loss: 0.028928522020578384
 53%|██████████████████████████████████████████▋                                     | 200/375 [51:50<48:25, 16.60s/it]Epoch-7, Step-2825, Loss: 0.03416154906153679
 54%|██████████████████████████████████████████▉                                     | 201/375 [52:06<47:45, 16.47s/it]Epoch-7, Step-2826, Loss: 0.026667412370443344
 54%|███████████████████████████████████████████                                     | 202/375 [52:22<46:56, 16.28s/it]Epoch-7, Step-2827, Loss: 0.1629331111907959
 54%|████

 79%|█████████████████████████████████████████████████████████████▎                | 295/375 [1:17:45<21:22, 16.04s/it]Epoch-7, Step-2920, Loss: 0.06486974656581879
 79%|█████████████████████████████████████████████████████████████▌                | 296/375 [1:18:01<20:58, 15.94s/it]Epoch-7, Step-2921, Loss: 0.07039735466241837
 79%|█████████████████████████████████████████████████████████████▊                | 297/375 [1:18:16<20:26, 15.72s/it]Epoch-7, Step-2922, Loss: 0.11183956265449524
 79%|█████████████████████████████████████████████████████████████▉                | 298/375 [1:18:31<20:03, 15.63s/it]Epoch-7, Step-2923, Loss: 0.058011144399642944
 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:18:47<19:38, 15.50s/it]Epoch-7, Step-2924, Loss: 0.12475508451461792
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:19:02<19:24, 15.53s/it]Epoch-7, Step-2925, Loss: 0.11179197579622269
 80%|████

Epoch 7, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8271666666666667

precision: 0.5274411974340698

recall: 0.6642728904847397

f1: 0.5880015891934843

[[4223  663]
 [ 374  740]]
              precision    recall  f1-score   support

           0       0.92      0.86      0.89      4886
           1       0.53      0.66      0.59      1114

    accuracy                           0.83      6000
   macro avg       0.72      0.76      0.74      6000
weighted avg       0.85      0.83      0.83      6000



Epoch-8, Step-3000, Loss: 0.05591762810945511
  0%|▏                                                                               | 1/375 [00:15<1:38:46, 15.85s/it]Epoch-8, Step-3001, Loss: 0.09164173156023026
  1%|▍                                                                               | 2/375 [00:32<1:41:45, 16.37s/it]Epoch-8, Step-3002, Loss: 0.010488808155059814
  1%|▋                                                                               | 3/375 [00:49<1:44:18, 16.82s/it]Epoch-8, Step-3003, Loss: 0.12260960787534714
  1%|▊                                                                               | 4/375 [01:05<1:41:52, 16.48s/it]Epoch-8, Step-3004, Loss: 0.047050416469573975
  1%|█                                                                               | 5/375 [01:22<1:41:46, 16.51s/it]Epoch-8, Step-3005, Loss: 0.007275691721588373
  2%|█▎                                                                              | 6/375 [01:39<1:43:32, 16.84s/it]Epoch-8

 26%|████████████████████▊                                                          | 99/375 [26:12<1:12:02, 15.66s/it]Epoch-8, Step-3099, Loss: 0.06592381745576859
 27%|████████████████████▊                                                         | 100/375 [26:27<1:11:26, 15.59s/it]Epoch-8, Step-3100, Loss: 0.028138164430856705
 27%|█████████████████████                                                         | 101/375 [26:43<1:11:28, 15.65s/it]Epoch-8, Step-3101, Loss: 0.1295769065618515
 27%|█████████████████████▏                                                        | 102/375 [26:59<1:11:23, 15.69s/it]Epoch-8, Step-3102, Loss: 0.06884024292230606
 27%|█████████████████████▍                                                        | 103/375 [27:15<1:11:23, 15.75s/it]Epoch-8, Step-3103, Loss: 0.12172501534223557
 28%|█████████████████████▋                                                        | 104/375 [27:31<1:11:37, 15.86s/it]Epoch-8, Step-3104, Loss: 0.013633848167955875
 28%|████

 53%|██████████████████████████████████████████                                      | 197/375 [51:46<46:32, 15.69s/it]Epoch-8, Step-3197, Loss: 0.04761042073369026
 53%|██████████████████████████████████████████▏                                     | 198/375 [52:02<45:59, 15.59s/it]Epoch-8, Step-3198, Loss: 0.010468974709510803
 53%|██████████████████████████████████████████▍                                     | 199/375 [52:17<45:52, 15.64s/it]Epoch-8, Step-3199, Loss: 0.013122373260557652
 53%|██████████████████████████████████████████▋                                     | 200/375 [52:33<45:18, 15.54s/it]Epoch-8, Step-3200, Loss: 0.1697174459695816
 54%|██████████████████████████████████████████▉                                     | 201/375 [52:49<45:24, 15.66s/it]Epoch-8, Step-3201, Loss: 0.18543808162212372
 54%|███████████████████████████████████████████                                     | 202/375 [53:04<44:52, 15.56s/it]Epoch-8, Step-3202, Loss: 0.2030593454837799
 54%|█████

 79%|█████████████████████████████████████████████████████████████▎                | 295/375 [1:17:55<21:45, 16.32s/it]Epoch-8, Step-3295, Loss: 0.01056226808577776
 79%|█████████████████████████████████████████████████████████████▌                | 296/375 [1:18:11<21:36, 16.41s/it]Epoch-8, Step-3296, Loss: 0.059623803943395615
 79%|█████████████████████████████████████████████████████████████▊                | 297/375 [1:18:27<21:01, 16.18s/it]Epoch-8, Step-3297, Loss: 0.09765655547380447
 79%|█████████████████████████████████████████████████████████████▉                | 298/375 [1:18:42<20:32, 16.01s/it]Epoch-8, Step-3298, Loss: 0.07806303352117538
 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:18:58<19:57, 15.75s/it]Epoch-8, Step-3299, Loss: 0.029296385124325752
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:19:13<19:36, 15.68s/it]Epoch-8, Step-3300, Loss: 0.04890234023332596
 80%|███

Epoch 8, start evaluating.


  0%|                                                                                          | 0/375 [00:00<?, ?it/s]

accuracy: 0.8421666666666666

precision: 0.5727986050566696

recall: 0.5897666068222621

f1: 0.5811587793011942

[[4396  490]
 [ 457  657]]
              precision    recall  f1-score   support

           0       0.91      0.90      0.90      4886
           1       0.57      0.59      0.58      1114

    accuracy                           0.84      6000
   macro avg       0.74      0.74      0.74      6000
weighted avg       0.84      0.84      0.84      6000



Epoch-9, Step-3375, Loss: 0.06399337947368622
  0%|▏                                                                               | 1/375 [00:16<1:42:23, 16.43s/it]Epoch-9, Step-3376, Loss: 0.06055625155568123
  1%|▍                                                                               | 2/375 [00:32<1:42:17, 16.46s/it]Epoch-9, Step-3377, Loss: 0.05388155207037926
  1%|▋                                                                               | 3/375 [00:49<1:41:05, 16.30s/it]Epoch-9, Step-3378, Loss: 0.03045021742582321
  1%|▊                                                                               | 4/375 [01:05<1:41:03, 16.34s/it]Epoch-9, Step-3379, Loss: 0.019041167572140694
  1%|█                                                                               | 5/375 [01:22<1:41:49, 16.51s/it]Epoch-9, Step-3380, Loss: 0.020345613360404968
  2%|█▎                                                                              | 6/375 [01:38<1:40:35, 16.36s/it]Epoch-9,

 26%|████████████████████▊                                                          | 99/375 [27:13<1:16:42, 16.68s/it]Epoch-9, Step-3474, Loss: 0.009579610079526901
 27%|████████████████████▊                                                         | 100/375 [27:29<1:15:45, 16.53s/it]Epoch-9, Step-3475, Loss: 0.038310278207063675
 27%|█████████████████████                                                         | 101/375 [27:46<1:15:47, 16.60s/it]Epoch-9, Step-3476, Loss: 0.03718546777963638
 27%|█████████████████████▏                                                        | 102/375 [28:02<1:15:11, 16.52s/it]Epoch-9, Step-3477, Loss: 0.01212625578045845
 27%|█████████████████████▍                                                        | 103/375 [28:19<1:15:02, 16.55s/it]Epoch-9, Step-3478, Loss: 0.05769645422697067
 28%|█████████████████████▋                                                        | 104/375 [28:36<1:16:12, 16.87s/it]Epoch-9, Step-3479, Loss: 0.016515787690877914
 28%|██

 53%|██████████████████████████████████████████                                      | 197/375 [53:45<45:58, 15.50s/it]Epoch-9, Step-3572, Loss: 0.05998361110687256
 53%|██████████████████████████████████████████▏                                     | 198/375 [54:01<45:36, 15.46s/it]Epoch-9, Step-3573, Loss: 0.01871422864496708
 53%|██████████████████████████████████████████▍                                     | 199/375 [54:16<45:25, 15.49s/it]Epoch-9, Step-3574, Loss: 0.0498141273856163
 53%|██████████████████████████████████████████▋                                     | 200/375 [54:32<45:05, 15.46s/it]Epoch-9, Step-3575, Loss: 0.019576124846935272
 54%|██████████████████████████████████████████▉                                     | 201/375 [54:47<44:54, 15.49s/it]Epoch-9, Step-3576, Loss: 0.06355150043964386
 54%|███████████████████████████████████████████                                     | 202/375 [55:03<44:29, 15.43s/it]Epoch-9, Step-3577, Loss: 0.015025180764496326
 54%|████

 79%|█████████████████████████████████████████████████████████████▎                | 295/375 [1:19:12<20:35, 15.45s/it]Epoch-9, Step-3670, Loss: 0.025506505742669106
 79%|█████████████████████████████████████████████████████████████▌                | 296/375 [1:19:28<20:25, 15.51s/it]Epoch-9, Step-3671, Loss: 0.03224651515483856
 79%|█████████████████████████████████████████████████████████████▊                | 297/375 [1:19:43<20:04, 15.44s/it]Epoch-9, Step-3672, Loss: 0.006042576860636473
 79%|█████████████████████████████████████████████████████████████▉                | 298/375 [1:19:58<19:45, 15.40s/it]Epoch-9, Step-3673, Loss: 0.025416437536478043
 80%|██████████████████████████████████████████████████████████████▏               | 299/375 [1:20:14<19:35, 15.46s/it]Epoch-9, Step-3674, Loss: 0.007153244223445654
 80%|██████████████████████████████████████████████████████████████▍               | 300/375 [1:20:29<19:20, 15.47s/it]Epoch-9, Step-3675, Loss: 0.05772201716899872
 80%|█

Epoch 9, start evaluating.
accuracy: 0.8475

precision: 0.5893980233602875

recall: 0.5888689407540395

f1: 0.5891333632689717

[[4429  457]
 [ 458  656]]
              precision    recall  f1-score   support

           0       0.91      0.91      0.91      4886
           1       0.59      0.59      0.59      1114

    accuracy                           0.85      6000
   macro avg       0.75      0.75      0.75      6000
weighted avg       0.85      0.85      0.85      6000



In [27]:
def predict(model, tokenizer, text):
    encoding = tokenizer(text,
                         return_tensors="pt",
                         max_length=128,
                         truncation=True,
                         padding=True)
    encoding = {k:v.to(device) for  k,v in encoding.items()}
    outputs = model(**encoding)
    #pred = id2label[torch.argmax(outputs[0], dim=-1).numpy()[0]]
    pred = id2label[torch.argmax(outputs[0], dim=-1).cpu().detach().numpy()[0]]
    return pred

In [28]:
tokenizer = BertTokenizer.from_pretrained("model_best")
model = BertForSequenceClassification.from_pretrained(
    "model_best", num_labels=len(label2id))
model.to(device)    

In [None]:
import numpy as np
result_dict = {}
for root, dirs, files in os.walk('test', topdown=True):
    for name in files:
        all_preds = []
        print(f'process file: {name}')
        try:
            with open(os.path.join(root, name), 'r', encoding='utf8') as f:
                lines = f.readlines()
        except:
            with open(os.path.join(root, name), 'r', encoding='gb18030') as f:
                lines = f.readlines()
        for idx, line in enumerate(lines):
            line = line.strip()
            if not line:
                continue
            text = line
            pred=predict(model,tokenizer,line)
            all_preds.append(pred)
        base_name_date = '-'.join([os.path.basename(name)[4:6], os.path.basename(name)[6:8]])
        result_dict[datetime.strptime(base_name_date, "%m-%d")] = [round(
            sum(all_preds) / len(all_preds), 2), len(all_preds)]
result_dict = sorted(result_dict.items(), key=lambda x: x[0])
np.save('result_dict_Ko.npy', result_dict)

process file: 20210623.csv
process file: 20210624.csv
process file: 20210625.csv
process file: 20210626.csv
process file: 20210627.csv
process file: 20210628.csv
process file: 20210629.csv
process file: 20210630.csv
process file: 20210701.csv
process file: 20210702.csv
process file: 20210703.csv
process file: 20210704.csv
process file: 20210705.csv
process file: 20210706.csv
process file: 20210707.csv
process file: 20210708.csv
process file: 20210709.csv
process file: 20210710.csv
process file: 20210711.csv
process file: 20210712.csv
process file: 20210713.csv
process file: 20210714.csv
process file: 20210715.csv
