# KoBigBird KorSTS(Semantic Text Similarity) fine-tuning

긴 문장(최대 4096 토큰)이 입력 가능한 KoBigBird를 두 문장의 유사도 분석이 가능하도록 fine-tuning 합니다.

# 데이터셋(KorSTS Datasets)

카카오브레인에서 공개한 문장 유사도 데이터셋 KorSTS를 사용합니다.


다운로드 링크:
https://github.com/kakaobrain/KorNLUDatasets/tree/master/KorSTS

KorSTS 데이터셋은 두 문장 쌍과 두 문장이 유사한 정도를 나타내는 score(0~5점)가 label로 있는 데이터셋입니다.

BigBird에 두 문장 쌍을 입력하여 얻은 벡터 표현(문장 임베딩)으로 label score를 예측하도록 fine-tuning을 진행합니다.

## Preprocessing

In [1]:
data_path = './data/KorSTS/'

### train, dev, test data 읽어오기

리스트의 각 원소는 리스트로 저장됩니다. [[문장1, 문장2], score] 

In [2]:
import csv

train_data = []
dev_data = []
test_data = []

with open(data_path + 'sts-train.tsv') as file:
    tsv_file = csv.reader(file, delimiter="\t", quoting=csv.QUOTE_NONE)
    for line in tsv_file:
        train_data.append([[line[5], line[6]], line[4]])
        
with open(data_path + 'sts-dev.tsv') as file:
    tsv_file = csv.reader(file, delimiter="\t", quoting=csv.QUOTE_NONE)
    for line in tsv_file:
        dev_data.append([[line[5], line[6]], line[4]])
        
with open(data_path + 'sts-test.tsv') as file:
    tsv_file = csv.reader(file, delimiter="\t", quoting=csv.QUOTE_NONE)
    for line in tsv_file:
        test_data.append([[line[5], line[6]], line[4]])

In [3]:
train_data = train_data[1:]

In [4]:
dev_data = dev_data[1:]

In [5]:
test_data = test_data[1:]

In [6]:
print('train set 수:', len(train_data))
print('dev set 수:', len(dev_data))
print('test set 수:', len(test_data))

train set 수: 5749
dev set 수: 1500
test set 수: 1379


### label 스코어 0~1 사이의 값으로 정규화 하기

두 문장 벡터에 유사도를 계산할 때 코사인 유사도(-1 ~ +1)를 사용할 것이므로 0~5인 label score를 0과 1 사이의 값으로 정규화해야 합니다.

이를 위해 모든 데이터의 label socre를 5로 나누어줍니다. 

In [7]:
for tup in train_data:
    tup[1] = float(tup[1]) / 5

for tup in dev_data:
    tup[1] = float(tup[1]) / 5
    
for tup in test_data:
    tup[1] = float(tup[1]) / 5

In [8]:
print(train_data[0])
print(dev_data[0])
print(test_data[0])

[['비행기가 이륙하고 있다.', '비행기가 이륙하고 있다.'], 1.0]
[['안전모를 가진 한 남자가 춤을 추고 있다.', '안전모를 쓴 한 남자가 춤을 추고 있다.'], 1.0]
[['한 소녀가 머리를 스타일링하고 있다.', '한 소녀가 머리를 빗고 있다.'], 0.5]


## 학습 준비

### GPU or CPU

In [9]:
import torch

device = "cuda" if torch.cuda.is_available() else "cpu"

print(f"{device}를 사용합니다.")

  from .autonotebook import tqdm as notebook_tqdm


cuda를 사용합니다.


### KoBigBird 모델, 토크나이저 불러오기

In [10]:
from transformers import  AutoModel,AutoTokenizer

model = AutoModel.from_pretrained("monologg/kobigbird-bert-base", attention_type="original_full", add_pooling_layer=False)
tokenizer = AutoTokenizer.from_pretrained("monologg/kobigbird-bert-base")

Some weights of the model checkpoint at monologg/kobigbird-bert-base were not used when initializing BigBirdModel: ['cls.predictions.decoder.bias', 'cls.predictions.transform.LayerNorm.bias', 'cls.seq_relationship.weight', 'cls.predictions.decoder.weight', 'bert.pooler.bias', 'bert.pooler.weight', 'cls.predictions.transform.LayerNorm.weight', 'cls.seq_relationship.bias', 'cls.predictions.bias', 'cls.predictions.transform.dense.bias', 'cls.predictions.transform.dense.weight']
- This IS expected if you are initializing BigBirdModel from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BigBirdModel from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


### 하이퍼파라미터

In [11]:
train_batch_size = 64
valid_bath_size = 32
epochs = 100
learning_rate=5e-5

## Dataset

데이터셋 클래스에 토크나이저를 받아와서 데이터셋 객체를 생성할 때 토크나이징 하여 리스트로 저장합니다.

In [12]:
from torch.utils.data import Dataset

class stsDataset(Dataset):
    def __init__(self, data, tokenizer):
        self.sent1 = []
        self.sent2 = []
        self.label = []
        self.tokenizer = tokenizer
        for tup in train_data:
            self.sent1.append(self.tokenizer(tup[0][0], max_length=128, padding='max_length',return_tensors='pt'))
            self.sent2.append(self.tokenizer(tup[0][1], max_length=128, padding='max_length',return_tensors='pt'))
            self.label.append(tup[1])
        
    def __len__(self):
        return (len(self.label))
    
    def __getitem__(self, idx):
        return self.sent1[idx], self.sent2[idx], self.label[idx]

In [13]:
train_dataset = stsDataset(train_data, tokenizer)
valid_dataset = stsDataset(test_data, tokenizer)

## DataLoader

모델 훈련 시에 지정한 배치 크기만큼 데이터를 반환해주는 DataLodader입니다.

DataLoader는 Dataset객체를 인자로 받습니다.

In [14]:
from torch.utils.data import DataLoader

train_dataloader = DataLoader(
    train_dataset,
    shuffle=True,
    batch_size=train_batch_size
)

valid_dataloader = DataLoader(
    valid_dataset,
    shuffle=True,
    batch_size=valid_bath_size
)

## Train

모델 파라미터를 GPU로 이동합니다.

In [15]:
model.to(device)

BigBirdModel(
  (embeddings): BigBirdEmbeddings(
    (word_embeddings): Embedding(32500, 768, padding_idx=0)
    (position_embeddings): Embedding(4096, 768)
    (token_type_embeddings): Embedding(2, 768)
    (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
    (dropout): Dropout(p=0.1, inplace=False)
  )
  (encoder): BigBirdEncoder(
    (layer): ModuleList(
      (0): BigBirdLayer(
        (attention): BigBirdAttention(
          (self): BigBirdSelfAttention(
            (query): Linear(in_features=768, out_features=768, bias=True)
            (key): Linear(in_features=768, out_features=768, bias=True)
            (value): Linear(in_features=768, out_features=768, bias=True)
            (dropout): Dropout(p=0.1, inplace=False)
          )
          (output): BigBirdSelfOutput(
            (dense): Linear(in_features=768, out_features=768, bias=True)
            (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
            (dropout): Dropout(p=0.1, inp

### 훈련에 필요한 optimizer, 코사인 유사도 함수 손실함수를 정의합니다.

optimizer에는 모델의 파라미터를 넘겨주고 학습률을 지정해줘야 합니다.

두 문장의 유사도를 코사인 유사도를 통해 구하면 -1 ~ +1 의 얻게 됩니다. 이 값이 최종 모델의 예측값이 됩니다.

BigBird를 통해 얻은 두 문장 벡터의 유사도를 구하기 위해 pytorch가 지원하는 코사인 유사도 함수를 사용합니다.

0과 1사이의 실수값을 예측하는 Task이므로 회귀 태스크라고 볼 수 있으며, 회귀에는 평균제곱오차(MSE loss)를 사용합니다.

모델의 예측값(두 문장 벡터의 코사인 유사도)과 label socre 의 차이가 0에 수렴하도록 학습됩니다.

In [16]:
from torch import nn

optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)
cos = nn.CosineSimilarity(dim=1, eps=1e-6)
loss_fn = nn.MSELoss()

### 훈련 및 검증 

최저 valid loss를 갱신할 때마다 모델을 저장합니다. 현재 디렉토리의 model 폴더에 저장됩니다.

In [17]:
from tqdm import tqdm

In [18]:
best_val_loss = 100

for epoch in range(1, epochs+1):
    
    model.train()
    
    train_loss = []
    step = 0
    
    for i, batch in enumerate(tqdm(train_dataloader)):
        optimizer.zero_grad()
        
        batch = tuple(t.to(device) for t in batch)
        b_sent1, b_sent2, b_label = batch 
        
        sent1_embs = model(b_sent1['input_ids'].squeeze(1), b_sent1['attention_mask'].squeeze(1), b_sent1['token_type_ids'].squeeze(1))[0][:,0,:]
        sent2_embs = model(b_sent2['input_ids'].squeeze(1), b_sent2['attention_mask'].squeeze(1), b_sent2['token_type_ids'].squeeze(1))[0][:,0,:]
        
        pred = cos(sent1_embs, sent2_embs)
        pred = pred.type(torch.float64).to(device)
        
        loss = loss_fn(pred, b_label)
        loss.backward()
        
        optimizer.step()
        
        train_loss.append(loss)
        step += 1
        
    print(f"train {epoch} epoch 종료  평균 loss: {sum(train_loss)/step}")
    
    with torch.no_grad():
        
        model.eval()

        valid_loss = []
        step = 0

        for i, batch in enumerate(tqdm(valid_dataloader)):
            
            batch = tuple(t.to(device) for t in batch)
            b_sent1, b_sent2, b_label = batch # [batch_size, max_len, 768]

            sent1_embs = model(b_sent1['input_ids'].squeeze(1), b_sent1['attention_mask'].squeeze(1), b_sent1['token_type_ids'].squeeze(1))[0][:,0,:]
            sent2_embs = model(b_sent2['input_ids'].squeeze(1), b_sent2['attention_mask'].squeeze(1), b_sent2['token_type_ids'].squeeze(1))[0][:,0,:]

            pred = cos(sent1_embs, sent2_embs)
            pred = pred.type(torch.float64).to(device)

            loss = loss_fn(pred, b_label)

            valid_loss.append(loss)
            step += 1
            
            
        val_loss = sum(valid_loss)/step
        print(f"vaild {epoch} epoch 종료  평균 loss: {val_loss}")
        
        if val_loss < best_val_loss:
            best_val_loss = val_loss
            model_save_path = './model/' +  'saved_model_epoch_' + str(epoch) + '.pt'
            model.save_pretrained(model_save_path)

100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 1 epoch 종료  평균 loss: 0.052405076862973576


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.42it/s]


vaild 1 epoch 종료  평균 loss: 0.04134089954279399


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 2 epoch 종료  평균 loss: 0.03131011851968514


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 2 epoch 종료  평균 loss: 0.029580858007478287


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 3 epoch 종료  평균 loss: 0.022491025246948217


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 3 epoch 종료  평균 loss: 0.017339398006623305


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 4 epoch 종료  평균 loss: 0.01637711423609204


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 4 epoch 종료  평균 loss: 0.01593745712021095


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 5 epoch 종료  평균 loss: 0.012076713406012884


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 5 epoch 종료  평균 loss: 0.013286722734847834


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 6 epoch 종료  평균 loss: 0.009578263670556222


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 6 epoch 종료  평균 loss: 0.012202171194229599


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 7 epoch 종료  평균 loss: 0.00795651271607195


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 7 epoch 종료  평균 loss: 0.011044577940267385


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 8 epoch 종료  평균 loss: 0.007056389615996936


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 8 epoch 종료  평균 loss: 0.010455189529465513


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 9 epoch 종료  평균 loss: 0.006315048550302377


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 9 epoch 종료  평균 loss: 0.010938863161368837


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 10 epoch 종료  평균 loss: 0.0061236052507444225


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 10 epoch 종료  평균 loss: 0.010373350161402298


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 11 epoch 종료  평균 loss: 0.005402243735203447


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 11 epoch 종료  평균 loss: 0.00974493803919264


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 12 epoch 종료  평균 loss: 0.005079415301812965


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 12 epoch 종료  평균 loss: 0.008598865105400703


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 13 epoch 종료  평균 loss: 0.005005061546709673


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 13 epoch 종료  평균 loss: 0.008762714385804952


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 14 epoch 종료  평균 loss: 0.004557021039240125


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 14 epoch 종료  평균 loss: 0.008796205411685767


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 15 epoch 종료  평균 loss: 0.004347335681556452


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 15 epoch 종료  평균 loss: 0.008260525151557193


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 16 epoch 종료  평균 loss: 0.004118135931067268


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 16 epoch 종료  평균 loss: 0.008241474243263672


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 17 epoch 종료  평균 loss: 0.004083033254196642


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 17 epoch 종료  평균 loss: 0.007554470593041869


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 18 epoch 종료  평균 loss: 0.0038870360977295935


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 18 epoch 종료  평균 loss: 0.0072640726533870935


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 19 epoch 종료  평균 loss: 0.0037142983277983956


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 19 epoch 종료  평균 loss: 0.007827748373446257


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 20 epoch 종료  평균 loss: 0.0035716580919135633


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 20 epoch 종료  평균 loss: 0.007385591797273455


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 21 epoch 종료  평균 loss: 0.0035806197321240013


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 21 epoch 종료  평균 loss: 0.00746847958323689


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 22 epoch 종료  평균 loss: 0.0033541040059807212


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 22 epoch 종료  평균 loss: 0.007017916857970537


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 23 epoch 종료  평균 loss: 0.0033047348901085044


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 23 epoch 종료  평균 loss: 0.007013774892201151


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 24 epoch 종료  평균 loss: 0.0033925554736152974


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 24 epoch 종료  평균 loss: 0.007221704259928772


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 25 epoch 종료  평균 loss: 0.0032296245300437697


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 25 epoch 종료  평균 loss: 0.006383684446139994


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 26 epoch 종료  평균 loss: 0.0030906915792769524


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 26 epoch 종료  평균 loss: 0.006476748454119371


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 27 epoch 종료  평균 loss: 0.003016674016358379


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 27 epoch 종료  평균 loss: 0.0061962919474220154


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 28 epoch 종료  평균 loss: 0.003059231905657078


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 28 epoch 종료  평균 loss: 0.0069455255790977655


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 29 epoch 종료  평균 loss: 0.0029704013620499665


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 29 epoch 종료  평균 loss: 0.006331635520412065


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 30 epoch 종료  평균 loss: 0.0028125798936579176


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 30 epoch 종료  평균 loss: 0.006010232343865004


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 31 epoch 종료  평균 loss: 0.002723440738425704


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 31 epoch 종료  평균 loss: 0.006014436746977482


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 32 epoch 종료  평균 loss: 0.0027130417060888105


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 32 epoch 종료  평균 loss: 0.006172539764901729


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 33 epoch 종료  평균 loss: 0.002728143169731977


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 33 epoch 종료  평균 loss: 0.006035942843101628


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 34 epoch 종료  평균 loss: 0.0026570957037549475


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 34 epoch 종료  평균 loss: 0.005570891213735522


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 35 epoch 종료  평균 loss: 0.002626297346384645


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 35 epoch 종료  평균 loss: 0.005944757470309075


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 36 epoch 종료  평균 loss: 0.0025423405275819865


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 36 epoch 종료  평균 loss: 0.005704259346001712


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 37 epoch 종료  평균 loss: 0.0024289085961128887


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 37 epoch 종료  평균 loss: 0.005450552116730475


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 38 epoch 종료  평균 loss: 0.0024396049540288804


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 38 epoch 종료  평균 loss: 0.005421297627344955


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 39 epoch 종료  평균 loss: 0.0024601047057031178


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 39 epoch 종료  평균 loss: 0.00546014913022206


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 40 epoch 종료  평균 loss: 0.0024815436324296795


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 40 epoch 종료  평균 loss: 0.005450278679168795


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 41 epoch 종료  평균 loss: 0.0023876985217231913


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 41 epoch 종료  평균 loss: 0.00551847092794331


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 42 epoch 종료  평균 loss: 0.0023251693780860384


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 42 epoch 종료  평균 loss: 0.005398539847829167


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 43 epoch 종료  평균 loss: 0.0022820160336284416


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 43 epoch 종료  평균 loss: 0.005441227189815895


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 44 epoch 종료  평균 loss: 0.0023274121430297756


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 44 epoch 종료  평균 loss: 0.005076759712715703


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 45 epoch 종료  평균 loss: 0.002267334641623012


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 45 epoch 종료  평균 loss: 0.005360797493658958


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 46 epoch 종료  평균 loss: 0.002168573088168996


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 46 epoch 종료  평균 loss: 0.005288279559932762


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 47 epoch 종료  평균 loss: 0.0021647374923558066


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 47 epoch 종료  평균 loss: 0.0052197109025113346


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 48 epoch 종료  평균 loss: 0.0021306202039909727


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 48 epoch 종료  평균 loss: 0.005314458517038732


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 49 epoch 종료  평균 loss: 0.002113328683728347


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 49 epoch 종료  평균 loss: 0.005074479740288764


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 50 epoch 종료  평균 loss: 0.0020942063358994254


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 50 epoch 종료  평균 loss: 0.005231429554048589


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 51 epoch 종료  평균 loss: 0.0020884649783960052


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 51 epoch 종료  평균 loss: 0.0051877919393166945


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 52 epoch 종료  평균 loss: 0.0020253119898923162


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 52 epoch 종료  평균 loss: 0.005333684600227311


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 53 epoch 종료  평균 loss: 0.0019847248934967473


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 53 epoch 종료  평균 loss: 0.005052765534315513


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 54 epoch 종료  평균 loss: 0.0019073306439164033


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 54 epoch 종료  평균 loss: 0.005187351257818506


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 55 epoch 종료  평균 loss: 0.0019757606579409405


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 55 epoch 종료  평균 loss: 0.005126870782263164


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 56 epoch 종료  평균 loss: 0.0019462522210784267


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 56 epoch 종료  평균 loss: 0.005058927037031879


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 57 epoch 종료  평균 loss: 0.001932194720488947


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 57 epoch 종료  평균 loss: 0.0050679029374975475


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 58 epoch 종료  평균 loss: 0.001856732938096051


100%|██████████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 58 epoch 종료  평균 loss: 0.0048258878391490055


100%|████████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 59 epoch 종료  평균 loss: 0.0018767998968958015


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 59 epoch 종료  평균 loss: 0.00508984405549723


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 60 epoch 종료  평균 loss: 0.0018362130215232527


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 60 epoch 종료  평균 loss: 0.004936488069867759


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 61 epoch 종료  평균 loss: 0.001816455109919032


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 61 epoch 종료  평균 loss: 0.004985868997105


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 62 epoch 종료  평균 loss: 0.0018020085164052989


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 62 epoch 종료  평균 loss: 0.0053293355185018


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 63 epoch 종료  평균 loss: 0.0017390392085454111


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 63 epoch 종료  평균 loss: 0.005080663808649471


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 64 epoch 종료  평균 loss: 0.0018173836110433985


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 64 epoch 종료  평균 loss: 0.005233281361167503


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 65 epoch 종료  평균 loss: 0.0017217480365899153


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 65 epoch 종료  평균 loss: 0.004944240719382251


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.43it/s]


train 66 epoch 종료  평균 loss: 0.0016114663029601108


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 66 epoch 종료  평균 loss: 0.005030780137150942


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.43it/s]


train 67 epoch 종료  평균 loss: 0.001647947165343948


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 67 epoch 종료  평균 loss: 0.004988665902217644


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.43it/s]


train 68 epoch 종료  평균 loss: 0.001679566490348817


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 68 epoch 종료  평균 loss: 0.005240418445058418


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.42it/s]


train 69 epoch 종료  평균 loss: 0.001683002481330173


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 69 epoch 종료  평균 loss: 0.00494256405738789


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 70 epoch 종료  평균 loss: 0.001667290875707286


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 70 epoch 종료  평균 loss: 0.004896899615112446


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 71 epoch 종료  평균 loss: 0.0015943926261694742


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 71 epoch 종료  평균 loss: 0.00509585921151491


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 72 epoch 종료  평균 loss: 0.0016178877566268685


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 72 epoch 종료  평균 loss: 0.005033247565480638


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 73 epoch 종료  평균 loss: 0.0015644353047491095


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 73 epoch 종료  평균 loss: 0.005028540104280245


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 74 epoch 종료  평균 loss: 0.0016128856751090005


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 74 epoch 종료  평균 loss: 0.004923725260464725


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 75 epoch 종료  평균 loss: 0.0015074536823631054


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 75 epoch 종료  평균 loss: 0.004904423023926644


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 76 epoch 종료  평균 loss: 0.0015113241890718995


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 76 epoch 종료  평균 loss: 0.00502699763303844


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 77 epoch 종료  평균 loss: 0.0015170518190302093


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 77 epoch 종료  평균 loss: 0.005057299701695538


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 78 epoch 종료  평균 loss: 0.001475290420019854


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 78 epoch 종료  평균 loss: 0.005025009815687566


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 79 epoch 종료  평균 loss: 0.0014648269182768027


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 79 epoch 종료  평균 loss: 0.004788471061109004


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 80 epoch 종료  평균 loss: 0.001461430385755937


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 80 epoch 종료  평균 loss: 0.00506047686740855


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 81 epoch 종료  평균 loss: 0.0014291093514198193


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 81 epoch 종료  평균 loss: 0.00500407198997453


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 82 epoch 종료  평균 loss: 0.0014169560910727269


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 82 epoch 종료  평균 loss: 0.005136027399784376


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 83 epoch 종료  평균 loss: 0.001398847525498165


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 83 epoch 종료  평균 loss: 0.005183776340172004


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 84 epoch 종료  평균 loss: 0.0014643596027375879


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 84 epoch 종료  평균 loss: 0.005016817144293178


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 85 epoch 종료  평균 loss: 0.0014526148060374


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 85 epoch 종료  평균 loss: 0.005264603001019599


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 86 epoch 종료  평균 loss: 0.0013546296420091752


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 86 epoch 종료  평균 loss: 0.004964685490259394


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 87 epoch 종료  평균 loss: 0.0013676954033706792


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 87 epoch 종료  평균 loss: 0.005361593690003868


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 88 epoch 종료  평균 loss: 0.0013707298985007129


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.36it/s]


vaild 88 epoch 종료  평균 loss: 0.005237754321468172


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 89 epoch 종료  평균 loss: 0.0013722585209525403


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 89 epoch 종료  평균 loss: 0.005191691242848961


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 90 epoch 종료  평균 loss: 0.001344990756504753


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 90 epoch 종료  평균 loss: 0.00531950746465295


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 91 epoch 종료  평균 loss: 0.0013618972682397183


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 91 epoch 종료  평균 loss: 0.005341242786563012


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 92 epoch 종료  평균 loss: 0.001355276672894953


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 92 epoch 종료  평균 loss: 0.005336990920288465


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 93 epoch 종료  평균 loss: 0.0012981586562431566


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 93 epoch 종료  평균 loss: 0.005210094181728922


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 94 epoch 종료  평균 loss: 0.00127608156802453


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 94 epoch 종료  평균 loss: 0.005114476439532861


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 95 epoch 종료  평균 loss: 0.0012842325399756648


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 95 epoch 종료  평균 loss: 0.005237689821806049


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 96 epoch 종료  평균 loss: 0.0012776420348911677


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 96 epoch 종료  평균 loss: 0.005240217117762759


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 97 epoch 종료  평균 loss: 0.0012645731424272687


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 97 epoch 종료  평균 loss: 0.005323833942075025


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.40it/s]


train 98 epoch 종료  평균 loss: 0.0012520489446186038


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 98 epoch 종료  평균 loss: 0.005315420481265742


100%|█████████████████████████████████████████████████████████| 90/90 [01:03<00:00,  1.41it/s]


train 99 epoch 종료  평균 loss: 0.0012556734946800113


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]


vaild 99 epoch 종료  평균 loss: 0.005363745834323396


100%|█████████████████████████████████████████████████████████| 90/90 [01:04<00:00,  1.41it/s]


train 100 epoch 종료  평균 loss: 0.001214520034287132


100%|███████████████████████████████████████████████████████| 180/180 [00:21<00:00,  8.37it/s]

vaild 100 epoch 종료  평균 loss: 0.005338719528576356



