In [None]:
# !pip install transformers

In [None]:
import numpy as np
import os
from PIL import Image
from tqdm import tqdm
from copy import deepcopy
import datetime

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from transformers import get_cosine_schedule_with_warmup
import torch.nn.functional as F

from torchvision import datasets, transforms
from torch.utils.data import dataloader

In [None]:
!pwd

/home/user


In [None]:
!nvidia-smi

Sat Aug 23 14:59:11 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 570.133.07             Driver Version: 570.133.07     CUDA Version: 12.8     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|   0  Tesla V100-SXM2-32GB           Off |   00000000:86:00.0 Off |                    0 |
| N/A   34C    P0             44W /  300W |      10MiB /  32768MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                

In [None]:
device = torch.device('cpu')
torch.manual_seed(42)

if torch.cuda.is_available():
  device = torch.device('cuda:0')
  torch.cuda.manual_seed_all(42)

In [None]:

"""
순서
어텐션
MLP(피드포워드)
인코더 블록
인코더
"""
"""
나머지 주석은 나중에
"""

class MultiheadSelfAttention(nn.Module):

  def __init__(self, d_model: int, num_heads: int, dropout_rate: float=0.1):
    super().__init__()
    self.num_heads = num_heads # 헤드의 수를 num_heads에 저장
    self.d_model = d_model # D차원을 d_model에 저장
    self.head_dim = d_model // self.num_heads # d차원을 헤드의 수로 나누어서 각 헤드의 차원을 구함. 이를 위해 D차원은 num_heads로 나누어 떨어져야 함

    self.query = nn.Linear(d_model, d_model) # 아래의 선형연산을 위한 선형레이어들
    self.key = nn.Linear(d_model, d_model)
    self.value = nn.Linear(d_model, d_model)

    self.softmax = nn.Softmax(dim=-1) # 소프트맥스

    self.dropout = nn.Dropout(p=dropout_rate) # 드롭아웃, 논문에 나온 0.1이 기본값

    self.WO = nn.Linear(d_model, d_model) # W^O차원의 가중치 부분

  def forward(self, inputs_q, inputs_k=None, inputs_v=None, mask=None):

    """
    입력 받는 텐선 inputs_q는 [batch_sizes..., length, features]의 형태로 배치 사이즈, 길이(N+1), D차원(768)으로 이루어져있음.
    """

    if inputs_k is None:
      inputs_k = inputs_q # K나 V에 해당하는 텐서를 받지 못하였을 때, Q텐서로 K, V텐서를 만들겠다는 의미로 같은 토큰에서 Q, K, V를 뽑아내는 것
    if inputs_v is None:
      inputs_v = inputs_k

    batch, len, d_size = inputs_q.shape

    Q = self.query(inputs_q)  # W^q의 역할로 입력된 토큰에 가중치를 부여하는 선형연산
    K = self.key(inputs_k)    # W^k의 역할로 입력된 토큰에 가중치를 부여하는 선형연산
    V = self.value(inputs_v)  # W^v의 역할로 입력된 토큰에 가중치를 부여하는 선형연산

    Q = Q.view(batch, len, self.num_heads, self.head_dim)  # 텐서 Q에 대해서 마지막 차원에 대해 변환을 하여 [배치 사이즈, 길이, 헤드 수, 헤드 차원]으로 변환함
    K = K.view(batch, len, self.num_heads, self.head_dim)  # 이유는 멀티 헤드 셀프 어텐션을 위해 헤드의 차원을 나누어서 헤드별로 어텐션이 될 수 있게 만듬
    V = V.view(batch, len, self.num_heads, self.head_dim)

    atten = torch.einsum("bqhd,bkhd->bhqk", Q, K)
    # Q와 K차원이 [배치사이즈, 길이, 헤드수, 헤드차원]으로 되어 있는데 이를 Q와 K^T의 내적을 배치와 헤드는 고정시켜두고
    # q,d 와 k, d에 대해 d에 대해 내적하여 [배치사이즈, 헤드수, q길이, k길이] 형태로 만드는 것
    # 이는 Q에 대한 K의 유사도가 됨
    atten /= torch.sqrt(torch.tensor(self.head_dim))
    # d_k 차원을 어텐션 스코어를 루트 d_k(헤드 차원)로 나누어 스케일 내적을 마무리

    if mask is not None:
      atten = torch.where(mask == 0, torch.tensor(-1e9).to(atten.device), atten)
    # mask가 1 or 0인거에 따라서 0이면 -1e9(-10^9)을 넣어주고 아니면 원래 값을 넣어줌
    # 이후 소프트맥스할 때 마스킹된 부분이 0언저리가 됨.

    atten_weights = self.softmax(atten)
    # 이후 어텐션 스코어에 소프트맥스를 해서 어텐션 분포를 얻음
    atten_weights = self.dropout(atten_weights)

    atten_output = torch.einsum("bhqk,bkhd->bqhd", atten_weights, V)
    # 이번에는 위에서 구한 [배치사이즈, 헤드수, q길이, k길이]형태의 어텐션 분포와 [배치 사이즈, k길이, 헤드 수, 헤드 차원]형태의 value 텐서를 곱하는데
    # k길이에 대해 내적하여 [배치 사이즈, q길이, 헤드수, 헤드 차원] 형태로 만듬
    # 이는 Q에 대한 K의 유사도에 맞추어 K에 대한 실제 값인 헤드 차원 부분이 내적되면서 벨류의 텐서에 어텐션 분포가 반영이 된다

    atten_output = atten_output.reshape(batch, len, self.d_model)
    # 다시 [배치사이즈, 길이, D차원] 형태로 변환함. 다시 합치는 Concat부분
    output = self.WO(atten_output)
    # 변환한 후 가중치 행렬 W^O를 취하기 위해서 학습 가능한 가중치를 레이어로 부여함.
    # 위의 reshape로 합치는 부분과 이 가중치 레이어가 가중치 행렬 W^O의 역할을 함.

    return output

class FFNBlock(nn.Module):

  """
  피드 포워드 네트워크를 위한 블록.
  리니어 gelu 드롭아웃 리니어 드롭아웃의 형태로 원본의 순서를 따라함
  ViT 논문에사 relu대신 gelu를 썼가에 재현하고자 함
  """

  def __init__(self, d_model: int, mlp_dim: int, dropout_rate: float=0.1):
    super().__init__()
    self.d_model = d_model # 모델 차원
    self.mlp_dim = mlp_dim # MLP(FFN)에서 쓰는 차원
    self.linear1 = nn.Linear(d_model, mlp_dim)
    self.linear2 = nn.Linear(mlp_dim, d_model)
    self.gelu = nn.GELU() # 논문에서 쓴 GELU
    self.dropout = nn.Dropout(p=dropout_rate) # 논문에서 쓴 드롭아웃

  def forward(self, x):
    x = self.linear1(x)
    x = self.gelu(x)
    x = self.dropout(x)
    x = self.linear2(x)
    y = self.dropout(x)

    return y

class EncoderBlock(nn.Module):
  """
    해야할 거: LN갈기고, MSA갈기고 skip-connection갈기기
    논문의 순서대로 인풋을 레이어정규화 이후에 MSA하고 이후 나온 값을 다시 인풋과 더하는 스킵 커넥션을 함
    이후 똑같이 정규화, 피드포워드, 스킵커넥션의 순서이다.
  """
  def __init__(self, d_model: int, num_heads: int, mlp_dim: int, dropout_rate: float=0.1):
    super().__init__()
    self.num_heads = num_heads
    self.d_model = d_model
    self.mlp_dim = mlp_dim
    self.LN = nn.LayerNorm(d_model)
    self.LN2 = nn.LayerNorm(d_model)
    self.MSA = MultiheadSelfAttention(d_model=d_model, num_heads=num_heads, dropout_rate=dropout_rate)
    self.FFN = FFNBlock(d_model=d_model, mlp_dim=mlp_dim, dropout_rate=dropout_rate)
    self.dropout = nn.Dropout(p=dropout_rate)



  def forward(self, inputs):
    z = self.LN(inputs) # LN(레이어 정규화)적용
    z = self.MSA(z) # MSA(멀티헤드셀프어텐션)적용
    z = self.dropout(z) # 드롭아웃
    z = z + inputs # 스킵커넥션 적용

    ffn = self.LN2(z) # LN적용
    ffn = self.FFN(ffn) # FFN적용
    # 이후 스킵커넥션을 적용한 값을 반환
    return z+ffn

class Encoder(nn.Module):

  """
  해야할 거: 포지셔널 임베딩 한 거를 L개의 레이어에 넣기
  L개의 레이어에 넣기 위해서는 L개의 모듀을 먼저 선언해야함
  원본 논문의 코드는 flax.linen을 썼는데 가장 큰 차이점은 torch는 객체로 되어있어 객체가 __init__에서 선언되어
  있어야 이후 forward가 작동 가능하고 linen은 함수로 되어 있어서 @nn.compact을 쓰고 __call__ 부분에 쓰고싶은 함수를 쓰면 되는 형식임
  이걸 말한 이유는 원본에서는 그냥 for문을 썼는데 똑같이 하면 같은 블록(레이어)이 반복되며 나오는거라 L개의 디코더블록이 아니라
  디코더 블록이 L번 학습을 진행하는 것임. 이걸 해결하기위해 nn.ModuleList를 써서 동적으로 묘듈을 할당해서 L개의 디코더블록을 만들 수 있음
  """
  def __init__(self, d_model: int, num_layers: int, num_heads: int, mlp_dim: int, dropout_rate: float=0.1):
    super().__init__()
    self.num_layers = num_layers
    self.num_heads = num_heads
    self.d_model = d_model
    self.mlp_dim = mlp_dim
    self.LN = nn.LayerNorm(d_model)
    self.layers = nn.ModuleList()
    for i in range(num_layers):
      self.layers.append(EncoderBlock(d_model=d_model, num_heads=num_heads, mlp_dim=mlp_dim, dropout_rate=dropout_rate))
    # num_layers만큼의 인코더층이 있어야 하는데, 반복되는 구조를 선언하기 위해 ModuleList()를 활용하여 num_layers만큼의 인코더 블록을 쌓음

  def forward(self, x):
    for layer in self.layers:
      x = layer(x)
    # 레이어를 레이어스에서 가져와서 실행
    # CLS = x[:, 0]
    # CLS = self.LN(CLS)
    y = x
    return y

# Patch Embedding & Positional Embedding

class PatchEmbed(nn.Module):
    def __init__(self, img_size=224, patch_size=16, in_chans=3, embed_dim=768):
        super().__init__()
        assert img_size % patch_size == 0 # 이미지 사이즈가 나누어 떨어지는지 한번더 체크
        self.img_size = img_size
        self.patch_size = patch_size
        self.grid_size = img_size // patch_size
        self.num_patches = self.grid_size * self.grid_size

        # Conv2d를 활용하면 linear projection 과정까지 함께 할 수 있음
        self.proj = nn.Conv2d(in_chans, embed_dim,
                              kernel_size=patch_size, stride=patch_size)

        # cls토큰이랑 위치 벡터 정의
        self.cls_token = nn.Parameter(torch.zeros(1, 1, embed_dim))
        self.pos_embed = nn.Parameter(torch.zeros(1, self.num_patches + 1, embed_dim))
        #self.num_patches + 1인 이유: cls 토큰 더 해줘서


        # cls 토큰이랑 위치 벡터 정규화로 초기와 해줌
        nn.init.trunc_normal_(self.cls_token, std=0.02)
        nn.init.trunc_normal_(self.pos_embed, std=0.02)

    def forward(self, x):


        x = self.proj(x)
        x = x.flatten(2).transpose(1, 2)

        # CLS 토큰 붙이기
        B = x.shape[0]
        cls = self.cls_token.expand(B, -1, -1)
        x = torch.cat([cls, x], dim=1)

        # 위치 임베딩 더하기
        x = x + self.pos_embed
        return x  # tokens

class MLPHead(nn.Module):
    def __init__(self, in_dim, hid_dim, num_classes, drop=0.0, use_ln=True):
        super().__init__()
        self.pre = nn.LayerNorm(in_dim) if use_ln else nn.Identity()
        self.fc1 = nn.Linear(in_dim, hid_dim)
        self.act = nn.Tanh()            # 논문에서 종종 쓰던 Tanh representation
        self.drop = nn.Dropout(drop)
        self.fc2 = nn.Linear(hid_dim, num_classes)

    def forward(self, x):                # x: [CLS] (B, D)
        x = self.pre(x)
        x = self.fc1(x)
        x = self.act(x)
        x = self.drop(x)
        x = self.fc2(x)
        return x

class ViTClassifier(nn.Module):
    def __init__(self, img_size=224, patch_size=16, in_chans=3,
                 embed_dim=768, depth=12, num_heads=12, mlp_ratio=4.0,
                 num_classes=1000, attn_drop=0.0, drop=0.0, mlp_dim=3072):
        super().__init__()
        self.patch_embed = PatchEmbed(img_size, patch_size, in_chans, embed_dim)
        self.encoder     =  Encoder(embed_dim, depth, num_heads, mlp_dim, dropout_rate=drop)
        self.head = MLPHead(in_dim=embed_dim, hid_dim=embed_dim, num_classes=num_classes, drop=0.1)


    def forward(self, x):                          # x: (B,3,H,W)  ex) (B,3,224,224)
        tokens = self.patch_embed(x)               # (B, N+1, D)
        hidden_state = self.encoder(tokens)             # (B, N+1, D)
        # print(hidden_state.shape)
        cls = hidden_state[:, 0]
        logits = self.head(cls)                    # (B, num_classes)
        return logits ,cls, hidden_state

In [None]:
train = datasets.OxfordIIITPet('./data', split="trainval", download=False,
                       transform=transforms.Compose([transforms.TrivialAugmentWide(),
                                                     transforms.Resize((224, 224)),
                                                     transforms.ToTensor()]))
test = datasets.OxfordIIITPet('./data', split="test", download=False,
                       transform=transforms.Compose([transforms.Resize((224, 224)),
                                                     transforms.ToTensor()]))

In [None]:
train

Dataset OxfordIIITPet
    Number of datapoints: 3680
    Root location: ./data
    StandardTransform
Transform: Compose(
               TrivialAugmentWide(num_magnitude_bins=31, interpolation=InterpolationMode.NEAREST, fill=None)
               Resize(size=(224, 224), interpolation=bilinear, max_size=None, antialias=True)
               ToTensor()
           )

In [None]:
model=ViTClassifier(img_size=224, num_classes=37, drop=0.1).to(device)

In [None]:
# 데이터 초기화
learning_rate = 3e-3
n_epochs = 500
batch_size = 64
print_interval = 1
early_stop = 100
lowest_loss = np.inf
lowest_epoch = np.inf

In [None]:
# 데이터 로더 생성
# shuffle: 데이터를 섞을지 여부
# drop_last: 배치크기로 분리하면 마지막 배치는 크기가 맞지 않을 수 있어서, 그 때 제외시킬지 여부 설정
train_loader = torch.utils.data.DataLoader(dataset=train, batch_size=batch_size, shuffle=True, drop_last=True)
test_loader = torch.utils.data.DataLoader(dataset=test, batch_size=batch_size, shuffle=True, drop_last=True)

# 총 배치의 수 출력: batch_size를 100으로 설정했으므로 총 데이터가 몇 개 있는지 확인
print(f'훈련 데이터의 총 배치 수: {len(train_loader)}')
print(f'테스트 데이터의 총 배치 수: {len(test_loader)}')

훈련 데이터의 총 배치 수: 57
테스트 데이터의 총 배치 수: 57


In [None]:
optimizer = optim.Adam(model.parameters(), lr = learning_rate, betas=(0.9, 0.999), weight_decay=0.01)
scheduler = optim.lr_scheduler.CosineAnnealingWarmRestarts(optimizer, T_0=10, T_mult=2, eta_min=3e-6)

loss_func = nn.CrossEntropyLoss()

In [None]:
now = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")

In [None]:
with open(f'learning_history_64_KD_{now}.txt', 'w') as f:
    f.write('epoch train_loss valid_loss train_acc valid_acc \n')

In [None]:
# checkpoint = None
model_path = './model/last_model_64batch_KD.pth'
checkpoint = torch.load(model_path)

In [None]:
from transformers import AutoImageProcessor
from transformers import TrainingArguments, Trainer
from transformers import AutoModelForImageClassification
from transformers import AutoFeatureExtractor
from transformers import DefaultDataCollator

repo_id = 'google/vit-base-patch16-224-in21k'
google_vit_path = './google_model'
processor = AutoImageProcessor.from_pretrained(repo_id, cache_dir=google_vit_path)
feature_extractor = AutoFeatureExtractor.from_pretrained(repo_id, cache_dir=google_vit_path)
teacher = AutoModelForImageClassification.from_pretrained(repo_id, cache_dir=google_vit_path).to(device)

Fast image processor class <class 'transformers.models.vit.image_processing_vit_fast.ViTImageProcessorFast'> is available for this model. Using slow image processor class. To use the fast image processor class set `use_fast=True`.
Some weights of ViTForImageClassification were not initialized from the model checkpoint at google/vit-base-patch16-224-in21k and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


In [None]:
teacher.eval()
for p in teacher.parameters():
    p.requires_grad = False

In [None]:
lambda_kd = 0.7

In [None]:
train_acc_history, valid_acc_history = [], []
train_loss_history, valid_loss_history= [], []

best_model = None
if checkpoint is not None:
  model.load_state_dict(checkpoint)

for i in tqdm(range(n_epochs)):
  model.train()
  train_acc, valid_acc, train_loss, valid_loss = 0, 0, 0, 0
  pred_y = []

  # 배치단위로 데이터를 읽어오기 때문에
  for X_train, y_train in train_loader:
    # 데이터를 GPU로 이동시켜 연산 진행
    X_train = X_train.to(device)
    y_train = y_train.to(device)

    optimizer.zero_grad()
    pred_y_i, student_cls, _ = model(X_train)
    st_loss = loss_func(pred_y_i, y_train)

    with torch.no_grad():
      inputs = feature_extractor(images=X_train, return_tensors="pt", do_rescale=False).to(device)
      teacher_outputs = teacher(**inputs, output_hidden_states=True)
      teacher_cls = teacher_outputs.hidden_states[-1][:, 0]

    # 정확도 계산
    # 행을 기준으로 (dim=1)으로 최대 예측값의 인덱스(숫자 라벨값)와 원래 라벨값의 일치여부 반환
    pred_correct = torch.argmax(pred_y_i,dim=1) == y_train
    # pred_correct는 (1, 0)으로 이루어진 집합데이터 -> 평균 구하기
    # 텐서에서 값만 가져오겠다 -> item() : tensor(0.9881, device='cuda:0')
    acc = pred_correct.float().mean().item()

    feature_loss = F.mse_loss(student_cls, teacher_cls)

    loss = (1 - lambda_kd) * st_loss + lambda_kd * feature_loss

    loss.backward()
    optimizer.step()

    train_acc += float(acc)
    train_loss += loss.item()

  scheduler.step()

  train_acc = train_acc / len(train_loader)
  train_loss = train_loss / len(train_loader)

  model.eval()
  with torch.no_grad():
    valid_acc, valid_loss = 0, 0
    for X_test, y_test in test_loader:
      X_test = X_test.to(device)
      y_test = y_test.to(device)

      pred_y_i, student_cls, _  = model(X_test)
      loss = loss_func(pred_y_i, y_test)
      pred_correct = torch.argmax(pred_y_i, dim=1) == y_test
      acc = pred_correct.float().mean().item()

      valid_acc += float(acc)
      valid_loss += loss.item()

      pred_y.append(pred_y_i)

  valid_acc = valid_acc / len(test_loader)
  valid_loss = valid_loss / len(test_loader)

  train_acc_history.append(train_acc)
  valid_acc_history.append(valid_acc)
  train_loss_history.append(train_loss)
  valid_loss_history.append(valid_loss)

  # 학습진행 확인
  if (i+1) % print_interval == 0:
    print(f'{i+1}에포크에서 훈련손실: {train_loss: .4f}| 검증손실: {valid_loss: .4f}| 훈련정확도: {train_acc: .4f}| 검증정확도: {valid_acc:.4f}')
    with open(f'learning_history_64_KD_{now}.txt', 'a') as f:
      f.write(f'{i+1} {train_loss: .4f} {valid_loss: .4f} {train_acc: .4f} {valid_acc:.4f} \n')

  # 마지막 모델 저장/ 이어서 훈련 하기 위한 용도
  torch.save(model.state_dict(), './model/last_model_64batch_KD.pth')

  # 조기 학습 중단
  if valid_loss < lowest_loss:
    lowest_loss = valid_loss
    lowest_epoch = i

    best_model = deepcopy(model.state_dict())
  else:
    if i>0 and early_stop+lowest_epoch<i:
      # print(f'{early_stop}에포크 동안 성능이 개선되지 않았으므로 훈련을 종료함')
      now = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
      torch.save(model.state_dict(), f'./model/best_model{now}.pth')
      lowest_epoch = i

print(f'{lowest_epoch+1}에포크에서 가장 낮은 검증 손실값: {lowest_loss: .6f}')

# 베스트 모델의 가중치 로드
model.load_state_dict(best_model)


  0%|                                                                                           | 0/500 [00:00<?, ?it/s]

1에포크에서 훈련손실:  23.6470| 검증손실:  3.6109| 훈련정확도:  0.0252| 검증정확도: 0.0274


  0%|▏                                                                              | 1/500 [04:32<37:47:30, 272.65s/it]

2에포크에서 훈련손실:  23.9073| 검증손실:  3.6109| 훈련정확도:  0.0225| 검증정확도: 0.0269


  0%|▎                                                                              | 2/500 [09:01<37:26:49, 270.70s/it]

3에포크에서 훈련손실:  23.6426| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0266


  1%|▍                                                                              | 3/500 [13:32<37:23:17, 270.82s/it]

4에포크에서 훈련손실:  23.7568| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0271


  1%|▋                                                                              | 4/500 [18:03<37:17:59, 270.72s/it]

5에포크에서 훈련손실:  23.6501| 검증손실:  3.6109| 훈련정확도:  0.0200| 검증정확도: 0.0274


  1%|▊                                                                              | 5/500 [22:33<37:11:30, 270.49s/it]

6에포크에서 훈련손실:  23.7528| 검증손실:  3.6109| 훈련정확도:  0.0244| 검증정확도: 0.0274


  1%|▉                                                                              | 6/500 [27:05<37:10:02, 270.85s/it]

7에포크에서 훈련손실:  23.6208| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0274


  1%|█                                                                              | 7/500 [31:36<37:05:37, 270.87s/it]

8에포크에서 훈련손실:  23.8726| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0274


  2%|█▎                                                                             | 8/500 [36:06<36:59:40, 270.69s/it]

9에포크에서 훈련손실:  23.5057| 검증손실:  3.6109| 훈련정확도:  0.0252| 검증정확도: 0.0266


  2%|█▍                                                                             | 9/500 [40:36<36:54:53, 270.66s/it]

10에포크에서 훈련손실:  23.6090| 검증손실:  3.6109| 훈련정확도:  0.0271| 검증정확도: 0.0274


  2%|█▌                                                                            | 10/500 [45:06<36:48:10, 270.39s/it]

11에포크에서 훈련손실:  23.7277| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0271


  2%|█▋                                                                            | 11/500 [49:37<36:45:44, 270.64s/it]

12에포크에서 훈련손실:  23.8509| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0271


  2%|█▊                                                                            | 12/500 [54:09<36:42:20, 270.78s/it]

13에포크에서 훈련손실:  23.7096| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0274


  3%|██                                                                            | 13/500 [58:39<36:37:41, 270.76s/it]

14에포크에서 훈련손실:  23.7754| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0271


  3%|██▏                                                                         | 14/500 [1:03:09<36:31:47, 270.59s/it]

15에포크에서 훈련손실:  23.6532| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0274


  3%|██▎                                                                         | 15/500 [1:07:40<36:27:59, 270.68s/it]

16에포크에서 훈련손실:  23.6395| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0266


  3%|██▍                                                                         | 16/500 [1:12:09<36:18:13, 270.03s/it]

17에포크에서 훈련손실:  23.7334| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0274


  3%|██▌                                                                         | 17/500 [1:16:40<36:16:59, 270.43s/it]

18에포크에서 훈련손실:  23.4877| 검증손실:  3.6109| 훈련정확도:  0.0200| 검증정확도: 0.0274


  4%|██▋                                                                         | 18/500 [1:21:11<36:12:10, 270.40s/it]

19에포크에서 훈련손실:  23.5280| 검증손실:  3.6109| 훈련정확도:  0.0175| 검증정확도: 0.0271


  4%|██▉                                                                         | 19/500 [1:25:49<36:26:27, 272.74s/it]

20에포크에서 훈련손실:  23.7920| 검증손실:  3.6109| 훈련정확도:  0.0249| 검증정확도: 0.0271


  4%|███                                                                         | 20/500 [1:30:18<36:14:41, 271.84s/it]

21에포크에서 훈련손실:  23.6416| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0269


  4%|███▏                                                                        | 21/500 [1:34:50<36:09:28, 271.75s/it]

22에포크에서 훈련손실:  23.7611| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0271


  4%|███▎                                                                        | 22/500 [1:39:27<36:18:15, 273.42s/it]

23에포크에서 훈련손실:  23.6578| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0269


  5%|███▍                                                                        | 23/500 [1:44:06<36:27:12, 275.12s/it]

24에포크에서 훈련손실:  23.5294| 검증손실:  3.6109| 훈련정확도:  0.0233| 검증정확도: 0.0274


  5%|███▋                                                                        | 24/500 [1:48:44<36:27:34, 275.74s/it]

25에포크에서 훈련손실:  23.5574| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0266


  5%|███▊                                                                        | 25/500 [1:53:21<36:26:44, 276.22s/it]

26에포크에서 훈련손실:  23.7816| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0269


  5%|███▉                                                                        | 26/500 [1:57:51<36:06:25, 274.23s/it]

27에포크에서 훈련손실:  23.7668| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0271


  5%|████                                                                        | 27/500 [2:02:18<35:45:10, 272.11s/it]

28에포크에서 훈련손실:  23.5604| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0269


  6%|████▎                                                                       | 28/500 [2:06:45<35:28:03, 270.52s/it]

29에포크에서 훈련손실:  23.3847| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0274


  6%|████▍                                                                       | 29/500 [2:11:12<35:17:15, 269.71s/it]

30에포크에서 훈련손실:  23.6255| 검증손실:  3.6109| 훈련정확도:  0.0271| 검증정확도: 0.0271


  6%|████▌                                                                       | 30/500 [2:15:43<35:13:54, 269.86s/it]

31에포크에서 훈련손실:  23.6875| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0269


  6%|████▋                                                                       | 31/500 [2:20:13<35:11:52, 270.18s/it]

32에포크에서 훈련손실:  23.8030| 검증손실:  3.6109| 훈련정확도:  0.0181| 검증정확도: 0.0274


  6%|████▊                                                                       | 32/500 [2:24:43<35:04:47, 269.84s/it]

33에포크에서 훈련손실:  23.7355| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0274


  7%|█████                                                                       | 33/500 [2:29:10<34:54:19, 269.08s/it]

34에포크에서 훈련손실:  23.7811| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0271


  7%|█████▏                                                                      | 34/500 [2:33:33<34:36:52, 267.41s/it]

35에포크에서 훈련손실:  23.7384| 검증손실:  3.6109| 훈련정확도:  0.0249| 검증정확도: 0.0274


  7%|█████▎                                                                      | 35/500 [2:38:04<34:39:14, 268.29s/it]

36에포크에서 훈련손실:  24.0118| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0274


  7%|█████▍                                                                      | 36/500 [2:42:35<34:42:22, 269.27s/it]

37에포크에서 훈련손실:  23.7215| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0271


  7%|█████▌                                                                      | 37/500 [2:47:09<34:48:32, 270.65s/it]

38에포크에서 훈련손실:  23.8085| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0274


  8%|█████▊                                                                      | 38/500 [2:51:42<34:48:47, 271.27s/it]

39에포크에서 훈련손실:  23.6565| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0269


  8%|█████▉                                                                      | 39/500 [2:56:15<34:49:39, 271.97s/it]

40에포크에서 훈련손실:  23.7741| 검증손실:  3.6109| 훈련정확도:  0.0200| 검증정확도: 0.0274


  8%|██████                                                                      | 40/500 [3:01:23<36:07:43, 282.75s/it]

41에포크에서 훈련손실:  23.4791| 검증손실:  3.6109| 훈련정확도:  0.0192| 검증정확도: 0.0274


  8%|██████▏                                                                     | 41/500 [3:06:26<36:47:44, 288.59s/it]

42에포크에서 훈련손실:  23.7471| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0271


  8%|██████▍                                                                     | 42/500 [3:11:02<36:14:53, 284.92s/it]

43에포크에서 훈련손실:  23.6445| 검증손실:  3.6109| 훈련정확도:  0.0192| 검증정확도: 0.0271


  9%|██████▌                                                                     | 43/500 [3:15:32<35:37:15, 280.60s/it]

44에포크에서 훈련손실:  23.5864| 검증손실:  3.6109| 훈련정확도:  0.0238| 검증정확도: 0.0274


  9%|██████▋                                                                     | 44/500 [3:20:05<35:14:28, 278.22s/it]

45에포크에서 훈련손실:  23.6062| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0271


  9%|██████▊                                                                     | 45/500 [3:24:42<35:07:11, 277.87s/it]

46에포크에서 훈련손실:  23.7661| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0271


  9%|██████▉                                                                     | 46/500 [3:29:53<36:17:05, 287.72s/it]

47에포크에서 훈련손실:  23.6851| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0271


  9%|███████▏                                                                    | 47/500 [3:35:10<37:18:09, 296.45s/it]

48에포크에서 훈련손실:  23.6420| 검증손실:  3.6109| 훈련정확도:  0.0189| 검증정확도: 0.0271


 10%|███████▎                                                                    | 48/500 [3:40:28<38:03:05, 303.07s/it]

49에포크에서 훈련손실:  23.6443| 검증손실:  3.6109| 훈련정확도:  0.0230| 검증정확도: 0.0274


 10%|███████▍                                                                    | 49/500 [3:45:49<38:38:50, 308.49s/it]

50에포크에서 훈련손실:  23.5596| 검증손실:  3.6109| 훈련정확도:  0.0241| 검증정확도: 0.0274


 10%|███████▌                                                                    | 50/500 [3:50:20<37:07:29, 297.00s/it]

51에포크에서 훈련손실:  23.6914| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0274


 10%|███████▊                                                                    | 51/500 [3:55:26<37:23:17, 299.77s/it]

52에포크에서 훈련손실:  23.6959| 검증손실:  3.6109| 훈련정확도:  0.0241| 검증정확도: 0.0274


 10%|███████▉                                                                    | 52/500 [4:00:13<36:50:04, 295.99s/it]

53에포크에서 훈련손실:  23.6766| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0271


 11%|████████                                                                    | 53/500 [4:04:41<35:42:12, 287.54s/it]

54에포크에서 훈련손실:  23.7633| 검증손실:  3.6109| 훈련정확도:  0.0192| 검증정확도: 0.0271


 11%|████████▏                                                                   | 54/500 [4:09:12<35:00:10, 282.54s/it]

55에포크에서 훈련손실:  23.7221| 검증손실:  3.6109| 훈련정확도:  0.0244| 검증정확도: 0.0271


 11%|████████▎                                                                   | 55/500 [4:13:41<34:26:02, 278.57s/it]

56에포크에서 훈련손실:  23.7921| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0271


 11%|████████▌                                                                   | 56/500 [4:18:10<34:00:16, 275.71s/it]

57에포크에서 훈련손실:  23.5756| 검증손실:  3.6109| 훈련정확도:  0.0192| 검증정확도: 0.0274


 11%|████████▋                                                                   | 57/500 [4:22:40<33:42:03, 273.87s/it]

58에포크에서 훈련손실:  23.5724| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0271


 12%|████████▊                                                                   | 58/500 [4:27:10<33:31:01, 272.99s/it]

59에포크에서 훈련손실:  23.5591| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0274


 12%|████████▉                                                                   | 59/500 [4:31:59<34:01:43, 277.78s/it]

60에포크에서 훈련손실:  23.6593| 검증손실:  3.6109| 훈련정확도:  0.0244| 검증정확도: 0.0274


 12%|█████████                                                                   | 60/500 [4:36:29<33:38:35, 275.26s/it]

61에포크에서 훈련손실:  23.7874| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0274


 12%|█████████▎                                                                  | 61/500 [4:41:14<33:55:25, 278.19s/it]

62에포크에서 훈련손실:  23.4831| 검증손실:  3.6109| 훈련정확도:  0.0200| 검증정확도: 0.0274


 12%|█████████▍                                                                  | 62/500 [4:46:25<35:03:45, 288.19s/it]

63에포크에서 훈련손실:  23.5093| 검증손실:  3.6109| 훈련정확도:  0.0269| 검증정확도: 0.0269


 13%|█████████▌                                                                  | 63/500 [4:51:08<34:46:56, 286.54s/it]

64에포크에서 훈련손실:  23.5556| 검증손실:  3.6109| 훈련정확도:  0.0249| 검증정확도: 0.0271


 13%|█████████▋                                                                  | 64/500 [4:56:00<34:53:34, 288.11s/it]

65에포크에서 훈련손실:  23.4199| 검증손실:  3.6109| 훈련정확도:  0.0271| 검증정확도: 0.0271


 13%|█████████▉                                                                  | 65/500 [5:00:37<34:25:22, 284.88s/it]

66에포크에서 훈련손실:  23.6344| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0271


 13%|██████████                                                                  | 66/500 [5:05:27<34:31:17, 286.35s/it]

67에포크에서 훈련손실:  23.5371| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0269


 13%|██████████▏                                                                 | 67/500 [5:10:05<34:07:28, 283.72s/it]

68에포크에서 훈련손실:  23.5763| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0269


 14%|██████████▎                                                                 | 68/500 [5:14:41<33:47:25, 281.59s/it]

69에포크에서 훈련손실:  23.5409| 검증손실:  3.6109| 훈련정확도:  0.0271| 검증정확도: 0.0271


 14%|██████████▍                                                                 | 69/500 [5:19:11<33:16:58, 278.00s/it]

70에포크에서 훈련손실:  23.6037| 검증손실:  3.6109| 훈련정확도:  0.0271| 검증정확도: 0.0269


 14%|██████████▋                                                                 | 70/500 [5:23:46<33:06:04, 277.13s/it]

71에포크에서 훈련손실:  23.7227| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0274


 14%|██████████▊                                                                 | 71/500 [5:28:27<33:10:45, 278.43s/it]

72에포크에서 훈련손실:  24.0326| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0271


 14%|██████████▉                                                                 | 72/500 [5:33:01<32:56:51, 277.13s/it]

73에포크에서 훈련손실:  23.6945| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0274


 15%|███████████                                                                 | 73/500 [5:37:32<32:38:46, 275.24s/it]

74에포크에서 훈련손실:  23.7520| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0274


 15%|███████████▏                                                                | 74/500 [5:42:38<33:38:06, 284.24s/it]

75에포크에서 훈련손실:  23.7334| 검증손실:  3.6109| 훈련정확도:  0.0233| 검증정확도: 0.0274


 15%|███████████▍                                                                | 75/500 [5:47:16<33:20:39, 282.45s/it]

76에포크에서 훈련손실:  23.6084| 검증손실:  3.6109| 훈련정확도:  0.0189| 검증정확도: 0.0269


 15%|███████████▌                                                                | 76/500 [5:52:13<33:47:39, 286.93s/it]

77에포크에서 훈련손실:  23.6080| 검증손실:  3.6118| 훈련정확도:  0.0214| 검증정확도: 0.0274


 15%|███████████▋                                                                | 77/500 [5:57:14<34:11:29, 290.99s/it]

78에포크에서 훈련손실:  23.5067| 검증손실:  3.6109| 훈련정확도:  0.0203| 검증정확도: 0.0271


 16%|███████████▊                                                                | 78/500 [6:02:16<34:31:08, 294.47s/it]

79에포크에서 훈련손실:  23.6688| 검증손실:  3.6109| 훈련정확도:  0.0241| 검증정확도: 0.0271


 16%|████████████                                                                | 79/500 [6:07:20<34:45:18, 297.19s/it]

80에포크에서 훈련손실:  23.6191| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0271


 16%|████████████▏                                                               | 80/500 [6:11:57<33:58:45, 291.25s/it]

81에포크에서 훈련손실:  23.6281| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0271


 16%|████████████▎                                                               | 81/500 [6:16:57<34:12:53, 293.97s/it]

82에포크에서 훈련손실:  23.8953| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0274


 16%|████████████▍                                                               | 82/500 [6:22:01<34:27:55, 296.83s/it]

83에포크에서 훈련손실:  23.7481| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0271


 17%|████████████▌                                                               | 83/500 [6:26:40<33:45:05, 291.38s/it]

84에포크에서 훈련손실:  23.7681| 검증손실:  3.6109| 훈련정확도:  0.0225| 검증정확도: 0.0274


 17%|████████████▊                                                               | 84/500 [6:31:34<33:46:56, 292.35s/it]

85에포크에서 훈련손실:  23.5619| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0274


 17%|████████████▉                                                               | 85/500 [6:36:04<32:54:18, 285.44s/it]

86에포크에서 훈련손실:  23.7129| 검증손실:  3.6108| 훈련정확도:  0.0192| 검증정확도: 0.0271


 17%|█████████████                                                               | 86/500 [6:40:34<32:17:29, 280.80s/it]

87에포크에서 훈련손실:  23.7175| 검증손실:  3.6109| 훈련정확도:  0.0238| 검증정확도: 0.0271


 17%|█████████████▏                                                              | 87/500 [6:45:02<31:48:21, 277.24s/it]

88에포크에서 훈련손실:  23.6010| 검증손실:  3.6109| 훈련정확도:  0.0225| 검증정확도: 0.0274


 18%|█████████████▍                                                              | 88/500 [6:49:33<31:30:00, 275.24s/it]

89에포크에서 훈련손실:  23.7953| 검증손실:  3.6109| 훈련정확도:  0.0203| 검증정확도: 0.0271


 18%|█████████████▌                                                              | 89/500 [6:54:03<31:14:04, 273.59s/it]

90에포크에서 훈련손실:  23.5255| 검증손실:  3.6109| 훈련정확도:  0.0203| 검증정확도: 0.0274


 18%|█████████████▋                                                              | 90/500 [6:58:33<31:03:09, 272.66s/it]

91에포크에서 훈련손실:  23.6475| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0274


 18%|█████████████▊                                                              | 91/500 [7:03:02<30:51:04, 271.55s/it]

92에포크에서 훈련손실:  23.6437| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0271


 18%|█████████████▉                                                              | 92/500 [7:07:33<30:45:54, 271.46s/it]

93에포크에서 훈련손실:  23.6573| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0269


 19%|██████████████▏                                                             | 93/500 [7:12:01<30:32:34, 270.16s/it]

94에포크에서 훈련손실:  23.7561| 검증손실:  3.6109| 훈련정확도:  0.0255| 검증정확도: 0.0274


 19%|██████████████▎                                                             | 94/500 [7:16:30<30:27:08, 270.02s/it]

95에포크에서 훈련손실:  23.6730| 검증손실:  3.6109| 훈련정확도:  0.0244| 검증정확도: 0.0271


 19%|██████████████▍                                                             | 95/500 [7:21:00<30:22:53, 270.06s/it]

96에포크에서 훈련손실:  23.6672| 검증손실:  3.6109| 훈련정확도:  0.0233| 검증정확도: 0.0271


 19%|██████████████▌                                                             | 96/500 [7:25:30<30:16:39, 269.80s/it]

97에포크에서 훈련손실:  23.5802| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0274


 19%|██████████████▋                                                             | 97/500 [7:30:01<30:15:13, 270.26s/it]

98에포크에서 훈련손실:  23.6660| 검증손실:  3.6109| 훈련정확도:  0.0186| 검증정확도: 0.0271


 20%|██████████████▉                                                             | 98/500 [7:34:31<30:10:41, 270.25s/it]

99에포크에서 훈련손실:  23.6449| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0274


 20%|███████████████                                                             | 99/500 [7:39:00<30:04:00, 269.93s/it]

100에포크에서 훈련손실:  23.6791| 검증손실:  3.6109| 훈련정확도:  0.0233| 검증정확도: 0.0274


 20%|███████████████                                                            | 100/500 [7:43:31<30:00:15, 270.04s/it]

101에포크에서 훈련손실:  23.5290| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0274


 20%|███████████████▏                                                           | 101/500 [7:48:00<29:54:11, 269.80s/it]

102에포크에서 훈련손실:  23.6171| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0274


 20%|███████████████▎                                                           | 102/500 [7:52:29<29:48:32, 269.63s/it]

103에포크에서 훈련손실:  23.8247| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0274


 21%|███████████████▍                                                           | 103/500 [7:57:00<29:46:16, 269.97s/it]

104에포크에서 훈련손실:  23.7027| 검증손실:  3.6109| 훈련정확도:  0.0238| 검증정확도: 0.0274


 21%|███████████████▌                                                           | 104/500 [8:01:31<29:43:01, 270.15s/it]

105에포크에서 훈련손실:  23.5406| 검증손실:  3.6109| 훈련정확도:  0.0164| 검증정확도: 0.0274


 21%|███████████████▊                                                           | 105/500 [8:06:00<29:37:26, 269.99s/it]

106에포크에서 훈련손실:  23.3744| 검증손실:  3.6109| 훈련정확도:  0.0175| 검증정확도: 0.0274


 21%|███████████████▉                                                           | 106/500 [8:10:32<29:37:22, 270.67s/it]

107에포크에서 훈련손실:  23.4926| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0274


 21%|████████████████                                                           | 107/500 [8:15:03<29:33:10, 270.71s/it]

108에포크에서 훈련손실:  23.8681| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0274


 22%|████████████████▏                                                          | 108/500 [8:19:33<29:26:44, 270.42s/it]

109에포크에서 훈련손실:  23.7700| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0274


 22%|████████████████▎                                                          | 109/500 [8:24:01<29:17:16, 269.66s/it]

110에포크에서 훈련손실:  23.6690| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0244


 22%|████████████████▌                                                          | 110/500 [8:28:30<29:12:10, 269.57s/it]

111에포크에서 훈련손실:  23.7582| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0274


 22%|████████████████▋                                                          | 111/500 [8:33:00<29:08:00, 269.62s/it]

112에포크에서 훈련손실:  23.7369| 검증손실:  3.6109| 훈련정확도:  0.0238| 검증정확도: 0.0269


 22%|████████████████▊                                                          | 112/500 [8:37:28<29:01:00, 269.23s/it]

113에포크에서 훈련손실:  23.5802| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0274


 23%|████████████████▉                                                          | 113/500 [8:41:57<28:56:23, 269.21s/it]

114에포크에서 훈련손실:  23.5284| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0274


 23%|█████████████████                                                          | 114/500 [8:46:26<28:50:08, 268.93s/it]

115에포크에서 훈련손실:  23.6250| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0271


 23%|█████████████████▎                                                         | 115/500 [8:50:56<28:47:34, 269.23s/it]

116에포크에서 훈련손실:  23.4808| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0274


 23%|█████████████████▍                                                         | 116/500 [8:55:25<28:43:21, 269.27s/it]

117에포크에서 훈련손실:  23.5189| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0271


 23%|█████████████████▌                                                         | 117/500 [8:59:54<28:39:20, 269.35s/it]

118에포크에서 훈련손실:  23.6860| 검증손실:  3.6109| 훈련정확도:  0.0249| 검증정확도: 0.0274


 24%|█████████████████▋                                                         | 118/500 [9:04:25<28:36:17, 269.57s/it]

119에포크에서 훈련손실:  23.5855| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0271


 24%|█████████████████▊                                                         | 119/500 [9:08:53<28:28:44, 269.09s/it]

120에포크에서 훈련손실:  23.6991| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0271


 24%|██████████████████                                                         | 120/500 [9:13:23<28:27:31, 269.61s/it]

121에포크에서 훈련손실:  23.4963| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0271


 24%|██████████████████▏                                                        | 121/500 [9:17:54<28:25:15, 269.96s/it]

122에포크에서 훈련손실:  23.7235| 검증손실:  3.6109| 훈련정확도:  0.0238| 검증정확도: 0.0274


 24%|██████████████████▎                                                        | 122/500 [9:22:24<28:20:06, 269.86s/it]

123에포크에서 훈련손실:  23.5203| 검증손실:  3.6109| 훈련정확도:  0.0252| 검증정확도: 0.0271


 25%|██████████████████▍                                                        | 123/500 [9:26:53<28:15:11, 269.79s/it]

124에포크에서 훈련손실:  23.6498| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0274


 25%|██████████████████▌                                                        | 124/500 [9:31:23<28:09:52, 269.66s/it]

125에포크에서 훈련손실:  23.5815| 검증손실:  3.6109| 훈련정확도:  0.0263| 검증정확도: 0.0274


 25%|██████████████████▊                                                        | 125/500 [9:35:52<28:04:09, 269.46s/it]

126에포크에서 훈련손실:  23.6260| 검증손실:  3.6109| 훈련정확도:  0.0233| 검증정확도: 0.0274


 25%|██████████████████▉                                                        | 126/500 [9:40:22<28:02:01, 269.84s/it]

127에포크에서 훈련손실:  23.6560| 검증손실:  3.6109| 훈련정확도:  0.0189| 검증정확도: 0.0274


 25%|███████████████████                                                        | 127/500 [9:44:52<27:56:57, 269.75s/it]

128에포크에서 훈련손실:  23.5781| 검증손실:  3.6109| 훈련정확도:  0.0233| 검증정확도: 0.0274


 26%|███████████████████▏                                                       | 128/500 [9:49:23<27:55:00, 270.16s/it]

129에포크에서 훈련손실:  23.6479| 검증손실:  3.6109| 훈련정확도:  0.0249| 검증정확도: 0.0274


 26%|███████████████████▎                                                       | 129/500 [9:53:54<27:52:14, 270.44s/it]

130에포크에서 훈련손실:  23.5201| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0271


 26%|███████████████████▌                                                       | 130/500 [9:58:24<27:45:49, 270.13s/it]

131에포크에서 훈련손실:  23.5552| 검증손실:  3.6109| 훈련정확도:  0.0244| 검증정확도: 0.0274


 26%|███████████████████▍                                                      | 131/500 [10:02:53<27:40:08, 269.94s/it]

132에포크에서 훈련손실:  23.6338| 검증손실:  3.6109| 훈련정확도:  0.0225| 검증정확도: 0.0271


 26%|███████████████████▌                                                      | 132/500 [10:07:24<27:36:29, 270.08s/it]

133에포크에서 훈련손실:  23.5811| 검증손실:  3.6109| 훈련정확도:  0.0230| 검증정확도: 0.0271


 27%|███████████████████▋                                                      | 133/500 [10:11:52<27:29:07, 269.61s/it]

134에포크에서 훈련손실:  23.3671| 검증손실:  3.6109| 훈련정확도:  0.0271| 검증정확도: 0.0274


 27%|███████████████████▊                                                      | 134/500 [10:16:21<27:24:14, 269.55s/it]

135에포크에서 훈련손실:  23.4739| 검증손실:  3.6109| 훈련정확도:  0.0252| 검증정확도: 0.0271


 27%|███████████████████▉                                                      | 135/500 [10:20:51<27:19:09, 269.45s/it]

136에포크에서 훈련손실:  23.7800| 검증손실:  3.6109| 훈련정확도:  0.0200| 검증정확도: 0.0263


 27%|████████████████████▏                                                     | 136/500 [10:25:19<27:12:41, 269.13s/it]

137에포크에서 훈련손실:  23.7889| 검증손실:  3.6109| 훈련정확도:  0.0225| 검증정확도: 0.0274


 27%|████████████████████▎                                                     | 137/500 [10:29:48<27:08:42, 269.21s/it]

138에포크에서 훈련손실:  23.6611| 검증손실:  3.6109| 훈련정확도:  0.0241| 검증정확도: 0.0274


 28%|████████████████████▍                                                     | 138/500 [10:34:18<27:04:58, 269.33s/it]

139에포크에서 훈련손실:  23.6058| 검증손실:  3.6109| 훈련정확도:  0.0241| 검증정확도: 0.0271


 28%|████████████████████▌                                                     | 139/500 [10:38:49<27:03:36, 269.85s/it]

140에포크에서 훈련손실:  23.4522| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0271


 28%|████████████████████▋                                                     | 140/500 [10:43:19<26:59:57, 269.99s/it]

141에포크에서 훈련손실:  23.5055| 검증손실:  3.6109| 훈련정확도:  0.0249| 검증정확도: 0.0274


 28%|████████████████████▊                                                     | 141/500 [10:47:47<26:51:18, 269.30s/it]

142에포크에서 훈련손실:  23.5240| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0274


 28%|█████████████████████                                                     | 142/500 [10:52:17<26:48:25, 269.57s/it]

143에포크에서 훈련손실:  23.6461| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0269


 29%|█████████████████████▏                                                    | 143/500 [10:56:48<26:45:17, 269.80s/it]

144에포크에서 훈련손실:  23.5333| 검증손실:  3.6109| 훈련정확도:  0.0230| 검증정확도: 0.0271


 29%|█████████████████████▎                                                    | 144/500 [11:01:18<26:40:54, 269.82s/it]

145에포크에서 훈련손실:  23.3031| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0269


 29%|█████████████████████▍                                                    | 145/500 [11:05:48<26:38:10, 270.11s/it]

146에포크에서 훈련손실:  23.6967| 검증손실:  3.6109| 훈련정확도:  0.0271| 검증정확도: 0.0269


 29%|█████████████████████▌                                                    | 146/500 [11:10:17<26:31:33, 269.75s/it]

147에포크에서 훈련손실:  23.5599| 검증손실:  3.6109| 훈련정확도:  0.0271| 검증정확도: 0.0271


 29%|█████████████████████▊                                                    | 147/500 [11:14:45<26:24:17, 269.29s/it]

148에포크에서 훈련손실:  23.7312| 검증손실:  3.6109| 훈련정확도:  0.0271| 검증정확도: 0.0271


 30%|█████████████████████▉                                                    | 148/500 [11:19:16<26:21:23, 269.55s/it]

149에포크에서 훈련손실:  23.5302| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0274


 30%|██████████████████████                                                    | 149/500 [11:23:45<26:16:39, 269.51s/it]

150에포크에서 훈련손실:  23.3849| 검증손실:  3.6109| 훈련정확도:  0.0274| 검증정확도: 0.0274


 30%|██████████████████████▏                                                   | 150/500 [11:28:13<26:10:06, 269.16s/it]

151에포크에서 훈련손실:  23.9089| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0266


 30%|██████████████████████▎                                                   | 151/500 [11:32:44<26:08:13, 269.61s/it]

152에포크에서 훈련손실:  24.1634| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0274


 30%|██████████████████████▍                                                   | 152/500 [11:37:13<26:03:21, 269.55s/it]

153에포크에서 훈련손실:  1009.9171| 검증손실:  3.6109| 훈련정확도:  0.0241| 검증정확도: 0.0271


 31%|██████████████████████▋                                                   | 153/500 [11:41:43<25:59:08, 269.59s/it]

154에포크에서 훈련손실:  54.6801| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0269


 31%|██████████████████████▊                                                   | 154/500 [11:46:14<25:57:26, 270.08s/it]

155에포크에서 훈련손실:  26.4085| 검증손실:  3.6113| 훈련정확도:  0.0228| 검증정확도: 0.0266


 31%|██████████████████████▉                                                   | 155/500 [11:50:44<25:53:00, 270.09s/it]

156에포크에서 훈련손실:  25.7649| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0271


 31%|███████████████████████                                                   | 156/500 [11:55:14<25:47:46, 269.96s/it]

157에포크에서 훈련손실:  25.2893| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0244


 31%|███████████████████████▏                                                  | 157/500 [11:59:44<25:42:31, 269.83s/it]

158에포크에서 훈련손실:  24.6689| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0274


 32%|███████████████████████▍                                                  | 158/500 [12:04:14<25:39:39, 270.12s/it]

159에포크에서 훈련손실:  24.5367| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0271


 32%|███████████████████████▌                                                  | 159/500 [12:08:44<25:34:58, 270.08s/it]

160에포크에서 훈련손실:  24.2160| 검증손실:  3.6108| 훈련정확도:  0.0219| 검증정확도: 0.0271


 32%|███████████████████████▋                                                  | 160/500 [12:13:13<25:27:14, 269.51s/it]

161에포크에서 훈련손실:  23.9960| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0274


 32%|███████████████████████▊                                                  | 161/500 [12:17:43<25:24:30, 269.82s/it]

162에포크에서 훈련손실:  24.1215| 검증손실:  3.6109| 훈련정확도:  0.0225| 검증정확도: 0.0266


 32%|███████████████████████▉                                                  | 162/500 [12:22:13<25:20:10, 269.85s/it]

163에포크에서 훈련손실:  24.1673| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0274


 33%|████████████████████████                                                  | 163/500 [12:26:45<25:18:27, 270.35s/it]

164에포크에서 훈련손실:  23.9090| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0274


 33%|████████████████████████▎                                                 | 164/500 [12:31:16<25:15:05, 270.55s/it]

165에포크에서 훈련손실:  24.0801| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0274


 33%|████████████████████████▍                                                 | 165/500 [12:35:45<25:08:53, 270.25s/it]

166에포크에서 훈련손실:  23.9416| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0274


 33%|████████████████████████▌                                                 | 166/500 [12:40:22<25:15:09, 272.18s/it]

167에포크에서 훈련손실:  24.0734| 검증손실:  3.6109| 훈련정확도:  0.0225| 검증정확도: 0.0271


 33%|████████████████████████▋                                                 | 167/500 [12:44:51<25:05:35, 271.28s/it]

168에포크에서 훈련손실:  23.7203| 검증손실:  3.6109| 훈련정확도:  0.0241| 검증정확도: 0.0274


 34%|████████████████████████▊                                                 | 168/500 [12:49:22<25:01:16, 271.32s/it]

169에포크에서 훈련손실:  23.7623| 검증손실:  3.6109| 훈련정확도:  0.0175| 검증정확도: 0.0271


 34%|█████████████████████████                                                 | 169/500 [12:53:53<24:54:47, 270.96s/it]

170에포크에서 훈련손실:  23.9098| 검증손실:  3.6108| 훈련정확도:  0.0217| 검증정확도: 0.0269


 34%|█████████████████████████▏                                                | 170/500 [12:58:21<24:46:02, 270.19s/it]

171에포크에서 훈련손실:  23.8394| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0274


 34%|█████████████████████████▎                                                | 171/500 [13:02:48<24:36:54, 269.35s/it]

172에포크에서 훈련손실:  23.7422| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0266


 34%|█████████████████████████▍                                                | 172/500 [13:07:17<24:30:36, 269.01s/it]

173에포크에서 훈련손실:  23.8027| 검증손실:  3.6109| 훈련정확도:  0.0244| 검증정확도: 0.0271


 35%|█████████████████████████▌                                                | 173/500 [13:11:47<24:28:07, 269.38s/it]

174에포크에서 훈련손실:  23.9489| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0269


 35%|█████████████████████████▊                                                | 174/500 [13:16:16<24:23:05, 269.28s/it]

175에포크에서 훈련손실:  23.7825| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0274


 35%|█████████████████████████▉                                                | 175/500 [13:20:44<24:16:54, 268.97s/it]

176에포크에서 훈련손실:  23.7007| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0271


 35%|██████████████████████████                                                | 176/500 [13:25:12<24:11:16, 268.75s/it]

177에포크에서 훈련손실:  23.7311| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0271


 35%|██████████████████████████▏                                               | 177/500 [13:29:38<24:01:54, 267.85s/it]

178에포크에서 훈련손실:  23.7149| 검증손실:  3.6109| 훈련정확도:  0.0184| 검증정확도: 0.0271


 36%|██████████████████████████▎                                               | 178/500 [13:34:06<23:57:01, 267.77s/it]

179에포크에서 훈련손실:  23.5297| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0271


 36%|██████████████████████████▍                                               | 179/500 [13:38:34<23:53:51, 268.01s/it]

180에포크에서 훈련손실:  23.9009| 검증손실:  3.6109| 훈련정확도:  0.0241| 검증정확도: 0.0274


 36%|██████████████████████████▋                                               | 180/500 [13:43:02<23:49:32, 268.04s/it]

181에포크에서 훈련손실:  23.6897| 검증손실:  3.6109| 훈련정확도:  0.0252| 검증정확도: 0.0274


 36%|██████████████████████████▊                                               | 181/500 [13:47:32<23:48:03, 268.60s/it]

182에포크에서 훈련손실:  23.7841| 검증손실:  3.6109| 훈련정확도:  0.0252| 검증정확도: 0.0274


 36%|██████████████████████████▉                                               | 182/500 [13:52:04<23:47:52, 269.41s/it]

183에포크에서 훈련손실:  23.6806| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0271


 37%|███████████████████████████                                               | 183/500 [13:56:34<23:45:34, 269.83s/it]

184에포크에서 훈련손실:  23.7377| 검증손실:  3.6109| 훈련정확도:  0.0225| 검증정확도: 0.0274


 37%|███████████████████████████▏                                              | 184/500 [14:01:05<23:42:49, 270.16s/it]

185에포크에서 훈련손실:  23.7066| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0274


 37%|███████████████████████████▍                                              | 185/500 [14:05:34<23:36:35, 269.83s/it]

186에포크에서 훈련손실:  23.8365| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0274


 37%|███████████████████████████▌                                              | 186/500 [14:10:05<23:33:35, 270.11s/it]

187에포크에서 훈련손실:  23.6172| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0271


 37%|███████████████████████████▋                                              | 187/500 [14:14:48<23:48:48, 273.89s/it]

188에포크에서 훈련손실:  23.8676| 검증손실:  3.6109| 훈련정확도:  0.0241| 검증정확도: 0.0274


 38%|███████████████████████████▊                                              | 188/500 [14:19:26<23:51:10, 275.23s/it]

189에포크에서 훈련손실:  23.7088| 검증손실:  3.6109| 훈련정확도:  0.0225| 검증정확도: 0.0271


 38%|███████████████████████████▉                                              | 189/500 [14:24:14<24:05:29, 278.87s/it]

190에포크에서 훈련손실:  23.5193| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0274


 38%|████████████████████████████                                              | 190/500 [14:29:06<24:21:29, 282.87s/it]

191에포크에서 훈련손실:  23.6660| 검증손실:  3.6109| 훈련정확도:  0.0233| 검증정확도: 0.0271


 38%|████████████████████████████▎                                             | 191/500 [14:33:50<24:18:59, 283.30s/it]

192에포크에서 훈련손실:  23.7774| 검증손실:  3.6109| 훈련정확도:  0.0186| 검증정확도: 0.0269


 38%|████████████████████████████▍                                             | 192/500 [14:38:20<23:53:36, 279.28s/it]

193에포크에서 훈련손실:  23.5503| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0274


 39%|████████████████████████████▌                                             | 193/500 [14:43:31<24:38:22, 288.93s/it]

194에포크에서 훈련손실:  23.7012| 검증손실:  3.6109| 훈련정확도:  0.0247| 검증정확도: 0.0274


 39%|████████████████████████████▋                                             | 194/500 [14:48:25<24:40:42, 290.33s/it]

195에포크에서 훈련손실:  23.5111| 검증손실:  3.6108| 훈련정확도:  0.0247| 검증정확도: 0.0271


 39%|████████████████████████████▊                                             | 195/500 [14:53:16<24:36:16, 290.41s/it]

196에포크에서 훈련손실:  23.8002| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0274


 39%|█████████████████████████████                                             | 196/500 [14:58:46<25:32:26, 302.45s/it]

197에포크에서 훈련손실:  23.6883| 검증손실:  3.6109| 훈련정확도:  0.0230| 검증정확도: 0.0266


 39%|█████████████████████████████▏                                            | 197/500 [15:03:48<25:26:54, 302.36s/it]

198에포크에서 훈련손실:  23.7156| 검증손실:  3.6109| 훈련정확도:  0.0195| 검증정확도: 0.0241


 40%|█████████████████████████████▎                                            | 198/500 [15:09:02<25:39:07, 305.79s/it]

199에포크에서 훈련손실:  23.8833| 검증손실:  3.6109| 훈련정확도:  0.0238| 검증정확도: 0.0274


 40%|█████████████████████████████▍                                            | 199/500 [15:13:54<25:12:30, 301.50s/it]

200에포크에서 훈련손실:  23.6543| 검증손실:  3.6109| 훈련정확도:  0.0233| 검증정확도: 0.0269


 40%|█████████████████████████████▌                                            | 200/500 [15:19:06<25:23:43, 304.74s/it]

201에포크에서 훈련손실:  23.7774| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0274


 40%|█████████████████████████████▋                                            | 201/500 [15:23:59<25:00:52, 301.18s/it]

202에포크에서 훈련손실:  23.6739| 검증손실:  3.6109| 훈련정확도:  0.0170| 검증정확도: 0.0274


 40%|█████████████████████████████▉                                            | 202/500 [15:29:06<25:04:42, 302.96s/it]

203에포크에서 훈련손실:  23.5993| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0269


 41%|██████████████████████████████                                            | 203/500 [15:34:08<24:59:00, 302.83s/it]

204에포크에서 훈련손실:  23.5333| 검증손실:  3.6109| 훈련정확도:  0.0263| 검증정확도: 0.0274


 41%|██████████████████████████████▏                                           | 204/500 [15:39:18<25:03:40, 304.80s/it]

205에포크에서 훈련손실:  23.4777| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0269


 41%|██████████████████████████████▎                                           | 205/500 [15:44:18<24:52:25, 303.55s/it]

206에포크에서 훈련손실:  23.9581| 검증손실:  3.6109| 훈련정확도:  0.0200| 검증정확도: 0.0269


 41%|██████████████████████████████▍                                           | 206/500 [15:49:37<25:08:50, 307.93s/it]

207에포크에서 훈련손실:  23.8831| 검증손실:  3.6109| 훈련정확도:  0.0175| 검증정확도: 0.0269


 41%|██████████████████████████████▋                                           | 207/500 [15:54:42<24:59:21, 307.03s/it]

208에포크에서 훈련손실:  23.7663| 검증손실:  3.6109| 훈련정확도:  0.0244| 검증정확도: 0.0271


 42%|██████████████████████████████▊                                           | 208/500 [15:59:57<25:06:49, 309.62s/it]

209에포크에서 훈련손실:  23.5183| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0274


 42%|██████████████████████████████▉                                           | 209/500 [16:04:50<24:37:35, 304.66s/it]

210에포크에서 훈련손실:  23.5983| 검증손실:  3.6108| 훈련정확도:  0.0217| 검증정확도: 0.0274


 42%|███████████████████████████████                                           | 210/500 [16:09:20<23:42:17, 294.27s/it]

211에포크에서 훈련손실:  23.7189| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0274


 42%|███████████████████████████████▏                                          | 211/500 [16:13:50<23:02:22, 287.00s/it]

212에포크에서 훈련손실:  23.7472| 검증손실:  3.6109| 훈련정확도:  0.0238| 검증정확도: 0.0266


 42%|███████████████████████████████▍                                          | 212/500 [16:18:20<22:32:15, 281.72s/it]

213에포크에서 훈련손실:  23.7302| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0266


 43%|███████████████████████████████▌                                          | 213/500 [16:22:51<22:12:41, 278.61s/it]

214에포크에서 훈련손실:  23.5921| 검증손실:  3.6109| 훈련정확도:  0.0258| 검증정확도: 0.0274


 43%|███████████████████████████████▋                                          | 214/500 [16:27:34<22:13:56, 279.85s/it]

215에포크에서 훈련손실:  23.6727| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0269


 43%|███████████████████████████████▊                                          | 215/500 [16:32:07<21:59:19, 277.75s/it]

216에포크에서 훈련손실:  23.6750| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0271


 43%|███████████████████████████████▉                                          | 216/500 [16:36:37<21:44:12, 275.54s/it]

217에포크에서 훈련손실:  23.5030| 검증손실:  3.6109| 훈련정확도:  0.0233| 검증정확도: 0.0271


 43%|████████████████████████████████                                          | 217/500 [16:41:07<21:31:30, 273.82s/it]

218에포크에서 훈련손실:  23.5753| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0274


 44%|████████████████████████████████▎                                         | 218/500 [16:45:38<21:22:45, 272.93s/it]

219에포크에서 훈련손실:  23.5769| 검증손실:  3.6109| 훈련정확도:  0.0238| 검증정확도: 0.0244


 44%|████████████████████████████████▍                                         | 219/500 [16:50:09<21:16:26, 272.55s/it]

220에포크에서 훈련손실:  23.6467| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0274


 44%|████████████████████████████████▌                                         | 220/500 [16:54:39<21:07:49, 271.68s/it]

221에포크에서 훈련손실:  23.7655| 검증손실:  3.6109| 훈련정확도:  0.0181| 검증정확도: 0.0266


 44%|████████████████████████████████▋                                         | 221/500 [16:59:10<21:01:45, 271.34s/it]

222에포크에서 훈련손실:  23.5058| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0271


 44%|████████████████████████████████▊                                         | 222/500 [17:03:39<20:54:46, 270.81s/it]

223에포크에서 훈련손실:  23.4884| 검증손실:  3.6109| 훈련정확도:  0.0247| 검증정확도: 0.0241


 45%|█████████████████████████████████                                         | 223/500 [17:08:10<20:50:15, 270.81s/it]

224에포크에서 훈련손실:  23.5949| 검증손실:  3.6109| 훈련정확도:  0.0186| 검증정확도: 0.0274


 45%|█████████████████████████████████▏                                        | 224/500 [17:12:41<20:45:25, 270.74s/it]

225에포크에서 훈련손실:  23.6395| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0269


 45%|█████████████████████████████████▎                                        | 225/500 [17:17:10<20:39:21, 270.40s/it]

226에포크에서 훈련손실:  23.5996| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0271


 45%|█████████████████████████████████▍                                        | 226/500 [17:21:40<20:33:30, 270.11s/it]

227에포크에서 훈련손실:  23.7522| 검증손실:  3.6109| 훈련정확도:  0.0192| 검증정확도: 0.0274


 45%|█████████████████████████████████▌                                        | 227/500 [17:26:09<20:28:10, 269.93s/it]

228에포크에서 훈련손실:  23.8441| 검증손실:  3.6109| 훈련정확도:  0.0203| 검증정확도: 0.0271


 46%|█████████████████████████████████▋                                        | 228/500 [17:30:40<20:25:06, 270.25s/it]

229에포크에서 훈련손실:  23.5782| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0274


 46%|█████████████████████████████████▉                                        | 229/500 [17:35:11<20:21:52, 270.53s/it]

230에포크에서 훈련손실:  23.4747| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0274


 46%|██████████████████████████████████                                        | 230/500 [17:39:41<20:16:48, 270.40s/it]

231에포크에서 훈련손실:  23.5100| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0274


 46%|██████████████████████████████████▏                                       | 231/500 [17:44:12<20:12:25, 270.43s/it]

232에포크에서 훈련손실:  23.5832| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0271


 46%|██████████████████████████████████▎                                       | 232/500 [17:48:42<20:07:37, 270.36s/it]

233에포크에서 훈련손실:  23.7646| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0271


 47%|██████████████████████████████████▍                                       | 233/500 [17:53:11<20:00:38, 269.81s/it]

234에포크에서 훈련손실:  23.4340| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0274


 47%|██████████████████████████████████▋                                       | 234/500 [17:57:40<19:55:03, 269.56s/it]

235에포크에서 훈련손실:  23.6665| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0271


 47%|██████████████████████████████████▊                                       | 235/500 [18:02:12<19:54:12, 270.39s/it]

236에포크에서 훈련손실:  23.6852| 검증손실:  3.6109| 훈련정확도:  0.0186| 검증정확도: 0.0274


 47%|██████████████████████████████████▉                                       | 236/500 [18:06:42<19:48:44, 270.17s/it]

237에포크에서 훈련손실:  23.6065| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0271


 47%|███████████████████████████████████                                       | 237/500 [18:11:11<19:43:27, 269.99s/it]

238에포크에서 훈련손실:  23.5659| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0274


 48%|███████████████████████████████████▏                                      | 238/500 [18:15:42<19:40:10, 270.27s/it]

239에포크에서 훈련손실:  23.4768| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0274


 48%|███████████████████████████████████▎                                      | 239/500 [18:20:13<19:36:11, 270.39s/it]

240에포크에서 훈련손실:  23.6776| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0271


 48%|███████████████████████████████████▌                                      | 240/500 [18:24:43<19:31:54, 270.44s/it]

241에포크에서 훈련손실:  23.7851| 검증손실:  3.6109| 훈련정확도:  0.0230| 검증정확도: 0.0266


 48%|███████████████████████████████████▋                                      | 241/500 [18:29:12<19:25:46, 270.06s/it]

242에포크에서 훈련손실:  23.6750| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0266


 48%|███████████████████████████████████▊                                      | 242/500 [18:33:44<19:23:04, 270.48s/it]

243에포크에서 훈련손실:  23.7898| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0271


 49%|███████████████████████████████████▉                                      | 243/500 [18:38:16<19:21:12, 271.10s/it]

244에포크에서 훈련손실:  23.4253| 검증손실:  3.6109| 훈련정확도:  0.0200| 검증정확도: 0.0271


 49%|████████████████████████████████████                                      | 244/500 [18:42:46<19:15:18, 270.78s/it]

245에포크에서 훈련손실:  23.5910| 검증손실:  3.6109| 훈련정확도:  0.0244| 검증정확도: 0.0274


 49%|████████████████████████████████████▎                                     | 245/500 [18:47:16<19:09:18, 270.43s/it]

246에포크에서 훈련손실:  23.4148| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0271


 49%|████████████████████████████████████▍                                     | 246/500 [18:51:54<19:14:39, 272.76s/it]

247에포크에서 훈련손실:  23.4629| 검증손실:  3.6109| 훈련정확도:  0.0186| 검증정확도: 0.0271


 49%|████████████████████████████████████▌                                     | 247/500 [18:56:54<19:44:35, 280.93s/it]

248에포크에서 훈련손실:  23.6910| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0274


 50%|████████████████████████████████████▋                                     | 248/500 [19:01:44<19:51:07, 283.60s/it]

249에포크에서 훈련손실:  23.6394| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0274


 50%|████████████████████████████████████▊                                     | 249/500 [19:06:30<19:48:52, 284.20s/it]

250에포크에서 훈련손실:  23.5708| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0274


 50%|█████████████████████████████████████                                     | 250/500 [19:11:20<19:51:19, 285.92s/it]

251에포크에서 훈련손실:  23.5605| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0271


 50%|█████████████████████████████████████▏                                    | 251/500 [19:16:13<19:55:50, 288.15s/it]

252에포크에서 훈련손실:  23.5517| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0274


 50%|█████████████████████████████████████▎                                    | 252/500 [19:21:05<19:55:31, 289.24s/it]

253에포크에서 훈련손실:  23.4367| 검증손실:  3.6109| 훈련정확도:  0.0230| 검증정확도: 0.0269


 51%|█████████████████████████████████████▍                                    | 253/500 [19:25:56<19:53:43, 289.98s/it]

254에포크에서 훈련손실:  23.5350| 검증손실:  3.6109| 훈련정확도:  0.0230| 검증정확도: 0.0274


 51%|█████████████████████████████████████▌                                    | 254/500 [19:30:45<19:47:00, 289.51s/it]

255에포크에서 훈련손실:  23.5336| 검증손실:  3.6109| 훈련정확도:  0.0260| 검증정확도: 0.0271


 51%|█████████████████████████████████████▋                                    | 255/500 [19:35:34<19:41:29, 289.35s/it]

256에포크에서 훈련손실:  23.6434| 검증손실:  3.6109| 훈련정확도:  0.0258| 검증정확도: 0.0274


 51%|█████████████████████████████████████▉                                    | 256/500 [19:40:22<19:35:46, 289.12s/it]

257에포크에서 훈련손실:  23.5579| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0269


 51%|██████████████████████████████████████                                    | 257/500 [19:45:13<19:32:52, 289.60s/it]

258에포크에서 훈련손실:  23.6539| 검증손실:  3.6109| 훈련정확도:  0.0197| 검증정확도: 0.0269


 52%|██████████████████████████████████████▏                                   | 258/500 [19:49:43<19:03:56, 283.62s/it]

259에포크에서 훈련손실:  23.4707| 검증손실:  3.6109| 훈련정확도:  0.0219| 검증정확도: 0.0236


 52%|██████████████████████████████████████▎                                   | 259/500 [19:54:12<18:42:06, 279.36s/it]

260에포크에서 훈련손실:  23.7929| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0263


 52%|██████████████████████████████████████▍                                   | 260/500 [19:58:42<18:25:56, 276.49s/it]

261에포크에서 훈련손실:  23.7498| 검증손실:  3.6109| 훈련정확도:  0.0244| 검증정확도: 0.0271


 52%|██████████████████████████████████████▋                                   | 261/500 [20:03:14<18:15:44, 275.08s/it]

262에포크에서 훈련손실:  23.4118| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0241


 52%|██████████████████████████████████████▊                                   | 262/500 [20:07:46<18:07:16, 274.10s/it]

263에포크에서 훈련손실:  23.8408| 검증손실:  3.6109| 훈련정확도:  0.0208| 검증정확도: 0.0274


 53%|██████████████████████████████████████▉                                   | 263/500 [20:12:17<18:00:00, 273.42s/it]

264에포크에서 훈련손실:  23.5278| 검증손실:  3.6109| 훈련정확도:  0.0181| 검증정확도: 0.0274


 53%|███████████████████████████████████████                                   | 264/500 [20:16:49<17:53:10, 272.84s/it]

265에포크에서 훈련손실:  23.6014| 검증손실:  3.6109| 훈련정확도:  0.0228| 검증정확도: 0.0269


 53%|███████████████████████████████████████▏                                  | 265/500 [20:21:17<17:43:16, 271.48s/it]

266에포크에서 훈련손실:  23.4484| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0274


 53%|███████████████████████████████████████▎                                  | 266/500 [20:25:47<17:37:05, 271.05s/it]

267에포크에서 훈련손실:  23.5655| 검증손실:  3.6109| 훈련정확도:  0.0214| 검증정확도: 0.0271


 53%|███████████████████████████████████████▌                                  | 267/500 [20:30:17<17:31:24, 270.75s/it]

268에포크에서 훈련손실:  23.5882| 검증손실:  3.6108| 훈련정확도:  0.0219| 검증정확도: 0.0271


 54%|███████████████████████████████████████▋                                  | 268/500 [20:34:49<17:27:55, 271.01s/it]

269에포크에서 훈련손실:  23.4967| 검증손실:  3.6109| 훈련정확도:  0.0217| 검증정확도: 0.0274


 54%|███████████████████████████████████████▊                                  | 269/500 [20:39:17<17:20:15, 270.20s/it]

270에포크에서 훈련손실:  23.6547| 검증손실:  3.6109| 훈련정확도:  0.0269| 검증정확도: 0.0274


 54%|███████████████████████████████████████▉                                  | 270/500 [20:43:44<17:11:41, 269.14s/it]

271에포크에서 훈련손실:  23.5748| 검증손실:  3.6109| 훈련정확도:  0.0233| 검증정확도: 0.0274


 54%|████████████████████████████████████████                                  | 271/500 [20:48:15<17:09:20, 269.69s/it]

272에포크에서 훈련손실:  23.5892| 검증손실:  3.6109| 훈련정확도:  0.0230| 검증정확도: 0.0274


 54%|████████████████████████████████████████▎                                 | 272/500 [20:52:44<17:03:32, 269.35s/it]

273에포크에서 훈련손실:  23.7003| 검증손실:  3.6109| 훈련정확도:  0.0211| 검증정확도: 0.0271


 55%|████████████████████████████████████████▍                                 | 273/500 [20:57:14<16:59:56, 269.59s/it]

274에포크에서 훈련손실:  23.6002| 검증손실:  3.6109| 훈련정확도:  0.0252| 검증정확도: 0.0271


 55%|████████████████████████████████████████▌                                 | 274/500 [21:01:43<16:55:43, 269.66s/it]

275에포크에서 훈련손실:  23.4043| 검증손실:  3.6109| 훈련정확도:  0.0186| 검증정확도: 0.0274


 55%|████████████████████████████████████████▋                                 | 275/500 [21:06:13<16:51:35, 269.76s/it]

276에포크에서 훈련손실:  23.5561| 검증손실:  3.6109| 훈련정확도:  0.0186| 검증정확도: 0.0269


 55%|████████████████████████████████████████▊                                 | 276/500 [21:10:41<16:45:00, 269.20s/it]

277에포크에서 훈련손실:  23.6043| 검증손실:  3.6109| 훈련정확도:  0.0206| 검증정확도: 0.0274


 55%|████████████████████████████████████████▉                                 | 277/500 [21:15:10<16:40:11, 269.11s/it]

278에포크에서 훈련손실:  23.5283| 검증손실:  3.6109| 훈련정확도:  0.0222| 검증정확도: 0.0274


 56%|█████████████████████████████████████████▏                                | 278/500 [21:19:42<16:39:08, 270.04s/it]

279에포크에서 훈련손실:  23.3589| 검증손실:  3.6109| 훈련정확도:  0.0230| 검증정확도: 0.0274


 56%|█████████████████████████████████████████▎                                | 279/500 [21:24:14<16:36:14, 270.47s/it]

280에포크에서 훈련손실:  23.6427| 검증손실:  3.6109| 훈련정확도:  0.0236| 검증정확도: 0.0274


 56%|█████████████████████████████████████████▍                                | 280/500 [21:28:45<16:32:14, 270.61s/it]

In [None]:
now = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
torch.save(model.state_dict(), f'./model/best_model{now}.pth')