In [1]:
import common

import os
import time
import random

import timm
import torch
import albumentations as A
import pandas as pd
import numpy as np
import torch.nn as nn
from albumentations.pytorch import ToTensorV2
from torch.optim import Adam
from torchvision import transforms
from torch.utils.data import Dataset, DataLoader
from PIL import Image
from tqdm import tqdm
from sklearn.metrics import accuracy_score, f1_score
from sklearn.model_selection import train_test_split

from dotenv import load_dotenv
from datetime import datetime
from zoneinfo import ZoneInfo
import wandb

In [2]:
common.wandb_login_init('SKF_densenet201.tv_in1k')

Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.
[34m[1mwandb[0m: Currently logged in as: [33mkerneld82[0m ([33mkerneld[0m). Use [1m`wandb login --relogin`[0m to force relogin
[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /data/ephemeral/home/.netrc


train_time = SKF_densenet201.tv_in1k


In [3]:
# device
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# data config
data_path = 'datasets_fin/'

# model config
model_name = 'densenet201.tv_in1k' # 'resnet50' 'efficientnet-b0', ...

# training config
trn_img_size = 224
tst_img_size = 224
LR = 1e-3
EPOCHS = 15
FOLDS = 2
BATCH_SIZE = 32
num_workers = 12
augment_ratio = 200

wandb.config.update({
    "learning_rate": LR,
    "architecture": model_name,
    "dataset": "custom-dataset",
    "epochs": EPOCHS,
    "folds": FOLDS,
    "batch_size": BATCH_SIZE,
    "train_image_size": trn_img_size,
    "test_image_size": tst_img_size,
    "num_workers": num_workers,
    'augment_ratio' : augment_ratio,
})

In [4]:
# 시드를 고정합니다.
SEED = 42

common.set_seed(SEED)

In [5]:
device

device(type='cuda')

### Load Data
* 학습, 테스트 데이터셋과 로더를 정의합니다.

In [6]:
# 학습과 검증에 사용할 폴드별 csv 파일들을 먼저 만들기.
# 나중에 이어서 학습하고 싶을때 사용하기 위해서.
common.generate_fold_train_valid_csv_files(SEED, FOLDS)

Fold 1/2, train_idx: <class 'numpy.ndarray'> 867, <class 'numpy.ndarray'> 867
Fold 2/2, train_idx: <class 'numpy.ndarray'> 867, <class 'numpy.ndarray'> 867


In [7]:
for fold in range(FOLDS):
    fold += 1
    print(f"Fold {fold}/{FOLDS}")
    
    supplies = common.get_supplies_for_train_and_valid_with_fold(seed =SEED, 
                                                                 model_name = model_name, 
                                                                 lr = LR,
                                                                 batch_size = BATCH_SIZE, 
                                                                 num_workers = num_workers, 
                                                                 fold = fold, 
                                                                 folds = FOLDS, 
                                                                 augment_ratio = augment_ratio, 
                                                                 trn_img_size = trn_img_size, 
                                                                 tst_img_size = tst_img_size, 
                                                                 device = device)
    
    common.train_with_start_end_epoch(seed = SEED, 
                                      tst_img_size = tst_img_size,
                                      batch_size = BATCH_SIZE,
                                      start_epoch_inclusive = 1, 
                                      end_epoch_exclusive = EPOCHS + 1, 
                                      augment_ratio = augment_ratio,
                                      trn_loader = supplies['trn_loader'], 
                                      val_loader = supplies['val_loader'], 
                                      model = supplies['model'], 
                                      model_name = model_name, 
                                      optimizer = supplies['optimizer'], 
                                      loss_fn = supplies['loss_fn'], 
                                      device = device, 
                                      is_save_model_checkpoint = True, 
                                      is_evaluate_train_valid = True,
                                      fold = fold,
                                      folds = FOLDS)
    

Fold 1/2

epoch: 1
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0050: 100%|██████████| 5419/5419 [11:46<00:00,  7.67it/s]


train_loss: 0.2298
train_acc: 0.9194
train_f1: 0.9194



Evaluating: 100%|██████████| 28/28 [00:05<00:00,  5.46it/s]



final_valid_loss: 0.28552129272845506
final_valid_accuracy: 0.936562860438293
final_valid_f1: 0.935330648258725
valid's error preds count: 55/867, {7: 19, 3: 15, 13: 2, 14: 14, 11: 1, 4: 2, 6: 1, 12: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_1_aug_200_vl_0.2855_va_0.9366_vf1_0.9353_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 2
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0101: 100%|██████████| 5419/5419 [11:40<00:00,  7.73it/s]


train_loss: 0.0707
train_acc: 0.9762
train_f1: 0.9763



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.54it/s]



final_valid_loss: 0.4218326168562011
final_valid_accuracy: 0.9204152249134948
final_valid_f1: 0.9195925991356451
valid's error preds count: 69/867, {13: 8, 11: 6, 7: 16, 3: 22, 12: 3, 4: 9, 14: 4, 6: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_2_aug_200_vl_0.4218_va_0.9204_vf1_0.9196_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 3
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0001: 100%|██████████| 5419/5419 [11:39<00:00,  7.74it/s]


train_loss: 0.0453
train_acc: 0.9847
train_f1: 0.9848



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.48it/s]



final_valid_loss: 0.5926336403936137
final_valid_accuracy: 0.9192618223760092
final_valid_f1: 0.9183400869083718
valid's error preds count: 70/867, {3: 27, 7: 14, 13: 3, 14: 16, 4: 4, 11: 3, 10: 1, 12: 2}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_3_aug_200_vl_0.5926_va_0.9193_vf1_0.9183_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 4
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0082: 100%|██████████| 5419/5419 [11:39<00:00,  7.75it/s]


train_loss: 0.0333
train_acc: 0.9887
train_f1: 0.9888



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.38it/s]



final_valid_loss: 0.49040050328975276
final_valid_accuracy: 0.9342560553633218
final_valid_f1: 0.9335918143226212
valid's error preds count: 57/867, {13: 6, 7: 18, 3: 15, 11: 2, 10: 1, 14: 12, 4: 1, 6: 1, 12: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_4_aug_200_vl_0.4904_va_0.9343_vf1_0.9336_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 5
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0018: 100%|██████████| 5419/5419 [11:39<00:00,  7.75it/s]


train_loss: 0.0265
train_acc: 0.9914
train_f1: 0.9914



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.54it/s]



final_valid_loss: 0.6064529962396981
final_valid_accuracy: 0.936562860438293
final_valid_f1: 0.9348992786643687
valid's error preds count: 55/867, {13: 5, 7: 20, 3: 15, 14: 10, 11: 1, 4: 2, 12: 1, 2: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_5_aug_200_vl_0.6065_va_0.9366_vf1_0.9349_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 6
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0000: 100%|██████████| 5419/5419 [11:38<00:00,  7.75it/s]


train_loss: 0.0209
train_acc: 0.9931
train_f1: 0.9931



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.45it/s]



final_valid_loss: 0.6051699215105535
final_valid_accuracy: 0.9296424452133795
final_valid_f1: 0.9290792812115448
valid's error preds count: 61/867, {13: 6, 7: 15, 3: 21, 14: 10, 10: 1, 11: 1, 4: 5, 6: 1, 12: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_6_aug_200_vl_0.6052_va_0.9296_vf1_0.9291_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 7
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0000: 100%|██████████| 5419/5419 [11:38<00:00,  7.75it/s]


train_loss: 0.0188
train_acc: 0.9936
train_f1: 0.9936



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.56it/s]



final_valid_loss: 0.5543085879471619
final_valid_accuracy: 0.9388696655132641
final_valid_f1: 0.9374028610810572
valid's error preds count: 53/867, {13: 4, 7: 20, 3: 18, 4: 3, 11: 1, 14: 6, 12: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_7_aug_200_vl_0.5543_va_0.9389_vf1_0.9374_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 8
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0005: 100%|██████████| 5419/5419 [11:38<00:00,  7.76it/s]


train_loss: 0.0156
train_acc: 0.9948
train_f1: 0.9948



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.55it/s]



final_valid_loss: 0.6480167778208841
final_valid_accuracy: 0.9331026528258363
final_valid_f1: 0.9315383428126398
valid's error preds count: 58/867, {13: 5, 7: 26, 3: 13, 14: 8, 10: 1, 11: 1, 4: 2, 12: 2}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_8_aug_200_vl_0.6480_va_0.9331_vf1_0.9315_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 9
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0001: 100%|██████████| 5419/5419 [11:38<00:00,  7.75it/s]


train_loss: 0.0136
train_acc: 0.9955
train_f1: 0.9955



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.51it/s]



final_valid_loss: 0.5687257891236835
final_valid_accuracy: 0.9354094579008074
final_valid_f1: 0.9335086911622391
valid's error preds count: 56/867, {13: 5, 7: 20, 3: 18, 4: 4, 14: 6, 11: 2, 12: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_9_aug_200_vl_0.5687_va_0.9354_vf1_0.9335_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 10
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0000: 100%|██████████| 5419/5419 [11:38<00:00,  7.76it/s]


train_loss: 0.0124
train_acc: 0.9959
train_f1: 0.9959



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.54it/s]



final_valid_loss: 0.5849096847565046
final_valid_accuracy: 0.9342560553633218
final_valid_f1: 0.9326384839473758
valid's error preds count: 57/867, {13: 5, 7: 21, 3: 17, 11: 2, 4: 3, 14: 6, 12: 2, 2: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_10_aug_200_vl_0.5849_va_0.9343_vf1_0.9326_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 11
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0001: 100%|██████████| 5419/5419 [11:38<00:00,  7.75it/s]


train_loss: 0.0119
train_acc: 0.9962
train_f1: 0.9962



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.50it/s]



final_valid_loss: 0.5722569321182424
final_valid_accuracy: 0.9411764705882353
final_valid_f1: 0.9400577906445856
valid's error preds count: 51/867, {13: 5, 7: 18, 3: 16, 14: 6, 11: 1, 4: 2, 12: 2, 15: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_11_aug_200_vl_0.5723_va_0.9412_vf1_0.9401_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 12
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0000: 100%|██████████| 5419/5419 [11:38<00:00,  7.75it/s]


train_loss: 0.0100
train_acc: 0.9968
train_f1: 0.9968



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.47it/s]



final_valid_loss: 0.7629090497669365
final_valid_accuracy: 0.9354094579008074
final_valid_f1: 0.9334364062165666
valid's error preds count: 56/867, {13: 5, 7: 21, 3: 17, 11: 1, 14: 8, 6: 1, 12: 2, 4: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_12_aug_200_vl_0.7629_va_0.9354_vf1_0.9334_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 13
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0000: 100%|██████████| 5419/5419 [11:38<00:00,  7.75it/s]


train_loss: 0.0103
train_acc: 0.9966
train_f1: 0.9966



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.56it/s]



final_valid_loss: 0.578989375715277
final_valid_accuracy: 0.9411764705882353
final_valid_f1: 0.9389539123193897
valid's error preds count: 51/867, {13: 5, 7: 21, 3: 17, 4: 2, 11: 1, 14: 4, 12: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_13_aug_200_vl_0.5790_va_0.9412_vf1_0.9390_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 14
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0060: 100%|██████████| 5419/5419 [11:38<00:00,  7.76it/s]


train_loss: 0.0086
train_acc: 0.9973
train_f1: 0.9973



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.47it/s]



final_valid_loss: 0.6137389608197411
final_valid_accuracy: 0.9377162629757786
final_valid_f1: 0.9365161928772122
valid's error preds count: 54/867, {13: 5, 7: 21, 3: 17, 14: 6, 11: 1, 4: 3, 12: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_14_aug_200_vl_0.6137_va_0.9377_vf1_0.9365_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 15
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0360: 100%|██████████| 5419/5419 [11:38<00:00,  7.75it/s]


train_loss: 0.0075
train_acc: 0.9976
train_f1: 0.9976



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.56it/s]



final_valid_loss: 0.7899886594220463
final_valid_accuracy: 0.9434832756632064
final_valid_f1: 0.9409344284459941
valid's error preds count: 49/867, {13: 4, 7: 21, 3: 16, 11: 1, 14: 6, 12: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_15_aug_200_vl_0.7900_va_0.9435_vf1_0.9409_fold_1_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.
Fold 2/2

epoch: 1
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.1142: 100%|██████████| 5419/5419 [11:42<00:00,  7.72it/s]


train_loss: 0.2352
train_acc: 0.9175
train_f1: 0.9169



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.49it/s]



final_valid_loss: 0.28391540609248167
final_valid_accuracy: 0.9388696655132641
final_valid_f1: 0.9392719895997738
valid's error preds count: 53/867, {7: 13, 3: 22, 11: 5, 16: 1, 0: 2, 14: 4, 4: 5, 10: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_1_aug_200_vl_0.2839_va_0.9389_vf1_0.9393_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 2
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.3331: 100%|██████████| 5419/5419 [11:41<00:00,  7.72it/s]


train_loss: 0.0738
train_acc: 0.9752
train_f1: 0.9751



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.46it/s]



final_valid_loss: 0.3793453468700006
final_valid_accuracy: 0.9319492502883506
final_valid_f1: 0.9324191843672243
valid's error preds count: 59/867, {7: 20, 3: 17, 16: 4, 11: 2, 10: 2, 14: 8, 4: 5, 12: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_2_aug_200_vl_0.3793_va_0.9319_vf1_0.9324_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 3
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0057: 100%|██████████| 5419/5419 [11:41<00:00,  7.72it/s]


train_loss: 0.0459
train_acc: 0.9848
train_f1: 0.9848



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.50it/s]



final_valid_loss: 0.5630076649831608
final_valid_accuracy: 0.9250288350634371
final_valid_f1: 0.9288410402739025
valid's error preds count: 65/867, {10: 2, 7: 22, 3: 17, 4: 8, 11: 3, 14: 10, 12: 1, 13: 1, 0: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_3_aug_200_vl_0.5630_va_0.9250_vf1_0.9288_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 4
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0123: 100%|██████████| 5419/5419 [11:40<00:00,  7.73it/s]


train_loss: 0.0348
train_acc: 0.9887
train_f1: 0.9886



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.48it/s]



final_valid_loss: 0.44640747168835204
final_valid_accuracy: 0.9400230680507498
final_valid_f1: 0.9395842244438735
valid's error preds count: 52/867, {7: 25, 3: 10, 11: 2, 14: 12, 4: 1, 12: 1, 10: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_4_aug_200_vl_0.4464_va_0.9400_vf1_0.9396_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 5
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0009: 100%|██████████| 5419/5419 [11:41<00:00,  7.73it/s]


train_loss: 0.0264
train_acc: 0.9914
train_f1: 0.9914



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.46it/s]



final_valid_loss: 0.4267365968608741
final_valid_accuracy: 0.9296424452133795
final_valid_f1: 0.9291492218885831
valid's error preds count: 61/867, {7: 26, 3: 15, 11: 3, 14: 14, 4: 2, 10: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_5_aug_200_vl_0.4267_va_0.9296_vf1_0.9291_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 6
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0000: 100%|██████████| 5419/5419 [11:41<00:00,  7.73it/s]


train_loss: 0.0212
train_acc: 0.9932
train_f1: 0.9932



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.51it/s]



final_valid_loss: 0.6021554940523889
final_valid_accuracy: 0.9331026528258363
final_valid_f1: 0.9329502785188365
valid's error preds count: 58/867, {7: 29, 11: 2, 3: 7, 14: 12, 4: 3, 10: 2, 12: 1, 13: 1, 0: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_6_aug_200_vl_0.6022_va_0.9331_vf1_0.9330_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 7
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0012: 100%|██████████| 5419/5419 [11:41<00:00,  7.72it/s]


train_loss: 0.0193
train_acc: 0.9938
train_f1: 0.9938



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.45it/s]



final_valid_loss: 0.565838667869256
final_valid_accuracy: 0.9342560553633218
final_valid_f1: 0.9336325811244223
valid's error preds count: 57/867, {7: 30, 3: 9, 12: 2, 11: 2, 14: 10, 4: 3, 10: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_7_aug_200_vl_0.5658_va_0.9343_vf1_0.9336_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 8
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0004: 100%|██████████| 5419/5419 [11:40<00:00,  7.73it/s]


train_loss: 0.0156
train_acc: 0.9950
train_f1: 0.9950



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.51it/s]



final_valid_loss: 0.5979011349211021
final_valid_accuracy: 0.9377162629757786
final_valid_f1: 0.9378965533461109
valid's error preds count: 54/867, {7: 29, 3: 9, 11: 1, 14: 10, 4: 2, 12: 1, 10: 1, 0: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_8_aug_200_vl_0.5979_va_0.9377_vf1_0.9379_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 9
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0002: 100%|██████████| 5419/5419 [11:41<00:00,  7.72it/s]


train_loss: 0.0138
train_acc: 0.9957
train_f1: 0.9957



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.44it/s]



final_valid_loss: 0.6965710820772334
final_valid_accuracy: 0.9296424452133795
final_valid_f1: 0.9310087143840572
valid's error preds count: 61/867, {7: 28, 3: 6, 4: 10, 11: 3, 14: 12, 12: 1, 10: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_9_aug_200_vl_0.6966_va_0.9296_vf1_0.9310_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 10
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0002: 100%|██████████| 5419/5419 [11:41<00:00,  7.73it/s]


train_loss: 0.0137
train_acc: 0.9957
train_f1: 0.9957



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.44it/s]



final_valid_loss: 0.5934483082663584
final_valid_accuracy: 0.9307958477508651
final_valid_f1: 0.9319528274463531
valid's error preds count: 60/867, {7: 24, 3: 18, 11: 1, 14: 12, 10: 2, 4: 3}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_10_aug_200_vl_0.5934_va_0.9308_vf1_0.9320_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 11
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0003: 100%|██████████| 5419/5419 [11:40<00:00,  7.73it/s]


train_loss: 0.0115
train_acc: 0.9964
train_f1: 0.9964



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.41it/s]



final_valid_loss: 0.6427484334625271
final_valid_accuracy: 0.9273356401384083
final_valid_f1: 0.9284765499918867
valid's error preds count: 63/867, {7: 29, 3: 16, 11: 1, 14: 10, 4: 2, 10: 2, 12: 1, 0: 2}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_11_aug_200_vl_0.6427_va_0.9273_vf1_0.9285_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 12
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0002: 100%|██████████| 5419/5419 [11:40<00:00,  7.74it/s]


train_loss: 0.0101
train_acc: 0.9966
train_f1: 0.9966



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.51it/s]



final_valid_loss: 0.5095071717985645
final_valid_accuracy: 0.936562860438293
final_valid_f1: 0.9367277794073878
valid's error preds count: 55/867, {7: 21, 3: 18, 11: 2, 14: 8, 4: 3, 12: 1, 10: 1, 0: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_12_aug_200_vl_0.5095_va_0.9366_vf1_0.9367_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 13
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0262: 100%|██████████| 5419/5419 [11:40<00:00,  7.74it/s]


train_loss: 0.0099
train_acc: 0.9968
train_f1: 0.9968



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.50it/s]



final_valid_loss: 0.7933922078495925
final_valid_accuracy: 0.9319492502883506
final_valid_f1: 0.9300870447726572
valid's error preds count: 59/867, {7: 30, 3: 12, 11: 3, 14: 10, 4: 1, 12: 1, 10: 1, 0: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_13_aug_200_vl_0.7934_va_0.9319_vf1_0.9301_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 14
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0000: 100%|██████████| 5419/5419 [11:40<00:00,  7.74it/s]


train_loss: 0.0082
train_acc: 0.9973
train_f1: 0.9973



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.53it/s]



final_valid_loss: 0.5812162363443869
final_valid_accuracy: 0.9307958477508651
final_valid_f1: 0.930178645105803
valid's error preds count: 60/867, {7: 24, 3: 22, 11: 3, 4: 4, 14: 4, 12: 1, 10: 1, 0: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_14_aug_200_vl_0.5812_va_0.9308_vf1_0.9302_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.

epoch: 15
다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.


Loss: 0.0000: 100%|██████████| 5419/5419 [11:39<00:00,  7.75it/s]


train_loss: 0.0085
train_acc: 0.9974
train_f1: 0.9974



Evaluating: 100%|██████████| 28/28 [00:04<00:00,  6.50it/s]



final_valid_loss: 0.737106102781422
final_valid_accuracy: 0.9342560553633218
final_valid_f1: 0.9347590107001933
valid's error preds count: 57/867, {7: 26, 3: 13, 11: 3, 14: 12, 4: 1, 10: 1, 0: 1}
Model checkpoint saved. filename: cp-densenet201.tv_in1k_sd_42_epc_15_aug_200_vl_0.7371_va_0.9343_vf1_0.9348_fold_2_folds_2.pt
5초 동안 잠시 sleep 합니다. 다음 epoch 학습을 중단 예약하고 싶으면, 빈 BREAK 파일을 생성하세요.
BREAK 파일이 있는지 확인합니다.


In [8]:
# wandb 실행 종료
wandb.finish()

VBox(children=(Label(value='0.006 MB of 0.006 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
final_valid_accuracy,▆▁▁▅▆▄▇▅▆▅▇▆▇▆█▇▅▃▇▄▅▅▆▄▄▃▆▅▄▅
final_valid_f1,▆▁▁▆▆▄▇▅▆▅█▆▇▇█▇▅▄█▄▆▆▇▅▅▄▇▅▅▆
final_valid_loss,▁▃▅▄▅▅▅▆▅▅▅█▅▆█▁▂▅▃▃▅▅▅▇▅▆▄█▅▇
train_acc,▁▆▇▇▇██████████▁▆▇▇▇██████████
train_f1,▁▆▇▇▇██████████▁▆▇▇▇██████████
train_loss,█▃▂▂▂▁▁▁▁▁▁▁▁▁▁█▃▂▂▂▁▁▁▁▁▁▁▁▁▁

0,1
final_valid_accuracy,0.93426
final_valid_f1,0.93476
final_valid_loss,0.73711
train_acc,0.9974
train_f1,0.99739
train_loss,0.00846


In [9]:
import sys
sys.exit('아래 셀은 수동으로 실행하기 위해서 여기서 실행 멈춤.')

SystemExit: 아래 셀은 수동으로 실행하기 위해서 여기서 실행 멈춤.

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


# 수동으로 특정 체크포인트부터 이어서 학습하기 위한 부분


In [None]:
# checkpoint = common.load_model_checkpoint("checkpoint-resnet34_seed_42_epoch_0_isFull_False.pt", model, optimizer, device)

In [None]:
# next_epoch = checkpoint['epoch'] + 1

# common.train_with_start_end_epoch(seed = checkpoint['seed'],
#                            tst_img_size = checkpoint['tst_img_size'],
#                            batch_size = checkpoint['batch_size'],
#                            start_epoch_inclusive = next_epoch, 
#                            end_epoch_exclusive = next_epoch + 2, 
#                            augment_ratio = augment_ratio,
#                            trn_loader = trn_loader,
#                            val_loader = val_loader,
#                            model = model,
#                            model_name = model_name,
#                            optimizer = optimizer,
#                            loss_fn = loss_fn,
#                            device = device,
#                            is_save_model_checkpoint = True,
#                            is_evaluate_train_valid = True)