In [4]:
import os.path
from os import path
import pandas as pd

# 캐글 ↓제출경로
data_path = '/kaggle/input/kdt-ai-1/'
if not path.exists(data_path):
    data_path = './input/COVID_19_XRAY/'

train_path = data_path + 'train/'
test_path = data_path + 'test/'
valid_path = data_path + 'valid/'

from glob import glob

print(f'훈련 데이터 경로 : {train_path}')
print(f'테스트 데이터 경로 : {test_path}')
print(f'훈련 데이터 개수 : {len(glob(train_path + "*/*"))}')
print(f'테스트 데이터 개수 : {len(glob(test_path + "*.png"))}')

훈련 데이터 경로 : ./input/COVID_19_XRAY/train/
테스트 데이터 경로 : ./input/COVID_19_XRAY/test/
훈련 데이터 개수 : 2000
테스트 데이터 개수 : 400


In [5]:
# 시드값 및 고정 GPU 장비 설정 

import torch
import random
import numpy as np
import os

# 시드값 고정
seed = 50
os.environ['PYTHONHASHSEED'] = str(seed)
random.seed(seed)

np.random.seed(seed)
torch.manual_seed(seed)
torch.cuda.manual_seed(seed)
torch.cuda.manual_seed_all(seed)
torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = False
torch.backends.cudnn.enabled = False

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

In [6]:
# 데이터 증강을 위한 이미지 변환기 정의
from torchvision import transforms 

# 훈련 데이터용 변환기
tranform_train = transforms.Compose([
    transforms.Resize((250,250)), # 이미지 크기 조정
    transforms.CenterCrop(180), # 중앙 이미지 확대
    transforms.RandomHorizontalFlip(0.5), # 좌우 대칭
    transforms.RandomRotation(20),
    transforms.ToTensor(),
    transforms.Normalize((0.485, 0.465, 0.406),
                         (0.229, 0.224, 0.225)) # 정규화
    
])

tranform_test = transforms.Compose([
    transforms.Resize((250,250)), # 이미지 크기 조정
    transforms.CenterCrop(180), # 중앙 이미지 확대
    transforms.ToTensor(),
    transforms.Normalize((0.485, 0.465, 0.406),
                         (0.229, 0.224, 0.225)) # 정규화
    
])

In [7]:
from torchvision.datasets import ImageFolder

# 훈련 데이터
# Image Folder 를 사용하기 위해서 타깃값을 같은 디렉토리 안에서 사용했다.   
datasets_train = ImageFolder(root=train_path, transform=tranform_train)

In [8]:
# 데이터 로더의 시드값 고정 
def seed_worker(worker_id):
    worker_seed = torch.initial_seed() %2 **32
    np.random.seed(worker_seed)
    random.seed(worker_seed)
    
# 제네레이더 시드값 고정
g = torch.Generator()
g.manual_seed(0)

<torch._C.Generator at 0x1dbb6b13bb0>

In [9]:
# 데이터 로더 만들기

from torch.utils.data import DataLoader

batch_size = 8

loader_train = DataLoader(dataset=datasets_train, batch_size=batch_size,
                          shuffle=True, worker_init_fn=seed_worker,
                          generator=g, num_workers=0)
                                    # 성능 안좋아서 num_workes=0으로 함 원래는 2임 
# 배치크기는 굳이 8이 아니어도 됨

In [10]:
# EfficicentNet 을 사용하겠음
!pip install efficientnet-pytorch==0.7.1





In [11]:
from efficientnet_pytorch import EfficientNet
# https://arxiv.org/abs/1905.11946 : 논문링크
# 모델 생성
model = EfficientNet.from_pretrained('efficientnet-b0', num_classes=2)
# 베이스라인의 가장 간단한 efficientnet-b0 이진분류이므로 num_classes=2

# 장비 할당
model = model.to(device)

Loaded pretrained weights for efficientnet-b0


In [12]:
print('모델 파라미터 개수 : ', sum(param.numel() for param in model.parameters()))

모델 파라미터 개수 :  4010110


In [13]:
# 모델 훈련 및 성능 검증 

import torch.nn as nn

criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.01)

In [14]:
# 훈련함수 작성 
from sklearn.metrics import accuracy_score
from sklearn.metrics import recall_score
from sklearn.metrics import f1_score
from tqdm.notebook import tqdm

def train(model, loader_train, loader_valid ,criterion, optimizer, scheduler=None, epochs=10, 
          save_file='model_state_dict.pth'):
    valid_loss_min = np.inf
    # 총 epoch 만큼 반복
    for epoch in range(epochs):
        print(f'에폭 [{epoch+1}/{epochs}] \n---------------------')
        # == [훈련] =========
        model.train() # 모델을 훈련 상태로 설정
        epoch_train_loss = 0 # 에폭별 손실값 초기화(훈련데이터 용)
        
        # 미니배치 단위로 훈련
        for images , labels in tqdm(loader_train):
            images = images.to(device)
            labels = labels.to(device)
            
            optimizer.zero_grad()
            outputs = model(images)
            
            loss = criterion(outputs, labels)
            epoch_train_loss += loss.item()
            
            loss.backward()
            optimizer.step() 
            
            if scheduler != None: # 스케줄러 학습률 갱신
                scheduler.step()
                
        print(f'\t 훈련 데이터 손실값 : {epoch_train_loss/len(loader_train):.4f}')
        
        # == [ 검증 ] ======================================================
        
        model.eval()
        epoch_valid_loss = 0
        preds_list = []
        true_list = []
        
        with torch.no_grad():
            # 하나의 에폭만큼의 데이터를 미니배치 단위로 검증
            
            for images, labels in loader_valid:
                images = images.to(device)
                labels = labels.to(device)
                
                outputs = model(images)
                loss = criterion(outputs, labels)
                epoch_valid_loss += loss.item()
                
                # 예측값 및 실젯값
                preds = torch.max(outputs.cpu(), dim=1)[1].numpy()
                true = labels.cpu().numpy()
                
                preds_list.extend(preds)
                true_list.extend(true)

        # 현재 에폭의 검증 완료
        
        print(f'\t 검증 데이터 손실값 : {epoch_valid_loss/len(loader_valid):.4f}')
        
        # 평가 지표 계산(정확도, 재현율 , F1 점수)
        val_accuracy = accuracy_score(true_list, preds_list)
        val_recall = recall_score(true_list, preds_list)
        val_f1_score = f1_score(true_list, preds_list)
        print(f'\t 정확도 : {val_accuracy: .4f} / 재현율 : {val_recall:.4f} / F1 점수 : {val_f1_score:.4f}')
        
        
        # 
            # 기울기 초기화
            # 순전파
            # 손실값 계산(훈련 데이터용)
            # 역전파
            # 가중치 갱신
            # 학습률 갱신
        
        if epoch_valid_loss <= valid_loss_min:
            print(f'\t### 검증 데이터 손실값 감소 ({valid_loss_min:.4f} --> {epoch_valid_loss:.4f}). 모델저장')
            torch.save(model.state_dict(), save_file)
            valid_loss_min = epoch_valid_loss
        # == [최적 모델 가중치 찾기] ==
        # 현 에폭에서의 검증 데이터 손실값이 지금까지 가장 작다면
            # 현 에폭의 모델 가중치 (현재까지의 최적 모델 가중치 ) 저장
    return torch.load(save_file)

# 조기종료
# 평가점수가 더 이상 좋아지지 않으면 훈련을 멈춪도록 

In [15]:
datasets_valid = ImageFolder(root="./input/COVID_19_XRAY/valid/", transform=tranform_test)

loader_valid = DataLoader(dataset=datasets_valid, batch_size=batch_size,
                          shuffle=False, worker_init_fn=seed_worker, generator=g, num_workers=0)


In [16]:
model_state_dict = train(
    model=model,
    loader_train=loader_train,
    loader_valid=loader_valid,
    criterion=criterion,
    optimizer=optimizer
)

에폭 [1/10] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.8866
	 검증 데이터 손실값 : 1.8049
	 정확도 :  0.5080 / 재현율 : 0.9710 / F1 점수 : 0.6637
	### 검증 데이터 손실값 감소 (inf --> 451.2184). 모델저장
에폭 [2/10] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.6895
	 검증 데이터 손실값 : 2.4285
	 정확도 :  0.5155 / 재현율 : 0.9960 / F1 점수 : 0.6727
에폭 [3/10] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.6816
	 검증 데이터 손실값 : 0.7021
	 정확도 :  0.5015 / 재현율 : 0.9960 / F1 점수 : 0.6664
	### 검증 데이터 손실값 감소 (451.2184 --> 175.5182). 모델저장
에폭 [4/10] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.6538
	 검증 데이터 손실값 : 0.7931
	 정확도 :  0.5110 / 재현율 : 0.9950 / F1 점수 : 0.6705
에폭 [5/10] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.6378
	 검증 데이터 손실값 : 3.7918
	 정확도 :  0.5265 / 재현율 : 0.9120 / F1 점수 : 0.6582
에폭 [6/10] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.5882
	 검증 데이터 손실값 : 1.1945
	 정확도 :  0.6485 / 재현율 : 0.9200 / F1 점수 : 0.7236
에폭 [7/10] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.5862
	 검증 데이터 손실값 : 0.4813
	 정확도 :  0.7800 / 재현율 : 0.7200 / F1 점수 : 0.7660
	### 검증 데이터 손실값 감소 (175.5182 --> 120.3370). 모델저장
에폭 [8/10] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.5653
	 검증 데이터 손실값 : 0.7533
	 정확도 :  0.6595 / 재현율 : 0.7900 / F1 점수 : 0.6988
에폭 [9/10] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.5281
	 검증 데이터 손실값 : 0.9071
	 정확도 :  0.6555 / 재현율 : 0.9630 / F1 점수 : 0.7365
에폭 [10/10] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.5199
	 검증 데이터 손실값 : 1.0931
	 정확도 :  0.6150 / 재현율 : 0.9500 / F1 점수 : 0.7116


In [23]:
model.load_state_dict(model_state_dict)

<All keys matched successfully>

In [51]:
# Test Fake 
import shutil

os.makedirs(f'{test_path}normal',exist_ok=True)
os.makedirs(f'{test_path}covid' ,exist_ok=True)

for tmp_img in os.listdir(test_path):
    if tmp_img.endswith(".png"):
        shutil.copy(test_path+tmp_img, test_path+"normal/"+tmp_img)
        shutil.copy(test_path+tmp_img, test_path+"covid/"+tmp_img)

for file in os.listdir(test_path):
    if file.endswith(".png"):
        os.remove(os.path.join(test_path, file))

In [35]:
# 임의로 test 안에 
# normal->400개
# covid ->400개 함
# 라벨 붙임 ㅠㅠㅠ 

datasets_test = ImageFolder(root=test_path, transform=tranform_test)
loader_test = DataLoader(dataset=datasets_test, batch_size=batch_size,
                         shuffle=False, worker_init_fn=seed_worker,
                         generator=g, num_workers=0)

In [52]:
def predict(model, loader_test, return_true=False):
    model.eval() # 모델을 평가 상태로 설정
    preds_list = [] # 예측값 저장용 리스트 초기화
    true_list = [] # 실제 저장용 리스트 초기화
    
    with torch.no_grad():
        for images, labels in loader_test:
            images = images.to(device)
            labels = labels.to(device)
            
            outputs = model(images)
            
            preds = torch.max(outputs.cpu(), dim=1)[1].numpy() # 예측값
            true = labels.cpu().numpy() # 실제값
            
            preds_list.extend(preds)
            true_list.extend(true)
            
    if return_true:
        return true_list , preds_list
    else:
        return preds_list

In [53]:
true_list, preds_list = predict(model=model,
                                loader_test=loader_test,
                                return_true=True)

In [54]:
print(true_list)

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 

In [55]:
print(preds_list[:400])

[0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 1, 0, 

In [56]:
preds_list[:400] == preds_list[400:]

True

In [57]:
real_pred = []
for preds in preds_list[:400]:
    if preds == 1:
        real_pred.append('normal')
    else:
        real_pred.append('covid')
        
print(real_pred)

['covid', 'covid', 'normal', 'covid', 'normal', 'normal', 'covid', 'covid', 'normal', 'covid', 'normal', 'normal', 'covid', 'covid', 'covid', 'covid', 'normal', 'normal', 'covid', 'covid', 'normal', 'normal', 'normal', 'covid', 'covid', 'covid', 'normal', 'normal', 'normal', 'normal', 'covid', 'covid', 'normal', 'normal', 'normal', 'covid', 'covid', 'covid', 'covid', 'normal', 'covid', 'normal', 'covid', 'normal', 'covid', 'normal', 'covid', 'covid', 'normal', 'covid', 'normal', 'normal', 'normal', 'covid', 'covid', 'covid', 'covid', 'covid', 'covid', 'covid', 'normal', 'normal', 'normal', 'normal', 'covid', 'normal', 'covid', 'covid', 'covid', 'normal', 'normal', 'normal', 'normal', 'covid', 'covid', 'covid', 'normal', 'normal', 'covid', 'normal', 'normal', 'normal', 'covid', 'covid', 'normal', 'covid', 'covid', 'normal', 'covid', 'covid', 'covid', 'normal', 'covid', 'covid', 'covid', 'covid', 'covid', 'covid', 'covid', 'normal', 'normal', 'covid', 'normal', 'covid', 'covid', 'covid',

In [58]:
submission_df = pd.read_csv("input/COVID_19_XRAY/submission.csv")

submission_df['label']= real_pred

submission_df.to_csv("./output/submission.csv",index=False)

In [59]:
# https://www.kaggle.com/docs/api 참고
# kaggle competitions submit -c [COMPETITION] -f [FILE] -m [MESSAGE]

import os
import subprocess

# 0. api 토큰 발급받은이후 올바른 경로에 생성된 kaggle.json 추가
# 참고 url : https://github.com/Kaggle/kaggle-api
# cmd 명령어 실행으로 다운받기
result = subprocess.check_output(
    "kaggle competitions submit -c kdtai-1 -f ./output/submission.csv -m submit_in_local", 
    encoding='utf-8'
    )
print(result)

Successfully submitted to KDT_AI-프로젝트공모전스터디-1과제


In [60]:
model_list = []

from efficientnet_pytorch import EfficientNet

# 모델 생성
efficientnet_b1 = EfficientNet.from_pretrained('efficientnet-b1', num_classes=2)
efficientnet_b2 = EfficientNet.from_pretrained('efficientnet-b2', num_classes=2)
efficientnet_b3 = EfficientNet.from_pretrained('efficientnet-b3', num_classes=2)

# 장비할당

efficientnet_b1 = efficientnet_b1.to(device)
efficientnet_b2 = efficientnet_b2.to(device)
efficientnet_b3 = efficientnet_b3.to(device)

# 리스트에 모델 저장

model_list.append(efficientnet_b1)
model_list.append(efficientnet_b2)
model_list.append(efficientnet_b3)

Loaded pretrained weights for efficientnet-b1
Loaded pretrained weights for efficientnet-b2
Loaded pretrained weights for efficientnet-b3


In [61]:
for idx, model in enumerate(model_list):
    num_params = sum(param.numel() for param in model.parameters())
    print(f'모델 {idx+1} 파라미터 개수 : {num_params}')

모델 1 파라미터 개수 : 6515746
모델 2 파라미터 개수 : 7703812
모델 3 파라미터 개수 : 10699306


In [62]:
# 손실함수 , 옵티마이저 ,스케줄러 설정 

import torch.nn as nnn

criterion = nn.CrossEntropyLoss()

optimizer1 = torch.optim.AdamW(model_list[0].parameters(), lr=0.0006, weight_decay=0.001)
optimizer2 = torch.optim.AdamW(model_list[1].parameters(), lr=0.0006, weight_decay=0.001)
optimizer3 = torch.optim.AdamW(model_list[2].parameters(), lr=0.0006, weight_decay=0.001)

In [63]:
from transformers import get_cosine_schedule_with_warmup

epochs = 20

# 스케줄러
scheduler1 = get_cosine_schedule_with_warmup(optimizer1,
                                             num_warmup_steps=len(loader_train)*3,
                                             num_training_steps=len(loader_train)*epochs)

scheduler2 = get_cosine_schedule_with_warmup(optimizer2,
                                             num_warmup_steps=len(loader_train)*3,
                                             num_training_steps=len(loader_train)*epochs)

scheduler3 = get_cosine_schedule_with_warmup(optimizer3,
                                             num_warmup_steps=len(loader_train)*3,
                                             num_training_steps=len(loader_train)*epochs)


In [64]:
# 첫번 쨰 모델 훈련 

model_state_dict = train(model=model_list[0],
                         loader_train=loader_train,
                         loader_valid=loader_valid,
                         criterion=criterion,
                         optimizer=optimizer1,
                         scheduler=scheduler1,
                         epochs=epochs
                         )

# 첫번쨰 모델에 최적 가중치 적용

model_list[0].load_state_dict(model_state_dict)

에폭 [1/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.4888
	 검증 데이터 손실값 : 0.2726
	 정확도 :  0.9020 / 재현율 : 0.9010 / F1 점수 : 0.9019
	### 검증 데이터 손실값 감소 (inf --> 68.1565). 모델저장
에폭 [2/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.3161
	 검증 데이터 손실값 : 0.3012
	 정확도 :  0.8420 / 재현율 : 0.6900 / F1 점수 : 0.8137
에폭 [3/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.3100
	 검증 데이터 손실값 : 0.5196
	 정확도 :  0.8395 / 재현율 : 0.9980 / F1 점수 : 0.8615
에폭 [4/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.2916
	 검증 데이터 손실값 : 0.1188
	 정확도 :  0.9495 / 재현율 : 0.9880 / F1 점수 : 0.9514
	### 검증 데이터 손실값 감소 (68.1565 --> 29.7116). 모델저장
에폭 [5/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.2409
	 검증 데이터 손실값 : 0.1311
	 정확도 :  0.9450 / 재현율 : 0.9900 / F1 점수 : 0.9474
에폭 [6/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.2252
	 검증 데이터 손실값 : 0.1166
	 정확도 :  0.9615 / 재현율 : 0.9560 / F1 점수 : 0.9613
	### 검증 데이터 손실값 감소 (29.7116 --> 29.1535). 모델저장
에폭 [7/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.1825
	 검증 데이터 손실값 : 0.2107
	 정확도 :  0.9125 / 재현율 : 0.8390 / F1 점수 : 0.9056
에폭 [8/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.1688
	 검증 데이터 손실값 : 0.1084
	 정확도 :  0.9545 / 재현율 : 0.9980 / F1 점수 : 0.9564
	### 검증 데이터 손실값 감소 (29.1535 --> 27.1096). 모델저장
에폭 [9/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.1432
	 검증 데이터 손실값 : 0.1343
	 정확도 :  0.9475 / 재현율 : 0.8970 / F1 점수 : 0.9447
에폭 [10/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.1100
	 검증 데이터 손실값 : 0.0233
	 정확도 :  0.9940 / 재현율 : 0.9990 / F1 점수 : 0.9940
	### 검증 데이터 손실값 감소 (27.1096 --> 5.8226). 모델저장
에폭 [11/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.0840
	 검증 데이터 손실값 : 0.0197
	 정확도 :  0.9945 / 재현율 : 0.9990 / F1 점수 : 0.9945
	### 검증 데이터 손실값 감소 (5.8226 --> 4.9286). 모델저장
에폭 [12/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.0857
	 검증 데이터 손실값 : 0.0676
	 정확도 :  0.9715 / 재현율 : 0.9430 / F1 점수 : 0.9707
에폭 [13/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.0756
	 검증 데이터 손실값 : 0.0099
	 정확도 :  0.9965 / 재현율 : 1.0000 / F1 점수 : 0.9965
	### 검증 데이터 손실값 감소 (4.9286 --> 2.4788). 모델저장
에폭 [14/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.0548
	 검증 데이터 손실값 : 0.0104
	 정확도 :  0.9975 / 재현율 : 1.0000 / F1 점수 : 0.9975
에폭 [15/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.0346
	 검증 데이터 손실값 : 0.0059
	 정확도 :  0.9985 / 재현율 : 1.0000 / F1 점수 : 0.9985
	### 검증 데이터 손실값 감소 (2.4788 --> 1.4728). 모델저장
에폭 [16/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.0264
	 검증 데이터 손실값 : 0.0077
	 정확도 :  0.9975 / 재현율 : 1.0000 / F1 점수 : 0.9975
에폭 [17/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.0241
	 검증 데이터 손실값 : 0.0042
	 정확도 :  0.9995 / 재현율 : 1.0000 / F1 점수 : 0.9995
	### 검증 데이터 손실값 감소 (1.4728 --> 1.0491). 모델저장
에폭 [18/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.0199
	 검증 데이터 손실값 : 0.0027
	 정확도 :  0.9995 / 재현율 : 1.0000 / F1 점수 : 0.9995
	### 검증 데이터 손실값 감소 (1.0491 --> 0.6796). 모델저장
에폭 [19/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.0124
	 검증 데이터 손실값 : 0.0023
	 정확도 :  0.9995 / 재현율 : 1.0000 / F1 점수 : 0.9995
	### 검증 데이터 손실값 감소 (0.6796 --> 0.5746). 모델저장
에폭 [20/20] 
---------------------


  0%|          | 0/250 [00:00<?, ?it/s]

	 훈련 데이터 손실값 : 0.0162
	 검증 데이터 손실값 : 0.0025
	 정확도 :  0.9995 / 재현율 : 1.0000 / F1 점수 : 0.9995


<All keys matched successfully>

In [None]:
# 두번 쨰 모델 훈련 

model_state_dict = train(model=model_list[1],
                         loader_train=loader_train,
                         loader_valid=loader_valid,
                         criterion=criterion,
                         optimizer=optimizer2,
                         scheduler=scheduler2,
                         epochs=epochs
                         )

# 두번째 모델에 최적 가중치 적용

model_list[1].load_state_dict(model_state_dict)

In [None]:
# 세번 쨰 모델 훈련 

model_state_dict = train(model=model_list[2],
                         loader_train=loader_train,
                         loader_valid=loader_valid,
                         criterion=criterion,
                         optimizer=optimizer3,
                         scheduler=scheduler3,
                         epochs=epochs
                         )

# 두번째 모델에 최적 가중치 적용

model_list[2].load_state_dict(model_state_dict)

In [65]:
# 첫번 쨰 모델 평가
true_list, preds_list = predict(model = model_list[0],
                                loader_test=loader_test,
                                return_true=True)

In [67]:
print(true_list)

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 

In [68]:
preds_list[:400] == preds_list[400:]

True

In [69]:
real_pred_b1 = []
for preds in preds_list[:400]:
    if preds == 1:
        real_pred_b1.append('normal')
    else:
        real_pred_b1.append('covid')
        
print(real_pred_b1)

['covid', 'covid', 'normal', 'covid', 'normal', 'normal', 'covid', 'covid', 'normal', 'covid', 'normal', 'normal', 'covid', 'covid', 'covid', 'covid', 'normal', 'normal', 'normal', 'covid', 'normal', 'normal', 'normal', 'covid', 'covid', 'covid', 'normal', 'normal', 'normal', 'covid', 'covid', 'normal', 'normal', 'normal', 'covid', 'covid', 'covid', 'covid', 'covid', 'normal', 'covid', 'covid', 'normal', 'covid', 'covid', 'normal', 'covid', 'normal', 'normal', 'covid', 'normal', 'normal', 'normal', 'covid', 'covid', 'covid', 'covid', 'covid', 'covid', 'normal', 'covid', 'normal', 'normal', 'normal', 'normal', 'normal', 'covid', 'normal', 'normal', 'normal', 'covid', 'covid', 'covid', 'covid', 'covid', 'normal', 'normal', 'covid', 'covid', 'normal', 'normal', 'normal', 'normal', 'covid', 'normal', 'normal', 'covid', 'normal', 'covid', 'covid', 'covid', 'normal', 'covid', 'covid', 'covid', 'covid', 'covid', 'covid', 'covid', 'normal', 'covid', 'normal', 'normal', 'covid', 'covid', 'covid

In [70]:
submission_df = pd.read_csv("input/COVID_19_XRAY/submission.csv")

submission_df['label']= real_pred_b1

submission_df.to_csv("./output/submission_b1.csv",index=False)