# 평가지표
- 정확도
- 모델 클래스는 직접 구현

In [21]:
import pandas as pd
import numpy as np
import torch
from tqdm.auto import tqdm
import random
import os

def reset_seeds(seed):
    random.seed(seed)
    os.environ['PYTHONHASHSEED'] = str(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.backends.cudnn.deterministic = True

In [22]:
DATA_PATH = "../data/pizza_steak_sushi/"
SEED = 42

device = 'cuda' if torch.cuda.is_available() else 'cpu'
device

'cuda'

# 음식 분류 데이터셋
- 0 : 피자
- 1 : 스테이크
- 2 : 스시


In [23]:
train = pd.read_csv(f"{DATA_PATH}train.csv")
test = pd.read_csv(f"{DATA_PATH}test.csv")
train.shape , test.shape

((1649, 2), (1350, 2))

In [24]:
train.head()

Unnamed: 0,file_name,target
0,2104569.jpg,0
1,2038418.jpg,1
2,1919810.jpg,2
3,2557340.jpg,0
4,3621562.jpg,1


In [25]:
test.head()

Unnamed: 0,file_name,target
0,3777020.jpg,
1,931356.jpg,
2,2599817.jpg,
3,1251166.jpg,
4,1183595.jpg,


데이터셋 클래스 ~ 테스트 데이터 예측 주석달기

# 1. 데이터셋 클래스 만들기

In [26]:
import cv2 # 이미지 처리를 위한 라이브러리

In [None]:
train_file = train["file_name"].to_numpy() # 파일명 추출 및 numpy 배열로 변환
test_file = test["file_name"].to_numpy() # 파일명 추출 및 numpy 배열로 변환

train_file.shape, test_file.shape # 파일명 배열의 shape 확인

((1649,), (1350,))

In [28]:
train_file[0] # 파일명 확인

'2104569.jpg'

In [None]:
train_target = train["target"].to_numpy() # 타겟 추출 및 numpy 배열로 변환

train_target.shape # 타겟 배열의 shape 확인

(1649,)

In [30]:
class FoodsDataset(torch.utils.data.Dataset): # 데이터셋 클래스 정의
    def __init__(self, x, y=None, resize=(224, 224)): # x: 파일명, y: 타겟(테스트 데이터 예측 시 정답 데이터가 없으므로 기본값 None 지정), resize: 이미지 크기
        self.x = x # 파일명
        self.y = y # 타겟
        self.resize = resize # 이미지 크기

    def __len__(self): # 데이터셋 길이 반환 메서드
        return len(self.x)

    def __getitem__(self, idx): # 데이터셋에서 특정 인덱스의 아이템 반환
        item = {} # 반환할 아이템을 담을 딕셔너리
        x = cv2.imread(f"{DATA_PATH}data/{self.x[idx]}") # 이미지 파일 읽기
        x = cv2.cvtColor(x, cv2.COLOR_BGR2RGB) # 이미지 채널 순서 변경(BGR -> RGB)
        x = cv2.resize(x, self.resize) # 이미지 크기 변경
        x = x / 255 # 이미지 스케일링
        item["x"] = torch.Tensor(x) # 이미지 텐서화

        if self.y is not None: # 타겟이 존재할 경우
            item["y"] = torch.tensor(self.y[idx]) # 타겟 텐서화(다중 클래스 분류 문제이므로 텐서 함수 사용)

        return item # 아이템 반환

In [31]:
# 클래스 잘 작동하는지 확인
dataset = FoodsDataset(train_file, train_target) # 데이터셋 객체 생성
dataloader = torch.utils.data.DataLoader(dataset, 1) # 데이터로더 생성
batch = next(iter(dataloader)) # 배치 생성
batch["x"].shape # 배치 shape 확인

torch.Size([1, 224, 224, 3])

# 모델 클래스 만들기

In [32]:
class Conv2dNet(torch.nn.Module): # 컨볼루션 신경망 클래스 정의
    def __init__(self, in_channels, out_channels, kernel_size): # in_channels: 입력 채널 수, out_channels: 출력 채널 수(커널 수), kernel_size: 커널 크기
        super().__init__() # 부모 클래스 초기화 메서드 실행
        self.seq = torch.nn.Sequential( # 순차적 계층 변수 생성
            torch.nn.Conv2d(in_channels, out_channels, kernel_size), # 컨볼루션 계층
            torch.nn.BatchNorm2d(out_channels), # 배치 정규화 계층
            torch.nn.PReLU(), # 활성화 함수
            torch.nn.MaxPool2d(2), # 맥스 풀링 계층
        )

    def forward(self, x): # 생성한 순차적 계층 실행 메서드
        return self.seq(x) # 순차적 계층에 입력값 x를 순차적으로 통과시킨 결과 반환

In [33]:
class LinearNet(torch.nn.Module): # 완전 연결 신경망 클래스 정의
    def __init__(self, in_channels, out_channels): # in_channels: 입력 채널 수, out_channels: 출력 채널 수(커널 수)
        super().__init__() # 부모 클래스 초기화 메서드 실행
        self.seq = torch.nn.Sequential( # 순차적 계층 변수 생성
            torch.nn.Dropout(0.2), # 드롭아웃 계층
            torch.nn.Linear(in_channels, out_channels), # 완전 연결 계층
            torch.nn.BatchNorm1d(out_channels), # 배치 정규화 계층
            torch.nn.PReLU(), # 활성화 함수
        )

    def forward(self, x): # 생성한 순차적 계층 실행 메서드
        return self.seq(x) # 순차적 계층에 입력값 x를 순차적으로 통과시킨 결과 반환

In [34]:
class Net(torch.nn.Module): # 전체 신경망 클래스 정의
    def __init__(self, in_channels=3, out_channels=16, kernel_size=3): # in_channels: 입력 채널 수, out_channels: 출력 채널 수(커널 수), kernel_size: 커널 크기
        super().__init__() # 부모 클래스 초기화 메서드 실행
        self.seq = torch.nn.Sequential( # 순차적 계층 변수 생성
            Conv2dNet(in_channels, out_channels, kernel_size), # 컨볼루션 신경망
            Conv2dNet(out_channels, out_channels * 2, kernel_size), # 컨볼루션 신경망
            Conv2dNet(out_channels * 2, out_channels * 4, kernel_size), # 컨볼루션 신경망
            Conv2dNet(out_channels * 4, out_channels * 8, kernel_size), # 컨볼루션 신경망

            torch.nn.AdaptiveMaxPool2d(1), # 글로벌 맥스 풀링 계층
            torch.nn.Flatten(), # 텐서 펼치기
            LinearNet(out_channels * 8, out_channels * 4), # 완전 연결 신경망
            LinearNet(out_channels * 4, out_channels * 2), # 완전 연결 신경망
            torch.nn.Dropout(0.2), # 드롭아웃 계층
            torch.nn.Linear(out_channels * 2, 3), # 완전 연결 신경망(정답 데이터 클래스 개수가 3개이므로 출력 채널 수 3으로 설정)
        )

    def forward(self, x): # 생성한 순차적 계층 실행 메서드
        return self.seq(x.permute(0, 3, 1, 2)) # 순차적 계층에 입력값 x를 순차적으로 통과시킨 결과 반환(입력값 x의 채널 순서 변경)

# 2. 학습 loop 함수 만들기

In [35]:
def train_loop(dataloader, model, loss_function, optimizer, device): # 학습 함수 정의
    epoch_loss = 0 # 에폭 손실값 변수 초기화
    model.train() # 모델 학습 상태로 설정

    for batch in dataloader: # 데이터로더에서 미니 배치를 하나씩 꺼내 반복
        pred = model(batch["x"].to(device)) # 모델에 입력값 x를 넣어 예측값 계산, to 메서드로 연산을 수행할 디바이스로 입력값 x 이동
        loss = loss_function(pred, batch["y"].to(device)) # 예측값과 정답 데이터로 손실값 계산, to 메서드로 연산을 수행할 디바이스로 정답 데이터 이동

        optimizer.zero_grad() # 기울기 초기화
        loss.backward() # 손실값 역전파
        optimizer.step() # 옵티마이저 가중치 업데이트

        epoch_loss += loss.item() # 손실값 파이썬 숫자로 변환하여 에폭 손실값에 더함

    epoch_loss /= len(dataloader) # 에폭 손실값을 데이터로더 길이로 나누어 평균 손실값 계산
    return epoch_loss # 에폭 손실값 반환

# 3. 테스트 loop 함수 만들기
- 데이터 예측 기능 및 검증데이터 손실값 반환하는 기능

In [36]:
@torch.no_grad() # 기울기 계산하지 않도록 데코레이터 설정
def test_loop(dataloader, model, loss_function, device): # 테스트 함수 정의
    epoch_loss = 0 # 에폭 손실값 변수 초기화
    model.eval() # 모델 평가 상태로 설정
    act = torch.nn.Softmax(dim=1) # 활성화 함수 설정(다중 클래스 분류 문제이므로 소프트맥스 함수 사용)
    pred_list = [] # 예측값을 담을 리스트 초기화
    
    for batch in dataloader: # 데이터로더에서 미니 배치를 하나씩 꺼내 반복
        pred = model(batch["x"].to(device)) # 모델에 입력값 x를 넣어 예측값 계산, to 메서드로 연산을 수행할 디바이스로 입력값 x 이동
        if batch.get("y") is not None: # 정답 데이터가 존재할 경우(검증 데이터)
            loss = loss_function(pred, batch["y"].to(device)) # 예측값과 정답 데이터로 손실값 계산, to 메서드로 연산을 수행할 디바이스로 정답 데이터 이동
            epoch_loss += loss.item() # 손실값 파이썬 숫자로 변환하여 에폭 손실값에 더함

        pred = act(pred) # 활성화 함수 적용
        pred = pred.to("cpu").numpy() # 텐서를 cpu 메모리로 이동한 후 넘파이 배열로 변환
        pred_list.append(pred) # 예측값 리스트에 추가

    pred = np.concatenate(pred_list) # 예측값 리스트를 연결
    epoch_loss /= len(dataloader) # 에폭 손실값을 데이터로더 길이로 나누어 평균 손실값 계산

    return epoch_loss, pred # 에폭 손실값과 예측값 반환

# 4. 학습하기


In [37]:
n_splits = 5 # 폴드 수 설정
batch_size = 64 # 배치 크기 설정
epochs = 100 # 에폭 수 설정
loss_function = torch.nn.CrossEntropyLoss() # 손실 함수 설정(다중 클래스 분류 문제이므로 크로스 엔트로피 손실 함수 사용)

In [38]:
from sklearn.model_selection import KFold # KFold 클래스 불러오기
from sklearn.metrics import accuracy_score # 정확도 계산 함수 불러오기

cv = KFold(n_splits, shuffle=True, random_state=SEED) # KFold 객체 생성

In [39]:
is_holdout = False # 홀드아웃 검증 사용 여부 설정
reset_seeds(SEED) # 시드 고정
score_list = [] # 점수를 담을 리스트 초기화

for i, (tri, vai) in enumerate(cv.split(train_file)): # KFold 객체를 통해 학습 데이터 인덱스와 검증 데이터 인덱스를 생성하고 인덱스와 함께 반복
    model = Net().to(device) # 모델 생성 및 디바이스 설정
    optimizer = torch.optim.Adam(model.parameters()) # 옵티마이저 생성 및 모델 파라미터 등록

    train_dataset = FoodsDataset(train_file[tri], train_target[tri]) # 학습 데이터셋 객체 생성
    train_dataloader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True) # 학습 데이터로더 객체 생성

    valid_dataset = FoodsDataset(train_file[vai], train_target[vai]) # 검증 데이터셋 객체 생성
    valid_dataloader = torch.utils.data.DataLoader(valid_dataset, batch_size=batch_size, shuffle=False) # 검증 데이터로더 객체 생성

    best_score = 0 # 최고 점수(정확도) 변수 초기화
    best_loss = np.inf # 최저 손실값(검증 손실) 변수 초기화
    patience = 0 # 조기 종료 변수 초기화

    for epoch in tqdm(range(epochs)): # 에폭 수 만큼 반복
        train_loss = train_loop(train_dataloader, model, loss_function, optimizer, device) # 학습 함수 실행
        valid_loss, pred = test_loop(valid_dataloader, model, loss_function, device) # 검증 함수 실행
        pred = np.argmax(pred, axis=1) # 예측값 중 가장 큰 값의 인덱스를 정답으로 설정
        score = accuracy_score(train_target[vai], pred) # 검증 데이터 정답과 예측값으로 정확도 계산

        print(f"train_loss: {train_loss: .4f}, valid_loss: {valid_loss: .4f}, score: {score: .4f}") # 학습 손실값, 검증 손실값, 정확도 출력
        patience += 1 # 조기 종료 변수 1 추가
        if score > best_score or best_loss > valid_loss: # 정확도가 높아지거나 검증 손실값이 낮아질 경우
            patience = 0 # 조기 종료 변수 초기화
            best_score = score # 최고 점수(정확도) 갱신
            best_loss = valid_loss # 최저 손실값(검증 손실) 갱신
            torch.save(model.state_dict(), f"../output/model_{i}.pt") # 모델 저장

        if patience == 10: # 조기 종료 조건(10번 연속으로 최고 점수, 최저 손실값 갱신이 일어나지 않을 경우)
            break # 학습 종료

    print(f"Fold-{i} Best Loss: {best_loss: .4f}, Best Acc: {best_score: .4f}") # 폴드별 최고 정확도 출력
    score_list.append(best_score) # 폴드별 최고 정확도를 리스트에 추가

    if is_holdout: # 홀드아웃 검증 사용할 경우
        break # 반복문 종료

  0%|          | 0/100 [00:00<?, ?it/s]

train_loss:  1.0397, valid_loss:  1.0718, score:  0.4364
train_loss:  0.8849, valid_loss:  1.1456, score:  0.3606
train_loss:  0.7902, valid_loss:  0.9428, score:  0.5030
train_loss:  0.7026, valid_loss:  0.8089, score:  0.6394
train_loss:  0.6379, valid_loss:  0.6532, score:  0.6970
train_loss:  0.5821, valid_loss:  0.7008, score:  0.7061
train_loss:  0.5668, valid_loss:  0.6375, score:  0.7152
train_loss:  0.5303, valid_loss:  0.5359, score:  0.7636
train_loss:  0.4694, valid_loss:  0.6267, score:  0.7273
train_loss:  0.4320, valid_loss:  0.5243, score:  0.7485
train_loss:  0.3996, valid_loss:  0.5052, score:  0.7727
train_loss:  0.4013, valid_loss:  0.9149, score:  0.6394
train_loss:  0.3920, valid_loss:  0.5963, score:  0.7424
train_loss:  0.3538, valid_loss:  0.5257, score:  0.7636
train_loss:  0.3266, valid_loss:  0.5347, score:  0.7818
train_loss:  0.2973, valid_loss:  1.0522, score:  0.6333
train_loss:  0.2613, valid_loss:  0.6924, score:  0.7455
train_loss:  0.2651, valid_loss

  0%|          | 0/100 [00:00<?, ?it/s]

train_loss:  1.0418, valid_loss:  1.0721, score:  0.3424
train_loss:  0.9081, valid_loss:  0.9027, score:  0.6121
train_loss:  0.7950, valid_loss:  0.8837, score:  0.6030
train_loss:  0.7056, valid_loss:  0.6963, score:  0.7030
train_loss:  0.6634, valid_loss:  0.8372, score:  0.6061
train_loss:  0.6047, valid_loss:  0.7458, score:  0.6758
train_loss:  0.5583, valid_loss:  0.5822, score:  0.7455
train_loss:  0.5297, valid_loss:  0.5358, score:  0.7939
train_loss:  0.4661, valid_loss:  0.6393, score:  0.7000
train_loss:  0.4413, valid_loss:  0.6884, score:  0.6788
train_loss:  0.4184, valid_loss:  0.5406, score:  0.7667
train_loss:  0.4222, valid_loss:  0.4940, score:  0.8152
train_loss:  0.3637, valid_loss:  0.4686, score:  0.8000
train_loss:  0.3397, valid_loss:  0.4830, score:  0.7970
train_loss:  0.3125, valid_loss:  0.4728, score:  0.8091
train_loss:  0.2990, valid_loss:  0.6312, score:  0.7364
train_loss:  0.2665, valid_loss:  0.6206, score:  0.7424
train_loss:  0.2623, valid_loss

  0%|          | 0/100 [00:00<?, ?it/s]

train_loss:  1.0822, valid_loss:  1.0549, score:  0.4273
train_loss:  0.9519, valid_loss:  0.9619, score:  0.5667
train_loss:  0.8640, valid_loss:  0.9858, score:  0.5303
train_loss:  0.7797, valid_loss:  1.1507, score:  0.5182
train_loss:  0.7085, valid_loss:  1.1057, score:  0.5909
train_loss:  0.6654, valid_loss:  0.6980, score:  0.7273
train_loss:  0.6009, valid_loss:  0.8830, score:  0.6394
train_loss:  0.5511, valid_loss:  0.8258, score:  0.7000
train_loss:  0.5640, valid_loss:  0.6368, score:  0.7697
train_loss:  0.4942, valid_loss:  0.7910, score:  0.6697
train_loss:  0.4491, valid_loss:  0.9532, score:  0.6545
train_loss:  0.4593, valid_loss:  0.5777, score:  0.7909
train_loss:  0.4279, valid_loss:  0.5021, score:  0.8455
train_loss:  0.3681, valid_loss:  1.0818, score:  0.6485
train_loss:  0.3902, valid_loss:  0.6331, score:  0.7424
train_loss:  0.3457, valid_loss:  0.6250, score:  0.7667
train_loss:  0.3421, valid_loss:  0.4579, score:  0.8333
train_loss:  0.3090, valid_loss

  0%|          | 0/100 [00:00<?, ?it/s]

train_loss:  1.0386, valid_loss:  1.1164, score:  0.3333
train_loss:  0.9196, valid_loss:  0.9616, score:  0.5273
train_loss:  0.8193, valid_loss:  0.8507, score:  0.6121
train_loss:  0.7825, valid_loss:  0.8873, score:  0.5970
train_loss:  0.6822, valid_loss:  0.7212, score:  0.6879
train_loss:  0.6123, valid_loss:  0.6133, score:  0.7545
train_loss:  0.5830, valid_loss:  0.7275, score:  0.6788
train_loss:  0.5400, valid_loss:  0.5358, score:  0.7727
train_loss:  0.5080, valid_loss:  0.6959, score:  0.7091
train_loss:  0.4922, valid_loss:  0.6235, score:  0.7242
train_loss:  0.4494, valid_loss:  0.8466, score:  0.6364
train_loss:  0.4071, valid_loss:  0.7129, score:  0.6879
train_loss:  0.3893, valid_loss:  0.5759, score:  0.7727
train_loss:  0.3499, valid_loss:  0.5469, score:  0.7727
train_loss:  0.3401, valid_loss:  0.6252, score:  0.7515
train_loss:  0.3253, valid_loss:  0.5036, score:  0.7970
train_loss:  0.2873, valid_loss:  0.5346, score:  0.7788
train_loss:  0.2838, valid_loss

  0%|          | 0/100 [00:00<?, ?it/s]

train_loss:  1.0770, valid_loss:  1.0745, score:  0.3404
train_loss:  0.9252, valid_loss:  1.0719, score:  0.4681
train_loss:  0.7973, valid_loss:  0.8727, score:  0.5623
train_loss:  0.7480, valid_loss:  0.6392, score:  0.7295
train_loss:  0.6676, valid_loss:  0.8685, score:  0.6140
train_loss:  0.6268, valid_loss:  0.5266, score:  0.7842
train_loss:  0.6034, valid_loss:  0.5024, score:  0.8055
train_loss:  0.5239, valid_loss:  0.5246, score:  0.7447
train_loss:  0.5158, valid_loss:  0.8753, score:  0.6140
train_loss:  0.4585, valid_loss:  0.5947, score:  0.7508
train_loss:  0.4549, valid_loss:  0.4865, score:  0.8116
train_loss:  0.4133, valid_loss:  0.4447, score:  0.8237
train_loss:  0.3855, valid_loss:  0.4632, score:  0.8298
train_loss:  0.3687, valid_loss:  0.5385, score:  0.7690
train_loss:  0.3488, valid_loss:  0.5020, score:  0.7964
train_loss:  0.3299, valid_loss:  0.5014, score:  0.7872
train_loss:  0.3034, valid_loss:  0.4099, score:  0.8237
train_loss:  0.2721, valid_loss

In [40]:
np.mean(score_list) # 평균 정확도 계산

0.8435460992907802

# 5. 테스트 데이터 예측

In [41]:
test_dataset = FoodsDataset(test_file) # 테스트 데이터셋 객체 생성
test_dataloader = torch.utils.data.DataLoader(test_dataset, batch_size=batch_size, shuffle=False) # 테스트 데이터로더 객체 생성

In [42]:
pred_list = [] # 예측값을 담을 리스트 초기화
for i in range(n_splits): # 폴드 수 만큼 반복
    model = Net().to(device) # 모델 생성 및 디바이스 설정
    model_params = torch.load(f"../output/model_{i}.pt", weights_only=True) # 모델 가중치 불러오기
    model.load_state_dict(model_params) # 모델 가중치 업데이트
    _, pred = test_loop(test_dataloader, model, loss_function, device) # 예측을 위한 테스트 함수 실행
    pred_list.append(pred) # 예측값 리스트에 추가

pred = np.mean(pred_list, axis=0) # 예측값 평균 계산
pred = np.argmax(pred, axis=1) # 예측값 중 가장 큰 값의 인덱스를 정답으로 설정
pred # 예측값 출력

array([1, 1, 1, ..., 1, 2, 1], dtype=int64)

# 6. 칸스 사이트의 컴피티션 페이지에 제출하여 점수 확인해보세요.

In [43]:
pd.DataFrame(pred, columns=["target"]).to_csv("../output/foods_classification_CNN.csv", index=False)