# 100. CIFAR-10 을 이용한 CNN 구축

- **CNN**을 학습하여 CIFAR-10 데이터베이스의 이미지를 분류합니다.

## Data Download 및 Data Loader 를 이용하여 Train, Validation data 준비

transforms.ToTensor()의 주요 특징:

1) 데이터 타입 변환: PIL 이미지나 NumPy ndarray를 torch.FloatTensor로 변환  
2) 스케일링: 이미지의 픽셀 값 범위를 [0, 255]에서 [0.0, 1.0]으로 스케일링  
3) 차원 재배열: PyTorch에서는 이미지 데이터를 [C, H, W] 형식(채널, 높이, 너비)으로 처리하므로 입력 이미지 데이터의 차원을 이 형식으로 자동 재배열

In [None]:
# 이미지 데이터에 대한 변환(transform) 조합을 정의
# 이 변환은 이미지 데이터를 증강(augmentation)하고 전처리하는 과정을 포함합니다.
# CIFAR10 훈련 데이터셋을 다운로드하고, 위에서 정의한 변환을 적용
# CIFAR10 테스트 데이터셋을 다운로드하고, 위에서 정의한 변환을 적용

In [None]:
# CIFAR-10은 10개의 서로 다른 객체 클래스를 포함하는 이미지 데이터셋입니다.

### 일부 Data 시각화

- matplotlib 은 channel 위치가 last 이므로 transpose(1, 2, 0) 로 image 수정

In [None]:
    # np.transpose 함수를 사용하여 'x' 텐서의 차원을 재배열
    # (1, 2, 0)은 채널 차원을 마지막으로 이동시키고, 높이와 너비 차원을 앞으로 가져옵니다.
    # 이 형식은 matplotlib와 같은 일부 라이브러리에서 이미지를 표시할 때 요구되는 형식입니다.
    # * 0.5 + 0.5 연산은 정규화를 되돌려 픽셀 값을 원본 범위(0~1)로 unnormalize

## Model build

### Custom Model

- Output Size = (W - F + 2P) / S + 1  
- output_size / Maxpool(2)

In [None]:
def output_size(W, F, P, S, poolsize=1):

input image size : (32, 32)  
kernel size : 3  
padding : 1  
stride : 1

In [None]:
# CNN의 출력 크기 변화를 단계별로 계산

In [None]:
class Net(nn.Module):
    def __init__(self):
        # 3개의 입력 채널을 받아 16개의 출력 채널을 생성
        # 커널 크기는 3, 패딩은 1로 설정하여 입력 이미지의 크기를 유지합니다.
        # 16개의 입력 채널을 받아 32개의 출력 채널을 생성
        # 32개의 입력 채널을 받아 64개의 출력 채널을 생성
        # 첫 번째 완전 연결 층을 정의합니다. 입력 특징의 수는 4*4*64, 출력 특징의 수는 256입니다.
        # 두 번째 완전 연결 층을 정의합니다. 10개의 출력 클래스에 대응합니다.
    def forward(self, x):
        # 합성곱 층과 배치 정규화, ReLU 활성화 함수, 최대 풀링을 차례로 적용
        # 특징 맵을 1차원으로 평탄화
        # 드롭아웃 적용
        # 완전 연결 층과 배치 정규화, ReLU 활성화 함수 적용
        # 최종 출력 계산

### Model Summary

### Loss Function

In [None]:
# 학습률(Learning Rate) 설정
# 손실 함수(Loss Function) 정의
# 옵티마이저(Optimizer) 설정
# - momentum=0.9: 관성을 부여하여 최적화 속도를 높이는 모멘텀 설정
# - weight_decay=1e-4: 가중치 감소(Weight Decay)로 L2 정규화 적용 (과적합 방지) -> λ

In [None]:
    # 평균 손실 및 정확도 계산
    # 에폭별 훈련 및 검증 결과 출력

In [None]:
# 1행 2열(subplot 2개)짜리 그래프 생성, 전체 크기는 (12, 4)
# (왼쪽 그래프) 학습 손실(train loss)과 검증 손실(validation loss) 그래프
# (오른쪽 그래프) 학습 정확도(train accuracy)와 검증 정확도(validation accuracy) 그래프

### Model 평가

### model 이 어떤 image 들을 잘 맞추고 혹은 틀렸는지 시각화

In [None]:
    # 테스트 데이터셋을 배치 단위로 순회
# 예측값과 실제 레이블이 일치하는 경우의 인덱스를 찾음
# 예측값과 실제 레이블이 불일치하는 경우의 인덱스를 찾음
# 정확도 계산: 정확한 예측의 수를 전체 예측의 수로 나눈 후 100을 곱하여 백분율로 변환

In [None]:
# 혼동 행렬(Confusion Matrix) 계산
# 혼동 행렬 시각화 (히트맵 형태)
# 축(label) 설정
# x축 틱 레이블을 45도 회전하여 가독성 향상

In [None]:
# 정확한 예측의 인덱스에서 처음 9개를 순회합니다.
 # 잘못된 예측의 인덱스에서 처음 9개를 순회합니다.

## 모델 저장 및 불러오기  

### `state_dict` 를 사용하여 모델 저장 및 불러오기  

In [None]:
# 학습이 끝난 후 모델 가중치 저장

In [None]:
# 같은 모델 구조를 가진 새로운 모델 생성
# 저장된 가중치 로드

In [None]:
# 로드한 모델의 성능 테스트
# 정확도 계산