# **과제 3: 손글씨 숫자 분류 대회 노트북 템플릿**

본 노트북은 제공된 `dataset.zip`을 활용하여 **훈련(train)**, **검증(val)**, **테스트(test)** 절차를 수행하고, 
최종적으로 *정확도(%)*, *정밀도(precision)*, *재현율(recall)*, *F1 score*, *ROC 곡선*, *오차행렬(confusion matrix)* 을 산출하기 위한 템플릿입니다.

## 규칙 요약
- 제공된 데이터셋(`train`, `val`, `test`)만 사용합니다. **외부 데이터 금지**.
- `train`은 **훈련 전용**, `val`은 **검증 전용**, `test`는 **최종 평가 전용**입니다.
- `test` 셋은 **절대로** 훈련/검증에 사용하지 않습니다. 학습이 끝난 후 저장된 모델로 **한 번만** 추론합니다.
- 데이터 증강(회전, 이동, 밝기/대비 조절, noise 첨가 등)은 **훈련 데이터에 한해** 자유롭게 허용합니다.
- 최종 **대회 점수**는 `test`의 **510개 이미지 중 정답 개수 / 510 × 100(%)** 로 산출합니다.
- 반드시 **정밀도/재현율/F1**을 모두 보고하고, **ROC 곡선(OVR, micro/macro)** 및 **오차행렬**을 포함합니다.

> **특전:** 이번 과제 3에서 우승한 학생은 **중간시험·기말시험 면제, A+ 보장** (단, 이후 모든 과제를 빠짐없이 제출해야 함. 미제출 시 A+ 무효)


## 임포트 및 공용 설정

In [7]:
import os, gzip, struct, random, math
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader
from sklearn.metrics import classification_report, confusion_matrix, roc_curve, auc
from sklearn.preprocessing import label_binarize
import matplotlib.pyplot as plt

def set_seed(seed: int = 42):
    random.seed(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False

set_seed(42)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
device


device(type='cuda')

## 데이터 경로 설정
- 배포된 `dataset.zip`을 풀면 아래와 같은 경로를 가정합니다.
- **IDX 파일 방식**과 **이미지 폴더 방식** 중 하나를 사용하세요. (대회 데이터 포맷에 따라 선택)

In [8]:
# === 공통 루트 ===
DATA_ROOT = './dataset'  # dataset.zip을 이 폴더로 해제했다고 가정

# === [선택 1] IDX 포맷(.gz 또는 평문) 사용 시 경로 설정 ===
IDX_TRAIN_IMAGES = os.path.join(DATA_ROOT, 'train-images-idx3-ubyte.gz')
IDX_TRAIN_LABELS = os.path.join(DATA_ROOT, 'train-labels-idx1-ubyte.gz')
IDX_VAL_IMAGES   = os.path.join(DATA_ROOT, 'val-images-idx3-ubyte.gz')
IDX_VAL_LABELS   = os.path.join(DATA_ROOT, 'val-labels-idx1-ubyte.gz')
IDX_TEST_IMAGES  = os.path.join(DATA_ROOT, 'test-images-idx3-ubyte.gz')
IDX_TEST_LABELS  = os.path.join(DATA_ROOT, 'test-labels-idx1-ubyte.gz')

# === [선택 2] 이미지 폴더 사용 시 (필요시 구현 확장) ===
IMG_TRAIN_DIR = os.path.join(DATA_ROOT, 'train')  # 예: 하위에 0~9 폴더 또는 라벨이 파일명에 포함
IMG_VAL_DIR   = os.path.join(DATA_ROOT, 'val')
IMG_TEST_DIR  = os.path.join(DATA_ROOT, 'test')

# 데이터 포맷 선택: 'idx' 또는 'images'
DATA_MODE = 'idx'  # 대회 배포 포맷에 맞게 'idx' 혹은 'images'로 변경


## (코딩) 1. 데이터 로더

## (코딩-선택) 1-1.  데이터 증강 (필요시 데이터 증강, 필수 아님)

## (코딩) 2. 모델 정의 (어떤 모델이라도 상관없습니다.)

## (코딩) 3. 하이퍼파라미터 & 데이터 로딩

## (코딩) 4. 학습/평가 루틴

## (코딩) 5.  학습 실행

## (코딩) 6. 테스트 평가 및 지표 산출
- 저장된 최고 가중치로 `test`를 한 번만 평가합니다.
- 정확도(%), 정밀도/재현율/F1, ROC(OVR micro/macro), 오차행렬을 산출합니다.

## (코딩) 7. 시각화: 오차행렬 & ROC 곡선

## (서술형) 8. 데이터 증강 전략
- 적용한 증강 기법과 이유를 기술하세요.
- 증강이 성능에 미친 영향(개선/악화 사례)을 분석하세요.

## (서술형) 9. 모델 구조와 학습 설정
- 선택한 모델 구조(CNN/ResNet 등)와 하이퍼파라미터를 설명하세요.
- 검증 성능 곡선, 과적합 여부 판단 근거 등을 서술하세요.

## (서술형) 10. 결과 분석 및 한계
- `test` 성능(정확도/정밀도/재현율/F1)과 ROC/오차행렬을 근거로 강점과 약점을 분석하세요.
- 오분류 사례를 몇 개 시각화하여 원인을 추정하세요(선택).
- 테스트셋에 대한 정확도가 높게 또는 낮게 나온 이유가 무엇일지 분석하세요.

## 체크리스트
- [ ] `train`에만 증강 적용
- [ ] `val`로 하이퍼파라미터/모델 선택
- [ ] 저장된 모델로 `test`를 **한 번만** 평가
- [ ] 정확도/정밀도/재현율/F1 모두 보고
- [ ] ROC(OVR micro/macro) 및 오차행렬 포함
- [ ] 시드/환경 명시 및 재현성 확보
