## 과제 목표
- Fashion-MNIST에서 **과적합을 epoch 늘려서 확실히 관측**하고, Dropout/Weight Decay가 추세를 어떻게 바꾸는지 확인한다.
- CIFAR-10에서 baseline을 넘기기 위한 최소 1회 개선 실험을 수행한다.

## 제출물
- 이 노트북(.ipynb) 자체를 제출
- 표/그래프/서술이 **빈칸 없이** 채워져야 함

## 공통 규칙
- Fashion-MNIST: epoch **10**
- CIFAR-10: epoch **10**
- seed 고정(권장)
- Train/Test는 동일한 평가 코드 사용


---
## 0) 환경 설정 & 공통 유틸


In [None]:
import random
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
import matplotlib.pyplot as plt
import pandas as pd

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("device:", device)


In [None]:
# TODO: accuracy / train_one_epoch / evaluate / count_params / run_training 구현
# - run_training은 epoch마다 (train_loss, train_acc, test_loss, test_acc)를 history에 쌓아 반환
# - 출력은 epoch마다 train/test acc가 보이게

# 여기서 logits는 모델의 출력값이고, y는 답임
def accuracy_from_logits(logits, y):
    pass

def train_one_epoch(model, loader, optimizer, criterion, device):
    pass

# hint: evaluate은 no grad를 필요로 함
def evaluate(model, loader, criterion, device):
    pass

def count_params(model):
    pass

def run_training(model, train_loader, test_loader, epochs, lr, weight_decay=0.0):
    pass


---
## 1) Fashion-MNIST: 데이터 로더


In [None]:
# TODO: Fashion-MNIST DataLoader 만들기
# - transforms: ToTensor + Normalize((0.5,), (0.5,))
# - train_dataset / test_dataset
# - train_loader(batch_size=64, shuffle=True)
# - test_loader(batch_size=1000, shuffle=False)
# - class list 출력

pass


---
## 2) Fashion-MNIST: 모델 정의


In [None]:
# TODO: SmallCNN / BigCNN / BigCNN_Dropout 정의
# - SmallCNN: (1->16->32), Linear(32*7*7->128->10)
# - BigCNN:   (1->32->64), Linear(64*7*7->256->10)
# - BigCNN_Dropout: BigCNN classifier에 Dropout(p=0.5) 추가

class SmallCNN(nn.Module):
    def __init__(self):
        super().__init__()
        # TODO
        pass
    def forward(self, x):
        # TODO
        pass

class BigCNN(nn.Module):
    def __init__(self):
        super().__init__()
        # TODO
        pass
    def forward(self, x):
        # TODO
        pass

class BigCNN_Dropout(nn.Module):
    def __init__(self, p=0.5):
        super().__init__()
        # TODO
        pass
    def forward(self, x):
        # TODO
        pass

# TODO: 파라미터 수 출력 (Small vs Big)
pass


---
## 3) Fashion-MNIST: 본 실험 (epoch=10)


In [None]:
# TODO: 하이퍼파라미터
EPOCHS_FASHION = 10
lr = 1e-3
wd = 1e-4

# TODO: 4개 모델 학습 + history 저장
# hist_small = ...
# hist_big = ...
# hist_big_do = ...
# hist_big_do_wd = ... (weight_decay=wd)

pass


### 3-3) 추가 실험 (필수)
- 위 택1 조건으로 **추가 모델 1개** 만들고 학습하세요.


In [None]:
# TODO: Extra 모델 정의/학습
# 예: Dropout p=0.7, 또는 weight_decay=5e-4, 또는 Linear hidden=512
# hist_extra = ...

pass


### 3-4) 결과 정리
- (1) 마지막 epoch 기준 결과 표
- (2) epoch별 train/test acc 곡선(최소 1개 그래프)


In [None]:
def last_acc(hist):
    return hist[-1][1], hist[-1][3]

rows = [
    ("SmallCNN", "-", *last_acc(hist_small)),
    ("BigCNN", "channels/linear↑", *last_acc(hist_big)),
    ("BigCNN+DO", "dropout p=0.5", *last_acc(hist_big_do)),
    ("BigCNN+DO+WD", "dropout p=0.5, wd=1e-4", *last_acc(hist_big_do_wd)),
    ("Extra", "dropout p=0.7", *last_acc(hist_extra)),
]
results_fashion = pd.DataFrame(rows, columns=["Model", "Change", "TrainAcc_last", "TestAcc_last"])
results_fashion


In [None]:
big_train = [x[1] for x in hist_big]
big_test  = [x[3] for x in hist_big]
do_train  = [x[1] for x in hist_big_do]
do_test   = [x[3] for x in hist_big_do]
epochs = list(range(1, EPOCHS_FASHION + 1))

plt.figure(figsize=(7,4))
plt.plot(epochs, big_train, label="Big train")
plt.plot(epochs, big_test, label="Big test")
plt.plot(epochs, do_train, label="Big+DO train")
plt.plot(epochs, do_test, label="Big+DO test")
plt.xlabel("epoch")
plt.ylabel("accuracy")
plt.legend()
plt.title("Fashion-MNIST: Big vs Big+Dropout")
plt.show()


---
## 4) CIFAR-10: 데이터 로더


In [None]:
# TODO: CIFAR-10 DataLoader 만들기 (수업과 동일)
# train: RandomHorizontalFlip + RandomCrop(32, padding=4) + ToTensor + Normalize(mean=(0.4914, 0.4822, 0.4465),
#                                                                                  std=(0.2470, 0.2435, 0.2616))
# test : ToTensor + Normalize(mean=(0.4914, 0.4822, 0.4465),
#                         std=(0.2470, 0.2435, 0.2616))
# train_loader_cifar(batch_size=64, shuffle=True)
# test_loader_cifar(batch_size=1000, shuffle=False)
# cifar_classes 출력

pass


---
## 5) CIFAR-10: baseline + 개선 모델


### 5-1) Baseline 모델
- TODO: 수업의 CIFARCNN 구현 (3채널 입력, Flatten=64 * 8 * 8)


In [None]:
# TODO: CIFARCNN baseline 구현
class CIFARCNN(nn.Module):
    def __init__(self, dropout_p=0.5):
        super().__init__()
        # TODO
        pass
    def forward(self, x):
        # TODO
        pass

# TODO: 파라미터 수 출력
pass


### 5-2) 학습 (epochs=10)
- TODO: baseline 학습 후 test acc 기록


In [None]:
EPOCHS_CIFAR = 10
lr_cifar = 1e-3

# TODO: baseline 학습
# hist_cifar_base = ...
pass


### 5-3) 개선 모델(필수)
- 아래 조건 중 하나를 만족하는 개선 실험을 하시오.
  - (A) 모델 구조 변경 2개 이상 (채널/Linear/Dropout 등)
  - (B) 학습 설정 변경 2개 이상 (lr, wd, augmentation 추가/제거 등)


In [None]:
# TODO: improved 모델 1개 이상 구현/학습
# hist_cifar_improved = ...

pass


### 5-4) 결과표 + 해석
- Baseline vs Improved의 마지막 Test Acc 표
- 무엇을 바꿨고(2개 이상), 왜 바꿨는지 4줄 이내


In [None]:
base_te = hist_cifar_base[-1][3]
impr_te = hist_cifar_improved[-1][3]
results_cifar = pd.DataFrame([
    ("Baseline", base_te),
    ("Improved", impr_te),
], columns=["Model", "TestAcc_last"])
results_cifar


---
## 6) 개념 요약 (각 3줄 이내, 과제 결과 예시 포함)


In [None]:
# TODO: 각 항목 3줄 이내로 작성 + 이번 결과(모델명/추세)를 1개 이상 언급
overfitting = """"""
dropout = """"""
weight_decay = """"""
augmentation = """"""

print(overfitting)
print(dropout)
print(weight_decay)
print(augmentation)
