1. MLP의 구현 조건은 다음과 같습니다.

   - 5층(입력층, 은닉층 3개, 출력층)을 가지는 분류용 MLP를 구현합니다.

   - 각 은닉층의 노드 수는 입력데이터에 따라 적절히 설정합니다.

   - 입력은 미니배치로 배치크기를 다르게 입력할 수 있도록 합니다.

   - 출력은 MNIST와 같이  10가지 경우를 구별할 수 있게 만듭니다.

   - 클래스를 적절히 이용해 구현합니다.



2. MLP 학습코드 구현 조건은 다음과 같습니다.

   - 오류역전파 방식으로 학습을 수행합니다.

   - 최적화 알고리즘으로 SGD, Adam을 선택해 학습 가능하도록 합니다.

   - 과적합 방지 알고리즘으로 Batch Normalization, Weight Decay을 선택해 학습 가능하도록 합니다.

   - 클래스를 적절히 이용해 구현합니다.



3. 학습 데이터 

   - fashion-MNIST를 사용합니다.

   - fashion-MNIST 데이터는 https://github.com/zalandoresearch/fashion-mnist 에서 다운받아 사용합니다.

   - 학습데이터를 이용해 학습하고 시험데이터를 이용해 평가합니다.



4. 학습 결과 출력: 다음 결과를 도출합니다.

   - 데이터셋: Fashion MNIST

   - 미니배치 사이즈: 10, 100, 1000

   - 에폭 수: 30

   - 최적화 알고리즘: SGD, Adam 

   - 과적합 방지 알고리즘: 사용X, Batch Normalization, Weight Decay

   - 18개 설정(미니배치3X최적화2X과적합방지3)에 대해 모두 학습하고 학습 정확도 및 시험 정확도를 수치와 그래프로 표시하되 시험정확도가 높은 순으로 표시하세요.

   - 추가로, 가장 시험정확도가 높은 모델을 이용해 시험데이터 중 샘플로 5개를 읽어들여 그림을 표시하고 분류결과를 표시하여 확인하는 코드를 작성하세요. 

In [1]:
import mnist_reader

In [2]:
X_train, y_train = mnist_reader.load_mnist('../data/fashion', kind='train')
X_test, y_test = mnist_reader.load_mnist("../data/fashion", kind="t10k")

In [3]:
X_train.shape

(60000, 784)

In [4]:
from my_model import SGD, Adam,ThreeLayerNet, Sigmoid, Affine, SoftmaxWithLoss

In [5]:
import numpy as np

In [6]:
network = ThreeLayerNet(input_size =784, hidden_size = 50, output_size = 10)
optimizer = Adam()
iters_num = 10000
train_size = X_train.shape[0]
test_size = X_test.shape[0]
batch_size = 100

train_loss_list = {}
train_acc_list = {}
test_acc_list = {}

train_loss_list["SGD"] = []
train_acc_list["SGD"] = []
test_acc_list["SGD"] = []


train_loss_list["Adam"] = []
train_acc_list["Adam"] = []
test_acc_list["Adam"] = []

In [10]:
iter_per_epoch = max(train_size / batch_size, 1)

for i in range(iters_num):
    # 미니배치 데이터 획득 
    batch_mask = np.random.choice(train_size, batch_size)
    x_batch = X_train[batch_mask]
    t_batch = y_train[batch_mask]
    
    # 수치 기울기 계산
    grads = network.gradient(x_batch, t_batch)

    # 가중치 갱신 
    params = network.params
    optimizer.update(params, grads)
    
    # 학습 손실 기록
    loss = network.loss(x_batch, t_batch)
    train_loss_list["Adam"].append(loss)
    # print("iteration ", i+1, ": loss = ", loss) 
    
    if i % iter_per_epoch == 0:
        train_acc = network.accuracy(x_batch, t_batch)
        test_acc  = network.accuracy(X_test,  y_test)
        train_acc_list["Adam"].append(train_acc)
        test_acc_list["Adam"].append(test_acc)
        print("iteration", i, ": train acc =", train_acc, ", test acc =", test_acc)

iteration 0 : train acc = 0.75 , test acc = 0.7815
iteration 600 : train acc = 0.79 , test acc = 0.7953
iteration 1200 : train acc = 0.81 , test acc = 0.7853
iteration 1800 : train acc = 0.83 , test acc = 0.7883
iteration 2400 : train acc = 0.83 , test acc = 0.7753
iteration 3000 : train acc = 0.85 , test acc = 0.787
iteration 3600 : train acc = 0.83 , test acc = 0.7909
iteration 4200 : train acc = 0.81 , test acc = 0.7869
iteration 4800 : train acc = 0.82 , test acc = 0.783
iteration 5400 : train acc = 0.71 , test acc = 0.7772
iteration 6000 : train acc = 0.79 , test acc = 0.7679
iteration 6600 : train acc = 0.83 , test acc = 0.7821
iteration 7200 : train acc = 0.78 , test acc = 0.7793
iteration 7800 : train acc = 0.8 , test acc = 0.7925
iteration 8400 : train acc = 0.83 , test acc = 0.7796
iteration 9000 : train acc = 0.88 , test acc = 0.7559
iteration 9600 : train acc = 0.84 , test acc = 0.7884


In [None]:
iter_per_epoch = max(train_size / batch_size, 1)

for i in range(iters_num):
    # 미니배치 데이터 획득 
    batch_mask = np.random.choice(train_size, batch_size)
    x_batch = X_train[batch_mask]
    t_batch = y_train[batch_mask]
    
    # 수치 기울기 계산
    grads = network.gradient(x_batch, t_batch)

    # 가중치 갱신 
    params = network.params
    optimizer.update(params, grads)
    
    # 학습 손실 기록
    loss = network.loss(x_batch, t_batch)
    train_loss_list["SGD"].append(loss)
    # print("iteration ", i+1, ": loss = ", loss) 
    
    if i % iter_per_epoch == 0:
        train_acc = network.accuracy(X_train, t_batch)
        test_acc  = network.accuracy(X_test,  y_test)
        train_acc_list["SGD"].append(train_acc)
        test_acc_list["SGD"].append(test_acc)
        print("iteration", i, ": train acc =", train_acc, ", test acc =", test_acc)