# 이번주에 우리는 다음 역할들을 하는 코드를 작성했습니다.

- <span style = 'font-size:1.2em;line-height:1.5em'>1. Activation Function</span>
- <span style = 'font-size:1.2em;line-height:1.5em'>2. 미리 학습한 weight들 불러와서 network 구성하기</span>
- <span style = 'font-size:1.2em;line-height:1.5em'>3. NN에 입력할 데이터 추출하기 (single data / minibatch data)</span>
- <span style = 'font-size:1.2em;line-height:1.5em'>4. 추출한 데이터로 Forward Propagation진행하기</span>
- <span style = 'font-size:1.2em;line-height:1.5em'>5. 분류 성능 결과 산출 및 오분류한 데이터 파악하기</span>

## 이런식의 코드를 막 그냥 작성해버리면 나중에 알아보기 어렵습니다.

- <span style = 'font-size:1.2em;line-height:1.5em'>게다가, Jupyter Notebook형식의 .ipynb로 작성하면 나중에 이 코드를 다시 써먹기가 어렵습니다.</span>

- <span style = 'font-size:1.2em;line-height:1.5em'>좀 헷갈려도 코드를 모듈화하고 스크립트 파일인 .py파일로 변환해줄 필요가 있습니다.</span>

## 먼저 코드를 모듈화 해보겠습니다.

- <span style = 'font-size:1.2em;line-height:1.5em'>1. Activation Function: 이미 첫번째 jupyter notebook에서 모듈화 완료하여 .py파일로 분리하였습니다.</span>

- <span style = 'font-size:1.2em;line-height:1.5em'>2. 미리 학습한 weight들 불러와서 network 구성하기</span>

In [1]:
import numpy as np
import pickle
from mnist import load_mnist
from act_func import sigmoid, softmax

In [2]:
def init_network():
    fpath = 'sample_weights/sample_weight.pkl'
    with open(fpath, 'rb') as f:
        network = pickle.load(f)
    return network

- <span style = 'font-size:1.2em;line-height:1.5em'>3. NN에 입력할 데이터 추출하기 (single data / minibatch data)</span>

In [3]:

def get_batch_data(X, y, start_idx, end_idx):
    x_batch = X[start_idx:end_idx]
    y_batch = y[start_idx:end_idx]
    return x_batch, y_batch

- <span style = 'font-size:1.2em;line-height:1.5em'>4. 추출한 데이터로 Forward Propagation진행하기</span>

In [4]:
def forward_propagation(network, x):
    w1, w2, w3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    
    a1 = np.dot(x,w1)+b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1,w2)+b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2,w3)+b3
    output = softmax(a3)
    
    return output

- <span style = 'font-size:1.2em;line-height:1.5em'>이제 다음과 같이 코드가 정리됩니다.</span>

In [5]:
(x_trn, y_trn), (x_tst, y_tst) = load_mnist(flatten=True, normalize=False)
network = init_network()
batch_size = 100

results = []
for i in range(0,x_trn.shape[0],batch_size):
    x_batch, _ = get_batch_data(x_trn, y_trn, i, i+batch_size)
    pred_score_batch = forward_propagation(network, x_batch)
    pred_label_batch = np.argmax(pred_score_batch, axis=1)
    results.extend(pred_label_batch)
    
print(f'미리 학습한 모델의 정확도는 {100*np.sum(results==y_trn) / len(y_trn):.2f}%입니다.')

  result = 1/(1+np.exp(-x))


미리 학습한 모델의 정확도는 92.52%입니다.


# 과제

<span style = 'font-size:1.2em;line-height:1.5em'>1. 위의 함수들은 numpy 형식으로 되어있었습니다. 이를 Pytorch기반의 코드로 바꿔보세요. nn등의 High-level API를 사용하지 마시고, tensor 연산 기반의 코드로 작성해보세요.</span>

- <span style = 'font-size:1.1em;line-height:1.3em'>Hint 1. Activation function들을 Pytorch코드로 변환하셔야 됩니다.</span>
- <span style = 'font-size:1.1em;line-height:1.3em'>Hint 2. network에 있는 numpy array를 Pytorch tensor 형태로 변환하세요.</span>
- <span style = 'font-size:1.1em;line-height:1.3em'>Hint 3. MNIST mini-batch data는 현재 numpy array인데 Pytorch tensor 형태로 변환하세요.</span>
- <span style = 'font-size:1.1em;line-height:1.3em'>Hint 4. Pytorch에서 텐서곱은 torch.matmul()입니다.</span>