## 1. Neural Networks

![](./img/neural_network.PNG)


## 2. Architecture of Neural Network
- Activation Function
- Output Layer
- Implementation

### 2-1. Activation Function

#### Perceptron

#### Step Function
- 선형 함수의 결과를 비선형으로 나타내기 위한 함수 
- 0또는 1로 표현

#### Sigmoid Function
- 선형 함수의 결과를 비선형으로 나타내기 위한 함수
- 0~1까지의 비선형으로 표현 
- 신경망 초기 모델에 자주 사용됨  
→ (단점) 양 극단에 가까울 수록

#### Step Function & Sigmoid Function
- 두 함수 모두 비선형 함수
    - 신경망에서는 활성화 함수로 비선형 함수를 사용해야 함  
      → 선형함수의 경우, layer가 쌓여도 상수값만 변하기 때문.

#### ReLU Function
- 선형 함수의 결과를 선형으로 나타내기 위한 함수
  → 깊이가 깊어질수록 비선형 함수와 비슷한 모습을 하기에 선형임에도 사용 가능.
- 특정 값(0)을 기준으로 0또는 '입력값 그대로'를 출력  
- (장점) : 계산과정이 단순해 다른 선형함수들에 비해 매우 빠르다.
- (단점) : 특정 노드의 가중치가 0이 되면 학습이 완료될 때까지 0으로 남음. 

### 2-2. Output Layer

👉 학습시 속도가 굉장이 느리고 오래걸림. 대신 판단 속도가 빠르다.

In [1]:
 # coding: utf-8
import sys, os
import numpy as np
import pickle
from mnist import load_mnist
from functions import sigmoid, softmax

In [2]:
 def get_data():
    (x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, flatten=True, one_hot_label=False)
    return x_test, t_test

In [3]:
def init_network():
    with open("sample_weight.pkl", 'rb') as f:
        network = pickle.load(f)  #pickle : 학습된 데이터를 불러옴.
    return network

In [4]:
def predict(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3  #3계층 네트워크(z1,z2,z3)
    y = softmax(a3)
    return y

In [None]:
x, t = get_data()
network = init_network()

Downloading train-images-idx3-ubyte.gz ... 
Done
Downloading train-labels-idx1-ubyte.gz ... 


In [None]:
accuracy_cnt = 0
for i in range(len(x)):
    y = predict(network, x[i])
    p= np.argmax(y) # 확률이 가장 높은 원소의 인덱스를 얻는다.
    if p == t[i]:
        accuracy_cnt += 1
    print("Accuracy:" + str(float(accuracy_cnt) / len(x)))
