# Understand the structure of perceptron/neural nets

**Note:** 이 `notebook`을 실행하기 전에 다음과 같은 내용을 먼저 알아보겠습니다.
 1. `OR` question
 2. Perceptron and Neural Nets
 
 
이번 노트북에서는 `keras`를 사용하지 않고, `numpy`를 위주로 사용하여서 `perceptron` 및 `neural nets`의 구조를 살펴보겠습니다. 이 `notebook`의 목적은 실제 모델이 학습과정에서 어떻게 `weight`와 `bias`를 수정하고, 어떻게 주어진 값을 통해서 결과값을 예측하는지 이해하는 것입니다. 

In [2]:
# python notebook for Make Your Own Neural Network
# code for a 3-layer neural network, and code for learning the MNIST dataset
# (c) Tariq Rashid, 2016
# license is GPLv2

# Modified: Seongjin Park (seongjinpark@email.arizona.edu)

In [4]:
import numpy
# scipy.special for the sigmoid function expit()
import scipy.special
# library for plotting arrays

## Model structure

`python`에서 `class`의 개념은 이해하지 못하셔도 좋습니다. 하지만 아래의 모델이 어떠한 구조로 이루어져 있는지는 이해하셔야 합니다. 

In [20]:
# neural network class definition
class neuralNetwork:
    
    
    # initialise the neural network
    def __init__(self, inputnodes, outputnodes, learningrate):
        # set number of nodes in each input, hidden, output layer
        self.inodes = inputnodes
        self.onodes = outputnodes
        
        # link weight matrices, wih and who
        # weights inside the arrays are w_i_j, where link is from node i to node j in the next layer
        # w11 w21
        # w12 w22 etc 
        self.wio = numpy.random.normal(0.0, pow(self.inodes, -0.5), (self.onodes, self.inodes))

        # learning rate
        self.lr = learningrate
        
        # activation function is the sigmoid function
        self.activation_function = lambda x: scipy.special.expit(x)
        
        pass

    
    # train the neural network
    def train(self, inputs_list, targets_list):
        # convert inputs list to 2d array
        inputs = numpy.array(inputs_list, ndmin=2).T
        targets = numpy.array(targets_list, ndmin=2).T
        
        # calculate signals into final output layer
        final_inputs = numpy.dot(self.wio, inputs)
        # calculate the signals emerging from final output layer
        final_outputs = self.activation_function(final_inputs)
        
        # output layer error is the (target - actual)
        output_errors = targets - final_outputs
        
        # update the weights for the links between the hidden and output layers
        self.wio += self.lr * numpy.dot((output_errors * final_outputs * (1.0 - final_outputs)), numpy.transpose(inputs))     
        
        pass

    
    # query the neural network
    def query(self, inputs_list):
        # convert inputs list to 2d array
        inputs = numpy.array(inputs_list, ndmin=2).T
        
        # calculate signals into final output layer
        final_inputs = numpy.dot(self.wio, inputs)
        # calculate the signals emerging from final output layer
        final_outputs = self.activation_function(final_inputs)
        
        return final_outputs

간단한 모델을 구성하여서 그 결과를 살펴보도록 하겠습니다. 

In [11]:
# number of input, hidden and output nodes
input_nodes = 3
output_nodes = 3

# learning rate is 0.3
learning_rate = 0.3

# create instance of neural network
n = neuralNetwork(input_nodes, output_nodes, learning_rate)

모델에 입력값을 주었을 경우, 그 예측값이 어떻게 나타나는지 살펴보겠습니다. 

**Note:** 아래 셀은 실행할 때마다 값이 바뀔 것입니다. 그 이유는 학습이 이루어지지 않은 모델을 이용해서 `query`를 수행하기 때문입니다. 모델에서 `__init__` 아래에 정의되어있는 **numpy.random.normal()** 명령어에서 정규분포에 따라 무작위의 값을 생성하여 `weight`로 사용하기 때문에, 값은 매번 바뀔 것입니다. 

In [12]:
# test query (doesn't mean anything useful yet)
n.query([1.0, 0.5, -1.5])

array([[0.36402664],
       [0.08701169],
       [0.27530904]])

## `OR` question

`OR` 기능은 다음과 같이 정의할 수 있습니다. 
 - 두 개의 값 중에 하나라도 참이면 결과는 참이다.
 
과연 그렇다면 `OR`의 기능을 수행할 수 있는 모델을 구축 가능할지 확인해보도록 하겠습니다. 

먼저 입력값과 출력값을 담고 있는 `numpy` 행렬을 만들어 보도록 하겠습니다. 

In [13]:
X_data = [[0., 0.],
          [0., 1.],
          [1., 0.],
          [1., 1.]]

y_data = [[0.],
          [1.],
          [1.],
          [1.]]

두 개의 입력값과 하나의 출력값을 갖는 모델을 생성하겠습니다. 

In [21]:
model = neuralNetwork(2, 1, 0.1)

## Training

생성한 모델을 학습해보도록 하겠습니다. 

In [23]:
# train the neural networki

# epochs is the number of times the training data set is used for training
epochs = 100

for e in range(epochs):
    # go through all records in the training data set
    for i in range(0,len(X_data)):
        
        # Set input
        inputs = X_data[i]
        # Set output
        targets = y_data[i]
        
        model.train(inputs, targets)
        
        
        pass
    print("Epoch:\t", e)
    print("Weights:\t", model.wio)
        
    pass

Epoch:	 0
Weights:	 [[ 0.55324479 -0.36925021]]
Epoch:	 1
Weights:	 [[ 0.57280171 -0.34386746]]
Epoch:	 2
Weights:	 [[ 0.59188125 -0.31889768]]
Epoch:	 3
Weights:	 [[ 0.6104885  -0.29434449]]
Epoch:	 4
Weights:	 [[ 0.62862999 -0.27020963]]
Epoch:	 5
Weights:	 [[ 0.64631353 -0.24649321]]
Epoch:	 6
Weights:	 [[ 0.66354794 -0.22319386]]
Epoch:	 7
Weights:	 [[ 0.68034293 -0.20030892]]
Epoch:	 8
Weights:	 [[ 0.6967089  -0.17783463]]
Epoch:	 9
Weights:	 [[ 0.71265679 -0.15576626]]
Epoch:	 10
Weights:	 [[ 0.72819793 -0.1340983 ]]
Epoch:	 11
Weights:	 [[ 0.74334394 -0.11282457]]
Epoch:	 12
Weights:	 [[ 0.7581066  -0.09193831]]
Epoch:	 13
Weights:	 [[ 0.77249775 -0.07143236]]
Epoch:	 14
Weights:	 [[ 0.78652925 -0.05129923]]
Epoch:	 15
Weights:	 [[ 0.80021286 -0.03153113]]
Epoch:	 16
Weights:	 [[ 0.81356018 -0.01212015]]
Epoch:	 17
Weights:	 [[0.82658266 0.00694178]]
Epoch:	 18
Weights:	 [[0.83929151 0.02566276]]
Epoch:	 19
Weights:	 [[0.85169767 0.04405091]]
Epoch:	 20
Weights:	 [[0.86381181 0.

## Evaluation

실제 모델이 두 개의 입력을 받았을 때, `OR` 기능에 해당하는 예측을 할 수 있는지 확인해보겠습니다. 

In [26]:
for j in range(0, len(X_data)):
    # correct answer is first value
    correct_label = y_data[j]
    # scale and shift the inputs
    inputs = X_data[j]
    # query the network
    outputs = model.query(inputs)
    # the index of the highest value corresponds to the label
    if (outputs > 0.5):
        label = 1
    else:
        label = 0
               
    print(inputs, "\t", outputs, "\t", correct_label)

[0.0, 0.0] 	 [[0.5]] 	 [0.0]
[0.0, 1.0] 	 [[0.71287984]] 	 [1.0]
[1.0, 0.0] 	 [[0.7994085]] 	 [1.0]
[1.0, 1.0] 	 [[0.90821345]] 	 [1.0]
