# 4.4 MLP - Stochastic Gradient Descent Method

In [1]:
''' 
 Author: Yoonhyuck WOO / JBNU_Industrial Information system Engineering
 Date; 3. 19. 2021 - 5. 24. 2021
 Title: Artificial Intelligence_Project 2
 Professor: Seung-Hoon Na'''
  
import numpy as np
import random
import matplotlib.pyplot as plt
import sys, os
sys.path.append(os.pardir)  # 부모 디렉터리의 파일을 가져올 수 있도록 설정
from dataset.mnist import load_mnist

# dataset 1번째 방법

In [2]:
(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, flatten=True, one_hot_label=True)

In [3]:
print(x_train.shape)
print(t_train.shape)

print(np.max(x_train[0]))

(60000, 784)
(60000, 10)
1.0


### ======================================

### Layer

In [4]:
class Layer():
    def __init__(self,input_size,output_size):
#         self.w = np.random.randn(input_size,output_size)
#         self.b = np.random.randn(output_size)
        
        self.w = np. random.randn(input_size,output_size)
        self.b = np.zeros(output_size)
        self.dydw = None
        self.dydb = 1 
        
    def forward(self,X):
        self.dydw = X.T
        affine = np.dot(X,self.w) + self.b
        
        return affine
    
    def backward(self,dLdy,lr):
        dLdw = np.dot(self.dydw,dLdy)
        dLdb = np.sum(np.dot(dLdy, self.dydb),axis=0)
        
        dLdx = np.dot(dLdy,np.transpose(self.w))
       
        self.w -= lr * dLdw
        
        self.b -= lr * dLdb
        
        return dLdx
        

# Make Relu class

In [5]:
class Relu():
    def __init__(self):
        self.mask = None
        
    def forward(self,x):
        self.mask = (x <= 0)
        out = x.copy()
        out[self.mask] = 0
        
        return out
    
    def backward(self, dout):
#         print('dout',dout.shape)
#         print('mask',self.mask.shape)
        dout[self.mask]= 0
        #dout * np.where(self.mask==True,1,0)
        return dout * np.where(self.mask == True,1,0)

## Model

In [47]:
### 마지막
class Model():
    def __init__(self):
        self.layers = []
        #layer 설정
        self.layer=[784]
        L = int(input('Number of Hidden_Layer: '))
        for i in range(L):
        #     print(i+1,'th Dimenson', end = ' ') 
        #     print(end='')
            d = int(input('Dimension:'))
            self.layer.append(d)    
        self.length = len(self.layer)
       
        for i in range(self.length-1):
            self.layers.append(Layer(self.layer[i],self.layer[i+1]))
            self.layers.append(Relu())
        self.layers.append(Layer(self.layer[-1],10))
    
    def forward(self,put):
        output = self.layers[0].forward(put)
        for i in range(1,len(self.layers)):            
            output = self.layers[i].forward(output)
        return output
    
    def backward(self, dld_, lr):
        for i in range(self.length-1,0,-1):
            dld_ = self.layers[i*2].backward(dld_, lr)
            dld_ = self.layers[i*2-1].backward(dld_)
        dld_ = self.layers[0].backward(dld_,lr)

        return dld_

In [33]:
mode = Model()

Layer:  3
Dimension: 100
Dimension: 40
Dimension: 30


# Make softmax class

# Make Cross_entropy class

# Softmax - with - Loss

In [34]:
class SoftmaxwithLoss:
    def __init__(self):
        self.loss = None
        self.y = None
        self.t = None
        
    def softmax(self,a):
        c = np.max(a,axis=-1,keepdims=True)
        exp_a = np.exp(a-c)
        sum_exp_a = np.sum(exp_a,axis=-1,keepdims=True)
        y = exp_a / sum_exp_a
        
        return y
    
    def cross_entropy_error(self,y,t):
        delta = 1e-13
        return -np.sum(t * np.log(y + delta)) / y.shape[0]
    
    def forward(self,x,t):
        self.t = t
        self.y = self.softmax(x)
        self.loss = self.cross_entropy_error(self.y, self.t)
        return self.loss
    
    def backward(self, dout=1):
        batch_size = self.t.shape[0]
        dx = (self.y - self.t) / batch_size
        
        return dx

## learning

In [45]:
def accuracy(pred, target):
    pred = np.argmax(pred, axis=1)
    if target.ndim != 1 :
        target = np.argmax(target,axis=1)
        
    accuracy = np.sum(pred == target) / float(pred.shape[0])
    
    return accuracy

def learning(model,loss_func,X,y, minibatch_size, epoch_size, learning_rate):
    acc_list = []
    
    for e in range(1,epoch_size+1):
        
        combined = list(zip(X, y))
        permut = np.random.permutation(combined)
        X[:], y[:] = zip(*permut)
        
        number_minibatch= np.int(np.ceil(X.shape[0] / minibatch_size))
        
        for n in range(1, number_minibatch+1):

            X_temp=X[minibatch_size * (n-1):minibatch_size*n]
            y_temp=y[minibatch_size * (n-1):minibatch_size*n]
            
            c = model.forward(X_temp)
            J = loss_func.forward(c,y_temp)
        
            dJdh = loss_func.backward()
            model.backward(dJdh,learning_rate)

 
        c = model.forward(X)
        J = loss_func.forward(c,y)


        acc = accuracy(c, y)

        acc_list.append(acc)
        if e % iter_per_epoch == 0:
            print('*************',e,'번차 epoch *************')
    #             print('최종')
    #             print(J)
#             print('정확도')
#             print(acc)
        
    return acc_list

# 4.4

In [46]:
model = Model()
swl = SoftmaxwithLoss()

minibatch_size = 100
iter_per_epoch = 10


epoch_size = int(input('Epeoch_size:'))
train_result = learning(model, swl, x_train, t_train, minibatch_size, epoch_size, 0.0001)
test_result = learning(model, swl, x_test, t_test, minibatch_size, epoch_size, 0.0001)
learning(model, swl, x_train, t_train, minibatch_size, epoch_size, 0.0001)

Layer:  2
Dimension: 58
Dimension: 33
Epeoch_size: 100


************* 10 번차 epoch *************
정확도
0.45765
************* 20 번차 epoch *************
정확도
0.6535833333333333
************* 30 번차 epoch *************
정확도
0.7666166666666666
************* 40 번차 epoch *************
정확도
0.78555
************* 50 번차 epoch *************
정확도
0.8476833333333333
************* 60 번차 epoch *************
정확도
0.8690333333333333
************* 70 번차 epoch *************
정확도
0.8928166666666667
************* 80 번차 epoch *************
정확도
0.9294333333333333
************* 90 번차 epoch *************
정확도
0.9426333333333333
************* 100 번차 epoch *************
정확도
0.95525


[0.13635,
 0.1737,
 0.23818333333333333,
 0.30078333333333335,
 0.31071666666666664,
 0.37223333333333336,
 0.35615,
 0.40166666666666667,
 0.41846666666666665,
 0.45765,
 0.46885,
 0.50585,
 0.5250333333333334,
 0.5445666666666666,
 0.5878,
 0.6001666666666666,
 0.6133333333333333,
 0.6279166666666667,
 0.63955,
 0.6535833333333333,
 0.6972833333333334,
 0.7186833333333333,
 0.7161166666666666,
 0.7246,
 0.72565,
 0.7426333333333334,
 0.7395666666666667,
 0.7591666666666667,
 0.7879333333333334,
 0.7666166666666666,
 0.7595,
 0.7601,
 0.7697166666666667,
 0.7624666666666666,
 0.77075,
 0.7749333333333334,
 0.76855,
 0.7770666666666667,
 0.7956,
 0.78555,
 0.7876,
 0.81645,
 0.8212333333333334,
 0.8327666666666667,
 0.8378333333333333,
 0.8248333333333333,
 0.8330833333333333,
 0.8364166666666667,
 0.8448333333333333,
 0.8476833333333333,
 0.8451333333333333,
 0.8467166666666667,
 0.8417166666666667,
 0.8398166666666667,
 0.8594333333333334,
 0.8560333333333333,
 0.855,
 0.862316666666

In [43]:
model2 = Model()
swl2 = SoftmaxwithLoss()

minibatch_size = 100
epoch_size = 130
iter_per_epoch = 10

learning(model2,swl2,x_train, t_train, minibatch_size, epoch_size, 0.01)

Layer:  1
Dimension: 100


************* 10 번차 epoch *************
정확도
0.9968
************* 20 번차 epoch *************
정확도
0.9996833333333334


KeyboardInterrupt: 