In [None]:
from google.colab import drive
drive.mount('/gdrive', force_remount=True)

In [None]:
ROOT_PATH = '/gdrive/My Drive/Colab Notebooks/Lectures/'

In [None]:
import numpy as np

In [None]:
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

In [None]:
# 신경망 클래스
class NeuralNetwork:
    # 생성자
    def __init__():
        # 각 층의 노드와 학습율 초기화
        self.input_nodes = input_nodes
        self.hidden_nodes = hidden_nodes
        self.output_nodes = output_nodes
        self.learning_rate = learning_rate

        # Xavier/He 방법으로 가중치 / 바이어스 초기화
        self.W2 = np.random.randn(self.input_nodes, self.hidden_nodes) /
        np.sqrt(self.input_nodes/2)
        self.b2 = np.random.rand(self.hidden_nodes)
        self.W3 = np.random.randn(self.hidden_nodes, self.output_nodes) /
        np.sqrt(self.hidden_nodes/2)
        self.b3 = np.random.rand(self.output_nodes)

        # 출력층 선형회귀 값 Z3, 출력값 A3 정의 (모두 행렬로 표시)
        self.Z3 = np.zeros([1,output_nodes])
        self.A3 = np.zeros([1,output_nodes])

        # 은닉층 선형회귀 값 Z2, 출력값 A2 정의 (모두 행렬로 표시)
        self.Z2 = np.zeros([1,hidden_nodes])
        self.A2 = np.zeros([1,hidden_nodes])

        # 입력층 선형회귀 값 Z1, 출력값 A1 정의 (모두 행렬로 표시)
        self.Z1 = np.zeros([1,input_nodes])
        self.A1 = np.zeros([1,input_nodes])


    # 순전파 프로세스
    def feed_forward(self):
        delta = 1e-7 # log 무한대 발산 방지

        # 입력층 선형회귀 값 Z1, 출력값 A1 계산
        self.Z1 = self.input_data
        self.A1 = self.input_data

        # 은닉층 선형회귀 값 Z2, 출력값 A2 계산
        self.Z2 = np.dot(self.A1, self.W2) + self.b2
        self.A2 = sigmoid(self.Z2)

        # 출력층 선형회귀 값 Z3, 출력값 A3 계산
        self.Z3 = np.dot(self.A2, self.W3) + self.b3
        y = self.A3 = sigmoid(self.Z3)

        return -np.sum( self.target_data*np.log(y+delta) + (1-self.target_data)*np.log((1 - y)+delta) )


    # 손실함수 계산
    def loss_val(self):
        delta = 1e-7 # log 무한대 발산 방지

        # 입력층 선형회귀 값 Z1, 출력값 A1 계산
        self.Z1 = self.input_data
        self.A1 = self.input_data

        # 은닉층 선형회귀 값 Z2, 출력값 A2 계산
        self.Z2 = np.dot(self.A1, self.W2) + self.b2
        self.A2 = sigmoid(self.Z2)

        # 출력층 선형회귀 값 Z3, 출력값 A3 계산
        self.Z3 = np.dot(self.A2, self.W3) + self.b3
        y = self.A3 = sigmoid(self.Z3)

        return -np.sum( self.target_data*np.log(y+delta) + (1-self.target_data)*np.log((1 - y)+delta) )


    # 학습 메소드: 가중치(Weight), 편향치(Bias) 갱신 --> 오류역전파 수행
    # 오차역전파를 이용하여 손실함수가 최소가 될때 까지 학습하는 함수
    def train(self):
        # 피드 포워드 수행
        self.input_data = input_data
        self.target_data = target_data
        f = lambda x : self.feed_forward()

        # 출력층 loss 인 loss_3 구함
        loss_3 = (self.A3-self.target_data) * self.A3 * (1-self.A3)

        # 출력층 가중치 W3, 출력층 바이어스 b3 업데이트
        self.W3 = self.W3 - self.learning_rate * np.dot(self.A2.T, loss_3)
        self.b3 = self.b3 - self.learning_rate * loss_3

        # 은닉층 loss 인 loss_2 구함
        loss_2 = np.dot(loss_3, self.W3.T) * self.A2 * (1-self.A2)

        # 은닉층 가중치 W2, 은닉층 바이어스 b2 업데이트
        self.W2 = self.W2 - self.learning_rate * np.dot(self.A1.T, loss_2)
        self.b2 = self.b2 - self.learning_rate * loss_2


    # 예측 메소드
    def predict(self):
        Z2 = np.dot(input_data, self.W2) + self.b2
        A2 = sigmoid(Z2)
        Z3 = np.dot(A2, self.W3) + self.b3
        y = A3 = sigmoid(Z3)

        # MNIST 경우는 one-hot encoding 을 적용하기 때문에
        # 0 또는 1 이 아닌 argmax() 를 통해 최대 인덱스를 넘겨주어야 함
        predicted_num = np.argmax(y)

        return predicted_num


    # 정확도 측정 메소드
    def accuracy(self):
        matched_list = []
        not_matched_list = []

        for index in range(len(test_input_data)):
            label = int(test_target_data[index])

            # 정규화(normalize)
            data = (test_input_data[index, :] / 255.0 * 0.99) + 0.01

            # predict 를 위해서 vector 를 matrix 로 변환하여 인수로 넘겨줌
            self.predict(np.array(data, ndmin=2))

            if label == predicted_num:
                matched_list.append(index)

            else:
                not_matched_list.append(index)

        print("Current Accuracy = ", len(matched_list)/(len(test_input_data)) )
        return matched_list, not_matched_list

In [None]:
###########################
# 학습 수행 코드
###########################

training_data = np.loadtxt('./mnist_train.csv', delimiter=',', dtype=np.float32)

i_nodes = 784       # input nodes 개수
h1_nodes = 100      # hidden nodes 개수.
o_nodes = 10        # output nodes 개수
lr = 0.3            # learning rate
epochs = 1          # 반복횟수

# NeuralNetwork 객체 생성
obj = NeuralNetwork (i_nodes, h1_nodes, o_nodes, lr)

for i in range(epochs):
    for step in range(len(training_data)):
        # normalize
        input_data = ((training_data[index, 1:] / 255.0) * 0.99) + 0.01
        target_data = np.zeros(o_nodes) + 0.01
        target_data[int(training_data[index, 0])] = 0.99

        # 입력 / 정답 데이터를 행렬(matrix)로 만들어서 train 메서드 호출
        obj.train(np.array(input_data, ndmin=2), np.array(target_data, ndmin=2))
        if (index % 1000 == 0):
            print("epochs = ", i, ", step = ", step, ", loss value = ", obj.loss_val())

In [None]:
###########################
# 검증 코드
###########################

test_data = np.loadtxt('./mnist_test.csv', delimiter=',', dtype=np.float32)
test_input_data = test_data[ :, 1: ]
test_target_data = test_data[ :, 0 ]
(true_list, false_list) = obj.accuracy(test_input_data, test_target_data) 