In [27]:
# 201801528 김동규

In [28]:
# 3계층의 신경망으로 MNIST 데이터를 학습하는 코드

import numpy as np
# 시그모이드 함수 expit() 사용을 위해 풀러오기
import scipy.special
# 행렬을 시각화하기 위한 라이브러리
import matplotlib.pyplot as plt
# 시각화가 외부 윈도우가 아닌 현재의 노트북 내에서 보이도록 설정
%matplotlib inline

In [29]:
# 신경망 클래스의 정의
class neuralNetwork:
    # 신경망 초기화하기
    def __init__(self, inputnodes, hiddennodes1, hiddennodes2, outputnodes, learningrate):
        # 입력, 은닉1, 은닉2, 출력 계층의 노드 개수 설정
        self.inodes = inputnodes
        self.hnodes1 = hiddennodes1
        self.hnodes2 = hiddennodes2
        self.onodes = outputnodes
        
        # 가중치 행렬 wih1, wh1h2, wh2o
        self.wih1 = np.random.normal(0.0, pow(self.hnodes1, -0.5), (self.hnodes1, self.inodes))
        self.wh1h2 = np.random.normal(0.0, pow(self.hnodes2, -0.5), (self.hnodes2, self.hnodes1))
        self.wh2o = np.random.normal(0.0, pow(self.onodes, -0.5), (self.onodes, self.hnodes2))
        
        # 학습률
        self.lr = learningrate
        
        # 활성화 함수로는 시그모이드 함수를 이용
        self.activation_function = lambda x : scipy.special.expit(x)
        
        pass
    
    # 신경망 학습시키기
    def train(self, inputs_list, targets_list):
        # 입력 리스트를 2차원의 행렬로 변환
        inputs = np.array(inputs_list, ndmin = 2).T
        targets = np.array(targets_list, ndmin = 2).T
        
        # 은닉 계층1로 들어오는 신호를 계산
        hidden_inputs1 = np.dot(self.wih1, inputs)
        # 은닉 계층1에서 나가는 신호를 계산
        hidden_outputs1 = self.activation_function(hidden_inputs1)
        
        # 은닉 계층2로 들어오는 신호를 계산
        hidden_inputs2 = np.dot(self.wh1h2, hidden_outputs1)
        # 은닉 계층2에서 나가는 신호를 계산
        hidden_outputs2 = self.activation_function(hidden_inputs2)
        
        # 최종 출력 계층으로 들어오는 신호를 계산
        final_inputs = np.dot(self.wh2o, hidden_outputs2)
        # 최종 출력 계층에서 나가는 신호를 계산
        final_outputs = self.activation_function(final_inputs)
        
        # 출력 계층의 오차는 (실제 값 - 계산 값)
        outputs_errors = targets - final_outputs
        
        # 은닉 계층2의 오차는 가중치에 의해 나뉜 출력 계층의 오차들을 재조합해 계산
        hidden_errors2 = np.dot(self.wh2o.T, outputs_errors)
        # 은닉 계층1의 오차는 가중치에 의해 나뉜 은닉 계층2의 오차들을 재조합해 계산
        hidden_errors1 = np.dot(self.wh1h2.T, hidden_errors2)
        
        # 은닉 계층2와 출력 계층 간의 가중치 업데이트
        self.wh2o += self.lr * np.dot((outputs_errors * final_outputs * (1.0 - final_outputs)), np.transpose(hidden_outputs2))
        
        # 은닉 계층1과 은닉 계층1 간의 가중치 업데이트
        self.wh1h2 += self.lr * np.dot((hidden_errors2 * hidden_outputs2 * (1.0 - hidden_outputs2)), np.transpose(hidden_outputs1))
        
        # 입력 계층과 은닉 계층 간의 가중치 업데이트
        self.wih1 += self.lr * np.dot((hidden_errors1 * hidden_outputs1 * (1.0 - hidden_outputs1)), np.transpose(inputs))
        
        pass
    
    # 신경망 질의하기
    def query(self, inputs_list):
        # 입력 리스트를 2차원 행렬로 변환
        inputs = np.array(inputs_list, ndmin = 2).T
        
        # 은닉 계층1로 들어오는 신호를 계산
        hidden_inputs1 = np.dot(self.wih1, inputs)
        # 은닉 계층1에서 나가는 신호를 계산
        hidden_outputs1 = self.activation_function(hidden_inputs1)
        
        # 은닉 계층2로 들어오는 신호를 계산
        hidden_inputs2 = np.dot(self.wh1h2, hidden_outputs1)
        # 은닉 계층2에서 나가는 신호를 계산
        hidden_outputs2 = self.activation_function(hidden_inputs2)
        
        # 최종 출력 계층으로 들어오는 신호를 계산
        final_inputs = np.dot(self.wh2o, hidden_outputs2)
        # 최종 출력 계층에서 나가는 신호를 계산
        final_outputs = self.activation_function(final_inputs)
        
        return final_outputs

In [30]:
# mnist 학습 데이터인 csv 파일을 리스트로 불러오기
training_data_file = open("C:/Users/Prof_Baek/Desktop/git_repos/Jupyter/NNlab2/mnist_train.csv", "r")
training_data_list = training_data_file.readlines()
training_data_file.close()

In [31]:
# mnist 테스트 데이터인 csv 파일을 리스트로 불러오기
test_data_file = open("C:/Users/Prof_Baek/Desktop/git_repos/Jupyter/NNlab2/mnist_test.csv", "r")
test_data_list = test_data_file.readlines()
test_data_file.close()

In [32]:
# 입력, 은닉1, 은닉2, 출력 노드의 수
inputs_nodes = 784
hidden_nodes1 = 100
hidden_nodes2 = 100
output_nodes = 10

# 학습률은 0.03
learning_rate = 0.03

# 신경망의 인스턴스 생성
n = neuralNetwork(inputs_nodes, hidden_nodes1, hidden_nodes2, output_nodes, learning_rate)

In [33]:
# 신경망 학습시키기

# 주기(epoch)란 학습 데이터가 학습을 위해 사용되는 횟수를 의미
epochs = 5

for e in range(epochs):
    # 학습 데이터 모음 내의 모든 레코드 탐색
    for record in training_data_list:
        # 레코드를 쉼표에 의해 분리
        all_values = record.split(',')
        # 입력 값의 범위와 값 조정
        inputs = (np.asfarray(all_values[1 : ]) / 255.0 * 0.99) + 0.01
        # 결과 값 생성 (실제 값인 0.99 외에는 모두 0.01)
        targets = np.zeros(output_nodes) + 0.01
        # all_values[0]은 이 레코드에 대한 결과 값
        targets[int(all_values[0])] = 0.99
        n.train(inputs, targets)
        pass
pass

In [34]:
# 신경망 테스트

# 신경망의 성능의 지표가 되는 성적표를 아무 값도 가지지 않도록 초기화
scorecard = []

# 테스트 데이터 모음 내의 모든 레코드 탐색
for record in test_data_list:
    # 레코드를 쉼표에 의해 분리
    all_values = record.split(',')
    # 정답은 첫 번째 값
    correct_label = int(all_values[0])
    # 입력 값의 범위와 값 조정
    inputs = (np.asfarray(all_values[1 : ]) / 255.0 * 0.99) + 0.01
    # 신경망에 질의
    outputs = n.query(inputs)
    # 가장 높은 값의 인덱스는 레이블의 인덱스와 일치
    label = np.argmax(outputs)
    # 정답 또는 오답을 리스트에 추가
    if(label == correct_label):
        # 정답인 경우 성적표에 1을 더해 줌
        scorecard.append(1)
    else:
        # 정답이 아닌 경우 성적표에 0을 더해 줌
        scorecard.append(0)
        pass
    pass


In [35]:
# 정답의 비율인 성적을 계산해 출력
scorecard_array = np.asarray(scorecard)
performance = scorecard_array.sum() / scorecard_array.size
print("epochs = ", epochs)
print("hidden_nodes1 = ", hidden_nodes1)
print("hidden_nodes2 = ", hidden_nodes2)
print("learning_rate = ", learning_rate)
print("performance = ", performance)
print("201801528 KIM Dong Gyu")

epochs =  5
hidden_nodes1 =  100
hidden_nodes2 =  100
learning_rate =  0.03
performance =  0.9617
201801528 KIM Dong Gyu


In [36]:
# 201801528 김동규