In [1]:
import numpy as np
import pandas as pd

In [2]:
# MNIST데이터 셋 가지고 오기
dataset = pd.read_csv('../data/MNIST_preprocessed.csv', sep=',', header=None).values

# 입력 변수인 픽셀 데이터와 목표 변수인 실제 숫자 데이터로 셋 나누기
X = dataset[:, 0:784]
Y = dataset[:, 784:]

# training, testing 데이터 셋 나누기
X_train, X_test = X[0:250,], X[250:,]
Y_train, Y_test = Y[0:250,], Y[250:,]

In [3]:
# 시그모이드 함수

def sigmoid(x):
    return 1/(1 + np.exp(-x))

In [4]:
# 신경망의 가중치와 편향을 초기화 해주는 함수
# 그 초기화된 값들을 파이썬 사전에 저장하여 리턴 해준다

def initialize_parameters(nodes_per_layer):
    L = len(nodes_per_layer) - 1  # 층 개수
    parameters = {}
    
    # 1층 부터 L 층까지 돌면서 가중치와 편향 초기화
    # np.random.randn(a) -> 크기 a의 임의의 배열 생성
    # np.random.randn(a, b) -> 크기 a X b의 임의의 배열 생성
    for l in range(1, L+1):
        parameters['W' + str(l)] = np.random.randn(nodes_per_layer[l], nodes_per_layer[l-1]) * np.sqrt(1. / nodes_per_layer[l])
        parameters['b' + str(l)] = np.random.randn(nodes_per_layer[l]) * np.sqrt(1. / nodes_per_layer[l])
        
    return parameters

In [5]:
# 순전파 함수

def feed_forward(x, parameters):
    cache = {'a0': x}  # 0 번째 층 출력
    L = len(parameters) // 2  # 층 수 
    
    for l in range(1, L+1):
        # 전 층 뉴런의 출력, 현재 층 뉴런들의 가중치, 편향 데이터를 가지고 온다
        a_prev = cache['a' + str(l-1)]
        W = parameters['W' + str(l)]
        b = parameters['b' + str(l)]
        
        # 가지고 온 데이터로 z와 a를 계산한다
        # z[l] = W[l]a[l-1] + b[l]
        # a[l] = sig(z[l])
        z = W @ a_prev + b
        a = sigmoid(z)

        # 결과 값을 캐시에 저장
        cache['z' + str(l)] = z
        cache['a' + str(l)] = a
                
    return a, cache

In [6]:
# 각 층에 있는 뉴런들의 개수를 저장해 둔 배열
neurons_per_layer = [784, 128, 64, 10]

# 우선 층의 개수와 뉴런들의 개수에 대한 정보를 담고 있는 배열로 임의의 가중치 및 편향 사전을 만든다
parameters = initialize_parameters(neurons_per_layer)

# 그리고 그 사전으로 데이터 하나에 대해 순전파 실행
feed_forward(X_train[0], parameters)[0]

array([0.45375375, 0.46105872, 0.27746944, 0.66384021, 0.48595997,
       0.51041694, 0.31788025, 0.75667466, 0.8739425 , 0.43569649])