In [23]:
# 다범주 분류 문제의 예제로는 그림에 쓰여진 숫자를 판독하는 기능을 구현해보겠습니다.
# 판독할 이미지는 다음과 같이 가로, 셀로 각각 5개의 픽셀로 구성된 5*5 크기의 숫자 이미지를 고려합니다.
# 이미지 종류는 숫자 1에서 5까지 총 다섯 가지가 주어집니다.
# 신경망 모델은 하나의 은닉층 노드의 개수는 50개, 활성함수는 시그모이드 함수를 사용합니다.
# 이미지의 크기가 5*5 행렬이므로 입력 노드의 개수는 25개로, 5개의 범주를 분류하므로 출력 노드의 개수는 5개로 구성합니다.
# 출력 노드의 활성함수로는 소프트맥스 함수를 사용합니다.
# 학습 규칙은 SGD방식으로 구현
# W1은 입력층 - 은닉층 가중치 행렬
# W2는 은닉층 - 출력층의 가중치 행렬을 나타내는 변수입니다.
# X는 학습 데이터의 입력 데이터, D는 학습 데이터의 정답을 담고 있는 변수입니다.

import numpy as np
from math import exp

N = 5

# x = np.array([0.3, 2.9, 4.0])
def softmax(x) :
    exp_a = np.exp(x)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    
    return y

    
def sigmoid(x):
    y = 1/(1+exp(-x))
    return y

In [24]:
def multiClass(W1, W2, X, D):
    lr = 0.1
    
    x_reshape = X.reshape(5, 25)
    for k in range(N):
        x = x_reshape[k]
        d = D[k]
        hidden_v = np.zeros(25)
        hidden_y = np.zeros(25)
        hidden_delta = np.zeros(25)
        output_v = np.zeros(5)
        output_y = np.zeros(5)
        output_delta = np.zeros(5)
        
        # 학습
        # 입력층 - 은닉층
        for i in range(len(W1)):
            for j in range(len(W1[i])):
                hidden_v[i] = hidden_v[i] + W1[i][j]*x[j]
            hidden_y[i] = sigmoid(hidden_v[i])
        
        # 은닉층 - 출력층
        for i in range(len(W2)):
            for j in range(len(W2[i])):
                output_v = output_v + W2[i][j]*hidden_y[j]
        output_y = softmax(output_v)
        
        # 오차
        # 출력층
        output_err = d - output_y
        output_delta = output_err
        # 은닉층 오차
        hidden_err = np.transpose(W2)*output_delta
        
        # 은닉층 델타
        for i in range(len(hidden_err)): 
            for j in range(len(hidden_err[i])):
                hidden_delta[i] = hidden_y[i]*(1-hidden_y[i])*hidden_err[i][j]
        
        # 가중치 조정
        # 입력층 - 은닉층
        for i in range(len(W1)):
            for j in range(len(W1[i])):
                W1[i][j] = W1[i][j] + lr*hidden_delta[i]*x[j]

        # 은닉층 - 출력층
        for i in range(len(W2)):
            for j in range(len(W2[i])):
                W2[i][j] = W2[i][j] + lr*output_delta*hidden_y[j]
        
        return [W1, W2]
# X에는 2차원 이미지 데이터가 층층이 쌓인 형태로 들어 있습니다.
# 2차원 행렬을 5*25 크기의 벡터로 바꿔줘야 합니다. -> reshape 사용함
# 일단 만들어진 배열의 내부 데이터는 보존한 채로 형태만 바꾸려면 reshape 명령이나 메서드를 사용한다. 예를 들어 12개의 원소를 가진 1차원 행렬은 3x4 형태의 2차원 행렬로 만들 수 있다.

In [27]:
import numpy as np
X = np.zeros(((5, 5, 5)));
D = np.zeros(5)

X[0] = np.array([[0,1,1,0,0],
                 [0,0,1,0,0],
                 [0,0,1,0,0],
                 [0,0,1,0,0],
                 [0,1,1,1,0]])

X[1] = np.array([[1,1,1,1,0],
                 [0,0,0,0,1],
                 [0,1,1,1,0],
                 [1,0,0,0,0],
                 [1,1,1,1,1]])

X[2] = np.array([[1,1,1,1,0],
                 [0,0,0,0,1],
                 [0,1,1,1,0],
                 [0,0,0,0,1],
                 [1,1,1,1,0]])

X[3] = np.array([[0,0,0,1,0],
                 [0,0,1,1,1],
                 [0,1,0,1,0],
                 [1,1,1,1,1],
                 [0,0,0,1,0]])

X[4] = np.array([[1,1,1,1,1],
                 [1,0,0,0,0],
                 [1,1,1,1,0],
                 [0,0,0,0,1],
                 [1,1,1,1,0]])

for i in range(N):
    D[i] = i+1

    
W1 = np.zeros(50, 25)
W2 = np.array(5, 50
    
for i in range(25):
    for j in range(50):
        W1[i][j] = round(random.uniform(0.1, 1.0),1)
        
for i in range(50):
    for j in range(5):
        W2[i][j] = round(random.uniform(0.1, 1.0),1)
    print(round(random.uniform(0.1, 1.0),1))

        
for i in range(300000):
    W = multiClass(W1, W2, X, D)
    W1 = W[0]
    W2 = W[1]



1.0
1.0
1.0
1.0
1.0


In [28]:
import numpy as np

x = np.array([0.3, 2.9, 4.0])
exp_a = np.exp(x)
sum_exp_a = np.sum(exp_a)
y = exp_a / sum_exp_a

print(exp_a)
print(np.sum(exp_a))
print(y)





x_reshape = X.reshape(5, 25)
for k in range(N):
    x = x_reshape[k]
    hidden_v = np.zeros(25)
    hidden_y = np.zeros(25)
    output_v = np.zeros(5)
    output_y = np.zeros(5)
    
    # 입력층 - 은닉층
    for i in range(len(W1)):
        for j in range(len(W1[i])):
            hidden_v[i] = hidden_v[i] + W1[i][j]*x[j]
        hidden_y[i] = sigmoid(hidden_v[i])

    # 은닉층 - 출력층
    for i in range(len(W2)):
        for j in range(len(W2[i])):
            output_v = output_v + W2[i][j]*hidden_y[j]
            
    output_y = softmax(output_v)
    print(output_y)

[ 1.34985881 18.17414537 54.59815003]
74.1221542101633
[0.01821127 0.24519181 0.73659691]


In [33]:
import random

for i in range(5):
    print(round(random.uniform(0.1, 1.0),1))

0.5
0.1
0.3
0.4
0.4
