# MultipleClassification.ipynb
Description   : Single-layer neural network for multiple classification

In [25]:
import os

# 경로 초기화
os.chdir(r"C:\Users\TitusChoi\Desktop\Library\CodeLion\AI")

In [26]:
import numpy as np
import csv

# Hyperparameter
np.random.seed(1024)
RND_MEAN = 0
RND_STD = 0.003

LEARNING_RATE = 0.003

In [27]:
# Main function
def multiple_classification_exec(epochs = 100, mb_size = 100, report = 10, tr = 0.75): # 학습 횟수, 미니 배치 사이즈, 학습 리포트, 훈련 비율(데이터 전부 훈련시키지 않고 그 중 훈련 비율만큼 훈련, 나머지는 시험 비율이 된다.)
    multiple_load_dataset() # 데이터 셋 여는 함수
    init_model() # 가중치와 편향 초기화 함수
    train_and_test(epochs, mb_size, report, tr) # 학습 및 신경망 성능 테스트 함수

In [28]:
# Data load, one-hot encoding(이미 처리가 되어 있음)
def multiple_load_dataset():
    # Loading datasets
    with open('./datasets/faults.csv') as csvfile:
        csvreader = csv.reader(csvfile)
        next(csvreader, None) # 첫 번째 index 건너뛰고 none으로 반환
        rows = []
        for row in csvreader:
            rows.append(row)

    # Global Variable : 함수 구축 시 주요하게 사용되는 변수를 확인하기 위한 장점때문에 사용
    global data, input_cnt, output_cnt
    input_cnt, output_cnt = 27, 7 # 독립변수의 크기와 종속변수의 크기, 종속 변수가 7개이다.
    data = np.asarray(rows, dtype='float32')

In [29]:
def init_model():
    global weight, bias, input_cnt, output_cnt
    weight = np.random.normal(RND_MEAN, RND_STD, [input_cnt, output_cnt])
    bias = np.random.normal(RND_MEAN, RND_STD, [output_cnt])

In [30]:
# Train and Test
def train_and_test(epochs, mb_size, report, tr):
    steps = arrange_data(mb_size, tr)           # 반환하는 값은 미니배치가 몇 덩어리(스텝)으로 쪼개지는지?
    test_x, test_y = get_test_data()               # 테스트 데이터에 대한 독립변수와 종속변수를 얻어내는 함수

    # epochs는 외부 for문으로 돌림
    # 미니배치는 내부 for문으로 돌리기 때문에 시간복잡도 증가
    for epoch in range(epochs):
        losses, accuracies = [], [] # epochs당 손실함수와 정확도 for 평균
        for n in range(steps):
            train_x, train_y = get_train_data(mb_size, n) # 미니배치 사이즈와 스텝의 수만큼 개별값을 받아 학습데이터의 독립, 종속변수 반환
            loss, accuracy = run_train(train_x, train_y)
            losses.append(loss)
            accuracies.append(accuracy)
        
        # 몇 번의 간격에 맞춰서 출력할 것인지 report에 따라서 다름
        if report > 0 and (epoch + 1) % report == 0:
            accuracy = run_test(test_x, test_y)
            print('Epoch {} : loss = {:5.3f}, accuracy = {:5.3f}, Test={:5.3f}'\
                .format(epoch + 1, np.mean(losses), np.mean(accuracies), accuracy))
    
    final_accuracy = run_test(test_x, test_y)
    print("\n 최종 테스트 결과 : final accuracy = {:5.3f}".format(final_accuracy))

In [31]:
# Arrange data
def arrange_data(mb_size, tr):
    global data, shuffle_map, test_begin_index
    shuffle_map = np.arange(data.shape[0])
    np.random.shuffle(shuffle_map)
    # 미니 배치 스텝 수를 구하는 과정
    steps = int(data.shape[0] * tr) // mb_size

    # Search boundary line
    test_begin_index = steps * mb_size
    return steps

In [32]:
# Getting training data
def get_train_data(mb_size, nth):
    global data, shuffle_map, test_begin_index, output_cnt
    if nth == 0:
        np.random.shuffle(shuffle_map[:test_begin_index]) # 무작위로 특정 인덱스까지 무작위로 섞기
    train_data = data[shuffle_map[mb_size * nth : mb_size * (nth + 1)]]
    return train_data[:, :-output_cnt], train_data[:, -output_cnt:]

In [33]:
# Test data
def get_test_data():
    global data, shuffle_map, test_begin_index, output_cnt
    test_data = data[shuffle_map[test_begin_index:]]
    return test_data[:, :-output_cnt], test_data[:, -output_cnt:]

In [34]:
# running test
def run_test(x, y):
    output, _ = forward_neuralnet(x)
    accuracy = eval_accuracy(output, y)
    return accuracy

In [35]:
# 기능 수정
def forward_postproc(output, y):
    entropy = softmax_cross_entropy_with_logits(y, output)
    loss = np.mean(entropy)

    return loss, [y, output, entropy]

In [36]:
# forward neural network
def forward_neuralnet(x):
    global weight, bias
    output = np.matmul(x, weight) + bias
    # 두 번째 반환 값인 x는 aux_nn으로 반환처리, 역전파 수행시 활용하기 위해 정의
    return output, x

활용할 활성화 함수는 softmax이며, 정의는 아래와 같다.
$$f(x) = {\frac{e^{x_i}}{\sum_{k=1}^N e^{x_k}}}$$
오버플로우(overflow) 방지를 위해 다음과 같이 변형시킨다.
$$f(x) = {\frac{e^{x_i-x_k}}{e^{x_1-x_k}+e^{x_2-x_k}+\dots+e^{x_n-x_k}}}$$

In [37]:
def softmax(x):
    # output 값 중 최댓값, axis = 1 -> 열과 후보값 기준으로 가장 큰 값을 추출하기 위해 열 기준으로 추출하는 axis=1 첨가
    max_elem = np.max(x, axis = 1)

    # i번째 x와 가장 큰 값을 빼는 과정, diff는 행렬 전환하여 계산해야 한다.
    diff = (x.transpose() - max_elem).transpose()
    diff_exp = np.exp(diff)

    sum_exp = np.sum(diff_exp, axis = 1)
    probs = (diff_exp.transpose() / sum_exp).transpose()
    
    # 소프트맥스를 통과할 확률
    return probs

In [38]:
# 소프트맥스 파이썬 폭주 방지
def softmax_cross_entropy_with_logits(labels, logits):
    probs = softmax(logits)
    return -np.sum(labels * np.log(probs + 1.0e-10), axis = 1)

In [39]:
# 소프트맥스 미분 값
def softmax_cross_entropy_with_logits_derv(labels, logits):
    return softmax(logits) - labels

In [40]:
# Training data
def run_train(x, y):
    output, aux_nn = forward_neuralnet(x)
    # 손실함수 찾기
    loss, aux_pp = forward_postproc(output, y)
    # 정확도 찾기
    accuracy = eval_accuracy(output, y)

    # 역전파 후 파라미터 갱신
    G_output = backprop_postproc(aux_pp)

    return loss, accuracy

In [41]:
def backprop_postproc(aux_pp):
    y, output, entropy = aux_pp
    G_loss = 1.0

    g_loss_entropy = 1.0 / np.prod(entropy.shape)
    g_entropy_output = softmax_cross_entropy_with_logits_derv(y, output)

    G_entropy = g_loss_entropy * G_loss
    G_output = g_entropy_output * G_entropy

    return G_output

In [42]:
# backpropagation Neural Network : 신경망 역전파 연산 -> 가중치, 편향 값 변화
def backprop_neuralnet(G_output, x):
    global weight, bias
    g_output_w = x.transpose() # 행렬 곱을 위한 transpose

    G_w = np.matmul(g_output_w, G_output)
    G_b = np.sum(G_output, axis = 0) # axis = 0, x축 row 연산

    weight -= LEARNING_RATE * G_w
    bias -= LEARNING_RATE * G_b

In [43]:
def eval_accuracy(output, y):
    estimate = np.argmax(output, axis = 1) # 제일 큰 output 저장
    answer = np.argmax(y, axis = 1) # 제일 큰 y 저장
    correct = np.equal(estimate, answer)

    return np.mean(correct)

In [44]:
# main 함수 동작 구간
if __name__ == "__main__":
    multiple_classification_exec(epochs=1000, mb_size=10, report=100, tr=0.85)

Epoch 100 : loss = 18.379, accuracy = 0.202, Test=0.236
Epoch 200 : loss = 18.379, accuracy = 0.202, Test=0.236
Epoch 300 : loss = 18.379, accuracy = 0.202, Test=0.236
Epoch 400 : loss = 18.379, accuracy = 0.202, Test=0.236
Epoch 500 : loss = 18.379, accuracy = 0.202, Test=0.236
Epoch 600 : loss = 18.379, accuracy = 0.202, Test=0.236
Epoch 700 : loss = 18.379, accuracy = 0.202, Test=0.236
Epoch 800 : loss = 18.379, accuracy = 0.202, Test=0.236
Epoch 900 : loss = 18.379, accuracy = 0.202, Test=0.236
Epoch 1000 : loss = 18.379, accuracy = 0.202, Test=0.236

 최종 테스트 결과 : final accuracy = 0.236
