## 0.0 파이썬 모듈 불러들이기

In [1]:
import numpy as np
import csv
import time

np.random.seed(1234)
def randomize(): np.random.seed(time.time())

## 0.1 하이퍼 파라미터 정의

In [2]:
RND_MEAN = 0
RND_STD = 0.0030

LEARNING_RATE = 0.001  # 학습률

## A.1 실험용 메인함수

In [3]:
def abalone_exec(epoch_count = 10, mb_size = 10, report = 1):
    load_abalone_dataset()  # 데이터 불러들이는 함수
    init_model()  # 모델 초기화 함수
    train_and_test(epoch_count, mb_size, report)   # 학습 및 테스트 수행 함수

## B.1 데이터 적재함수 정의 

In [4]:
def load_abalone_dataset():
    with open('./data/abalone.csv') as csvfile:
        csvreader = csv.reader(csvfile)
        next(csvreader, None)   # 컬럼명을 건너 뛰어줌
        rows = []
        for row in csvreader:
            rows.append(row)
            
    global data, input_cnt, output_cnt  # cnt는 count
    input_cnt, output_cnt = 10, 1
    data = np.zeros([len(rows), input_cnt+output_cnt])

    for n, row in enumerate(rows):
        # 원-핫 벡터 처리
        if row[0] == 'I': data[n, 0] = 1
        if row[0] == 'M': data[n, 1] = 1
        if row[0] == 'F': data[n, 2] = 1
        data[n, 3:] = row[1:]  # 성별을 지정해준 후 뒤의 나머지 정보를 붙혀줌

## B.2 파라미터 초기화 함수 정의 

In [5]:
def init_model():
    global weight, bias, input_cnt, output_cnt
    weight = np.random.normal(RND_MEAN, RND_STD,[input_cnt, output_cnt])
    # np.random.normal은 정규분포를 갖는 난수 생성
    # seed를 지정해주면 random의 난수가 전에 실행시켰던 값과 동일한 패턴으로      
    # 출력 됨 -> 각 미니배치를 학습할 때 동일한 weight 난수로 시작 가능
    bias = np.zeros([output_cnt])

## B.3 학습 및 평가 함수 정의

In [6]:
def train_and_test(epoch_count, mb_size, report):
    step_count = arrange_data(mb_size) # 몇개의 미니배치를 만들지 
    test_x, test_y = get_test_data()
    
    for epoch in range(epoch_count):
        losses, accs = [], []
        
        for n in range(step_count):
            train_x, train_y = get_train_data(mb_size, n)
            loss, acc = run_train(train_x, train_y)
            losses.append(loss)
            accs.append(acc)
            
        if report > 0 and (epoch+1) % report == 0:
            acc = run_test(test_x, test_y)
            print('Epoch {}: loss={:5.3f}, accuracy={:5.3f}/{:5.3f}'. \
                  format(epoch+1, np.mean(losses), np.mean(accs), acc))
            
    final_acc = run_test(test_x, test_y)
    print('\nFinal Test: final accuracy = {:5.3f}'.format(final_acc))

## C.1~3 학습 및 평가 데이터 획득 함수 정의

In [7]:
def arrange_data(mb_size):
    global data, shuffle_map, test_begin_idx
    shuffle_map = np.arange(data.shape[0]) # row 수만큼 index배열 생성 ex [0,1,2,3, ...]

    np.random.shuffle(shuffle_map) # index shuffle
    # 학습할 데이터 row수를 미니배치 사이즈로 나눠서 

    # 1 에폭당 미니배치 횟수 출력
    step_count = int(data.shape[0] * 0.8) // mb_size 
    
    # train data와 test data로 나눌 경계 지정
    test_begin_idx = step_count * mb_size 
    return step_count



def get_test_data():
    global data, shuffle_map, test_begin_idx, output_cnt

    # test_begin_idx부터 shuffle된 index의 값들을 data에서 가져와 test_data로 지정
    test_data = data[shuffle_map[test_begin_idx:]] 

    # test_data를 입력(독립) data와 출력(종속) data로 나눠서 반환
    return test_data[:, :-output_cnt], test_data[:, -output_cnt:] 



def get_train_data(mb_size, nth):
    global data, shuffle_map, test_begin_idx, output_cnt

    if nth == 0: # 첫 에폭마다 한하여, 처음부터 경계선까지 인덱스 shuffle
        np.random.shuffle(shuffle_map[:test_begin_idx])

    # 섞인 인덱스로 미니배치 크기에 맞게 데이터 분할 및 train_data로 저장
    train_data = data[shuffle_map[mb_size*nth:mb_size*(nth+1)]]
    return train_data[:, :-output_cnt], train_data[:, -output_cnt:]

## C.4~5 학습 실행 함수와 평가 실행함수 정의

In [8]:
def run_train(x, y):
    # 신경망 연산 부분 (보조정보 : 입력벡터 x)
    output, aux_nn = forward_neuralnet(x)

    # 신경망 후처리 과정(손실함수 구하는 과정) (보조정보 : 편차 diff = output - y)
    loss, aux_pp = forward_postproc(output, y)

    # 정확도를 구하는 과정
    accuracy = eval_accuracy(output, y)
    

    # 역전파 과정

    # 항상 순전파의 역순으로 수행
    G_loss = 1.0  # 순전파 때 출력이었던 성분의 '손실함수의 기울기' aL/aL

    # 손실함수의 처리과정인 '평균제곱오차'의 역순, 즉 'MSE의 역전파 처리' aL/aY
    G_output = backprop_postproc(G_loss, aux_pp)

    # 직접적인 학습이 이뤄지는 부분(가중치와 편향이 학습률을 활용하며 실제 학습 과정 수행)
    # 입력값에 따른 f(x)에 대한 편미분 과정을 구해주는 내부처리 af(x)/ax
    backprop_neuralnet(G_output, aux_nn)
    
    return loss, accuracy

def run_test(x, y):
    output, _ = forward_neuralnet(x)
    accuracy = eval_accuracy(output, y)
    return accuracy

## D.1 / E.1 단층 퍼셉트론에 대한 순전파 및 역전파 함수 정의

In [9]:
def forward_neuralnet(x):
    global weight, bias
    # np.matmul은 x의 각 원소에 weight를 곱해줌 
    # 편향이 더해진 입력벡터와 가중치 벡터에 대한 기본적인 신경망 연산식
    output = np.matmul(x, weight) + bias
    return output, x

def backprop_neuralnet(G_output, x):
    global weight, bias
    # transpose 행과 열을 바꾸는 전치행렬
    g_output_w = x.transpose()
    
    G_w = np.matmul(g_output_w, G_output)
    G_b = np.sum(G_output, axis=0)

    weight -= LEARNING_RATE * G_w
    bias -= LEARNING_RATE * G_b

## D.2 / E.2 후처리 과정에 대한 순전파 및 역전파 함수 정의

In [10]:
def forward_postproc(output, y):
    diff = output - y # 편차
    square = np.square(diff) # 제곱
    loss = np.mean(square) # 평균
    return loss, diff

def backprop_postproc(G_loss, diff):
    shape = diff.shape
    
    g_loss_square = np.ones(shape) / np.prod(shape)
    g_square_diff = 2 * diff
    g_diff_output = 1

    G_square = g_loss_square * G_loss
    G_diff = g_square_diff * G_square
    G_output = g_diff_output * G_diff
    
    return G_output

## D.3 정확도 계산 함수 정의  

In [11]:
def eval_accuracy(output, y):
    mdiff = np.mean(np.abs((output - y)/y)) # abs는 절대값
    return 1 - mdiff

## 단층퍼셉트론 메인 함수 실행

In [12]:
abalone_exec()

Epoch 1: loss=33.875, accuracy=0.557/0.812
Epoch 2: loss=8.226, accuracy=0.820/0.814
Epoch 3: loss=7.582, accuracy=0.812/0.809
Epoch 4: loss=7.475, accuracy=0.808/0.811
Epoch 5: loss=7.395, accuracy=0.810/0.809
Epoch 6: loss=7.328, accuracy=0.808/0.810
Epoch 7: loss=7.269, accuracy=0.808/0.811
Epoch 8: loss=7.217, accuracy=0.808/0.812
Epoch 9: loss=7.175, accuracy=0.810/0.810
Epoch 10: loss=7.135, accuracy=0.809/0.810

Final Test: final accuracy = 0.810


## 파라미터 확인

In [13]:
print(weight) # 가중치가 이렇게 나왔는데 이 속에서 패턴을 찾기란 아주 힘든일이다.
# 그리고 값이 크다고 중요한 입력이 아니고 값이 작다고 필요없는 값이 아니다. 
# 가중치는 계속해서 변한다.
print(bias)

[[1.02697603]
 [1.47450981]
 [1.66960135]
 [2.04468668]
 [1.62513525]
 [0.60292627]
 [2.39993815]
 [0.54107313]
 [0.46878034]
 [1.01969382]]
[4.16894769]


## 새로운 입력 벡터 X에 대한 예측

In [14]:
x = np.array([0,1,0,0.44,0.3,0.08,0.5,0.23,0.11,0.2])
output = forward_neuralnet(x)
print(output)

(array([8.65881481]), array([0.  , 1.  , 0.  , 0.44, 0.3 , 0.08, 0.5 , 0.23, 0.11, 0.2 ]))


## 하이퍼퍼라미터 수정하며 실험

* LEARNING_RATE = 0.001 -> 0.1
* epoch_count = 10 -> 100
* mb_size = 10 -> 100

In [26]:
LEARNING_RATE = 0.1
abalone_exec(epoch_count=100,mb_size=100,report=20)
# 이렇게 출력결과를 쭉 보면서 정확도가 좋은 부분의 하이퍼 파라미터를 가져오면 
# 정확도를 좋게 만들 수 있다.

Epoch 20: loss=5.570, accuracy=0.826/0.823
Epoch 40: loss=5.069, accuracy=0.834/0.835
Epoch 60: loss=4.865, accuracy=0.838/0.833
Epoch 80: loss=4.819, accuracy=0.839/0.833
Epoch 100: loss=4.763, accuracy=0.839/0.836

Final Test: final accuracy = 0.836
