In [1]:
import numpy as np
import csv
import time

np.random.seed(1234)
def randomize():
    np.random.seed(time.time())

In [2]:
RND_MEAN = 0
RND_STD = 0.0030
# 정규분포 난숫값의 평균과 표준편차로, 가중치 파라미터를 초기화 할 때 이용
LEARNING_RATE = 0.001

In [9]:
def abalone_exec(epoch_count = 10, mb_size = 10, report = 1):
    load_abalone_dataset() #데이터셋을 읽어옴
    init_model() #모델의 파라미터들 초기화
    train_and_test(epoch_count, mb_size, report) #학습 및 평가 과정 수행

### 데이터 적재 함수 정의

In [4]:
def load_abalone_dataset():
    with open('data/chap01/abalone.csv') as file:
        csvreader = csv.reader(file)
        next(csvreader, None) #첫 행을 읽지 않고 건너뜀
        rows = []
        for row in csvreader:
            rows.append(row)
            
        global data, input_cnt, output_cnt #전역 변수로 선언하여 다른 함수에서도 이용 가능
        input_cnt, output_cnt = 10, 1 #입출력 벡터 크기
        data = np.zeros([len(rows), input_cnt + output_cnt])
        
        for n, row in enumerate(rows):
            if row[0] == 'I' : data[m, 0] = 1 #OneHotEncoding
            if row[0] == 'M' : data[m, 1] = 1
            if row[0] == 'F' : data[m, 2] = 1
            data[n, 3:] = row[1:]

### 파라미터 초기화 함수 정의

In [5]:
def init_model():
    global weight, bias, input_cnt, output_cnt
    weight = np.random.normal(RND_MEAN, RND_STD, [input_cnt, output_cnt]) #가중치 행렬 값들을 정규분포를 갖는 난숫값으로 초기화
    # 파라미터의 초깃값을 실행할 때마다 달라지게 만듦
    bias = np.zeros([output_cnt]) #초기에 지나친 영향을 주지 않도록 0으로 초기화

- weight 가중치 행렬의 크기는 [10, 1], bias 편향 벡터 [1]

### 학습 및 평가 함수 정의

In [6]:
def train_and_test(epoch_count, mb_size, report):
    step_count = arrange_data(mb_size) #데이터를 섞고 학습용과 평가용 데이터셋을 분리하는 역할
    # return값은 step_count 하나지만 함수 내에서 global 선언을 통한 데이터셋 분리 기능
    test_x, test_y = get_test_data() #evaluation, test에서 같은 데이터 사용을 위해 미리 선언
    
    for epoch in range(epoch_count):
        losses, accs = [], []
        
        for n in range(step_count): #step count 값 만큼 mini-batch 처리
            train_x, train_y = get_train_data(mb_size, n) #mini batch data를 얻어와 run_train 함수로 학습
            loss, acc = run_train(train_x, train_y) #mini batch 단위의 정확도와 loss값 return
            losses.append(loss)
            accs.append(acc)
            
        if report > 0 and (epoch+1) % report == 0: #report = 보고 주기(acc, loss값 출력)
            acc = run_test(test_x, test_y)
            print('Epoch {} : loss={:5.3f}, accuracy={:5.3f}/{:5.3f}'.format(epoch+1, np.mean(losses), np.mean(accs), acc))
            
    final_acc= run_test(test_x, test_y) #전체 epoch가 끝나면 최종 평가 진행
    print('\nFinal Test : final accuracy = {:5.3f}'.format(final_acc))

### 학습 및 평가 데이터 획득 함수 정의

In [7]:
def arrange_data(mb_size):
    global data, shuffle_data, test_begin_idx
    shuffle_map = np.arange(data.shape[0]) #데이터의 수 만큼 일련번호 발생
    np.random.shuffle(shuffle_map) #무작위로 셔플
    step_count = int(data.shape[0] * 0.8) // mb_size
    test_begin_idx = step_count * mb_size #test_begin_idx : 학습 데이터와 테스트 데이터의 경계 index
    return step_count

In [8]:
def get_test_data():
    global data, shuffle_map, test_begin_idx, output_cnt
    test_data = data[shuffle_map[test_begin_idx:]] #arrange_data 함수에서 구해놓은 위치를 통해 평가용 데이터 분할
    return test_data[:,:-output_cnt], test_data[:,-output_cnt:] #output_cnt 기준으로 앞쪽은 입력 벡터, 뒷쪽은 정답 벡터로 반환

In [10]:
def get_train_dat(mb_size, nth):
    global data, shuffle_map, test_begin_idx, output_cnt
    if nth == 0:
        np.random.shuffle(shuffle_map[:test_begin_idx]) #각 epoch의 첫번째호출에 한해 학습 데이터 부분에 대한 부분적인 순서를 뒤섞음
    train_data = data[shuffle_map[mb_size * nth:mb_size*(nth+1)]] #미니배치 구간에 해당하는 데이터 반환
    return train_data[:,:-output_cnt], train_data[:,-output_cnt:] #반환하는 각 행에 대해 입력 벡터 부분과 정답 벡터 부분을 분할해 반환

### 학습 실행 함수와 평가 실행 함수 정의

In [11]:
def run_train(x, y): #미니매치 데이터를 이용한 한 스텝의 학습 수행
    output, aux_nn = forward_neuralnet(x) #단층 퍼셉트론 신경망에 대한 순전파를 수행하여 output을 구한다
    loss, aux_pp = forward_postproc(output, y) #회귀 분석 문제의 성격에 맞춘 후처리 순전파 작업을 수행해 output과 y에 대한 손실함수를 계산
    #두 단계를 나눈 이유는 문제의 특성에 따라 postproc 함수만 바꾸어 주면 되기 때문.
    accuracy = eval_accuracy(output, y)
    #aux_** : 역전파에 필요한 정보 혹은 효율을 높이기 위한 정보
    
    G_loss = 1.0 #역전파의 시작점
    #역전파는 순전파의 순서와 반대로 진행된다.
    G_output = backprop_postproc(G_loss, aux_pp) #G_loss로부터 G_output을 구하는 과정, 역전파용 보조 정보로서 aux_pp도 같이 제공
    backprop_neuralnet(G_output, aux_nn) #원칙적으로는 G_x를 구해야 하나 x는 알고리즘을 통해 변하는 값이 아니고, 더이상 수행할 역전파가 없기 때문에 출력 X
    #backprop_neuralnet이 실행되는 중에 신경망 파라미터는 실제로 변화한다(학습이 진행된다)
    return loss, accuracy

In [12]:
def run_test(x, y):
    output, _ = forward_neuralnet(x)
    accuracy = eval_accuracy(output, y) #신경망에 대한 순전파 처리후 바로 정확도 계산
    #학습때와 달리 손실함수나 역전파 과정이 필요하지 않음
    return accuracy

### 단층 퍼셉트론에 대한 순전파 및 역전파 함수 정의

In [13]:
def forward_neuralnet(x):
    global weight, bias
    output = np.matmul(x, weights) + bias #입력 행렬x에 대해 가중치 행렬 weight를 곱하고 편행 벡터 bias를 더하여 output 출력
    #[N, 10] * [10, 1] + [N 1] -> [N, 1] 출력
    return output, x #역전파에 이용될 보조정보로서 입력 행렬 x 반환

In [14]:
def backprop_neuralnet(G_output, x):
    global weight, bias
    g_output_w = x.transpose() #x와 output 사이의 기울기 
    
    G_w = np.matmul(G_output_w, G_output) #순전파 출력 output에 대한 손실 기울기 G_output을 전달받아 weight와 bias의 손실 기울기를 구한다.
    #[10, N] * [N, 1] -> [10, 1]
    G_b = np.sum(G_output, axis = 0)
    
    weight -= LEARNING_RATE * G_w #손실 기울기값과 learning rate를 곱한 값을 빼서 실제 학습 진행
    bias -= LEARNING_RATE * G_b