In [36]:
import numpy as np
import pandas as pd

### 보스턴 주택 가격 데이터 세트를 Perceptron 기반에서 학습 및 테스트하기 위한 데이터 로드
- 사이킷런에서 보스턴 주택 가격 데이터 세트를 로드하고 으를 DataFrame으로 생성

In [3]:
from sklearn.datasets import load_boston

In [5]:
boston = load_boston()
bostonDF = pd.DataFrame(boston.data, columns=boston.feature_names)
bostonDF['PRICE'] = boston.target
print(bostonDF.shape)
bostonDF.head()

(506, 14)


Unnamed: 0,CRIM,ZN,INDUS,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,B,LSTAT,PRICE
0,0.00632,18.0,2.31,0.0,0.538,6.575,65.2,4.09,1.0,296.0,15.3,396.9,4.98,24.0
1,0.02731,0.0,7.07,0.0,0.469,6.421,78.9,4.9671,2.0,242.0,17.8,396.9,9.14,21.6
2,0.02729,0.0,7.07,0.0,0.469,7.185,61.1,4.9671,2.0,242.0,17.8,392.83,4.03,34.7
3,0.03237,0.0,2.18,0.0,0.458,6.998,45.8,6.0622,3.0,222.0,18.7,394.63,2.94,33.4
4,0.06905,0.0,2.18,0.0,0.458,7.147,54.2,6.0622,3.0,222.0,18.7,396.9,5.33,36.2


### weight와 bias의 값을 계산하는 함수 생성
- w1은 RM(방의 개수) 피처의 weight값
- w2는 LSTAT(하위계층 비율) 피처의 weight값
- bias는 bias
- N은 입력 데이터 건수

In [6]:
# gradient_descent() 함수에서 반복적으로 호출되면서 update된다.
# weight/bias 값을 계산하는 함수
# rm은 RM(방의 개수), lstat(하위계층비율), target은 PRICE이다. 전체 array가 입력됨
# 반환 값은 weight와 bias가 update되어야 할 값과 Mean Squared Error 값을 loss로 반환

def get_update_weights_value(bias, w1, w2, rm, lstat, target, learning_rate=0.01):
    # 데이터 건수
    N = len(target)
    # 예측값
    predicted = w1*rm + w2*lstat + bias
    # 실제값과 예측값의 차이
    diff = target - predicted
    # bias를 array 기반으로 구하기 위해서 설정
    bias_factors = np.ones((N,))
    
    # weight와 bias를 얼마나 update할 것인지를 계산
    w1_update = -(2/N)*learning_rate*(np.dot(rm.T, diff))
    w2_update = -(2/N)*learning_rate*(np.dot(lstat.T, diff))
    bias_update = -(2/N)*learning_rate*(np.dot(bias_factors.T, diff))
    
    # Mean Squared Error 값을 계산
    mse_loss = np.mean(np.square(diff))
    
    # weight와 bias가 update되어야 할 값과 Mean Squeared Error 값을 반환
    return bias_update, w1_update, w2_update, mse_loss   

### Gradient Descent를 적용하는 함수 생성

- iter_epochs 수만큼 반복적으로 get_update_weights_value()를 호출하여 update될 weight/bias값을 구한 뒤 weight/bias를 update적용

In [32]:
# RM, LSTAT feature array와 PRICE target array를 입력 받아서 iter_epochs수만큼 반복적으로 weight와 bias를 update함

def gradient_descent(features, target, iter_epochs=1000, verbose=True):
    # w1, w2는 numpy array 연산을 위해 1차원 array로 변환하되 초기 값은 0으로 설정
    # bias도 1차원 array로 변환하되 초기 값은 1로 설정
    w1 = np.zeros((1,))
    w2 = np.zeros((1,))
    bias = np.zeros((1,))
    print('최초 w1, w2, bias : ', w1, w2, bias)
    
    # learning-rate와 RM, LSTAT 피처 저장, 호출 시 numpy array 형태로 RM과 LSTAT으로 된 2차원 feature가 입력됨.
    learning_rate = 0.01
    rm = features[:, 0]
    lstat = features[:,1]
    
    # iter_epochs 수만큼 반복하면서 weight와 bias update를 수행
    for i in range(iter_epochs):
        # weight/bias update 값 계산
        bias_update, w1_update, w2_update, loss = get_update_weights_value(bias, w1, w2, rm, lstat, target, learning_rate)
        # weight/bias의 update 적용
        w1 = w1 - w1_update
        w2 = w2 - w2_update
        bias = bias - bias_update
        if verbose:
            if i % 100 == 0:
                print(f'Epoch : {i+1} / {iter_epochs}')
                print(f'w1 : {w1}, w2 : {w2}, bias : {bias}, loss : {loss}')
        
    return w1, w2, bias
    

### Gradient Descent 적용
- 신경망은 데이터를 정규화/표준화 작업을 미리 선행해 줘야 한다.
- 이를 위해 사이킷런의 MinMaxScaler를 이용하여 개별 feature값은 0\~1 사이 값으로 변환 후 학습 적용

In [33]:
from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()
scaled_features = scaler.fit_transform(bostonDF[['RM', 'LSTAT']])
print(scaled_features)
print(scaled_features.shape)

[[0.57750527 0.08967991]
 [0.5479977  0.2044702 ]
 [0.6943859  0.06346578]
 ...
 [0.65433991 0.10789183]
 [0.61946733 0.13107064]
 [0.47307913 0.16970199]]
(506, 2)


In [34]:
w1, w2, bias = gradient_descent(scaled_features, bostonDF['PRICE'].values)
print(w1, w2, bias)

최초 w1, w2, bias :  [0.] [0.] [0.]
Epoch : 1 / 1000
w1 : [0.252369], w2 : [0.10914761], bias : [0.45065613], loss : 592.1469169960474
Epoch : 101 / 1000
w1 : [9.65323012], w2 : [2.03623996], bias : [15.50153711], loss : 76.56636916089059
Epoch : 201 / 1000
w1 : [11.51626124], w2 : [-0.07718644], bias : [16.45516227], loss : 66.92841493665178
Epoch : 301 / 1000
w1 : [12.79231979], w2 : [-2.23984325], bias : [16.52282922], loss : 60.601567525481386
Epoch : 401 / 1000
w1 : [13.92764442], w2 : [-4.22003672], bias : [16.53315873], loss : 55.37990609595616
Epoch : 501 / 1000
w1 : [14.9596517], w2 : [-6.020131], bias : [16.53828664], loss : 51.0650692149703
Epoch : 601 / 1000
w1 : [15.89926458], w2 : [-7.65563], bias : [16.54164232], loss : 47.49953468302916
Epoch : 701 / 1000
w1 : [16.75496463], w2 : [-9.14146437], bias : [16.54358623], loss : 44.553164265953804
Epoch : 801 / 1000
w1 : [17.53437127], w2 : [-10.49125873], bias : [16.54427297], loss : 42.11842255099923
Epoch : 901 / 1000
w1 : [

### 계산된 weight와 bias를 이용해여 price 예측
- 예측 feature 역시 0 ~ 1 사이의 scaled 값을 이용하고 weight와 bias를 적용하여 예측값 계산

In [35]:
predicted = scaled_features[:,0]*w1 + scaled_features[:,1]*w2 + bias
print(predicted)

[26.29894642 24.27001746 28.84233748 28.55127642 28.24493494 25.69289099
 21.62613759 19.82778642 14.05653949 19.94509459 20.10969008 21.31811718
 20.02069898 22.87338017 22.69777096 22.38295641 23.4170501  20.75409022
 19.87601513 21.00168527 16.98787753 20.96079139 19.87135017 18.27047878
 19.93862514 18.68830714 20.06408046 20.03701382 23.24300034 24.18080914
 16.94637653 21.627452   15.99621908 18.40646626 19.13179365 22.31313348
 21.3682095  22.33472284 22.27335002 26.60480391 28.98497545 27.05408997
 24.53619045 24.11152812 22.85124526 21.21738211 20.19986638 19.43777183
 12.90572179 18.80883072 21.08798599 23.06015039 25.96122932 22.99054833
 20.33900894 28.79798558 25.32470957 27.53539615 24.07788942 22.45415531
 20.39079949 20.74861171 25.2492464  25.37658464 27.1270897  25.37732933
 21.58671621 22.67306635 19.88009958 22.45429653 25.11166086 22.3436992
 24.26245447 24.19918186 24.56936446 23.85226754 22.75502193 22.85344922
 22.45405636 22.30482459 26.73929716 25.66572295 24.

### pytorch를 이용하여 보스턴 주택가격 모델 학습 및 예측
- Dense Layer를 이용하여 퍼셉트론 구현, units는 1로 설정

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F
