# 3. 단순 선형 회귀 - Gradient descent

---

## 학습 목표
- gradient descent의 문제점을 해결할 수 있는 방법에 대해서 학습합니다.
- gradient descent를 사용한 단순 선형 회귀 알고리즘을 구현합니다.

## 목차

### 1. Gradient descent 보완
1. Local minima 문제
2. Learning rate 문제
3. 초기 값 문제

### 2. Gradient descent를 사용한 단순 선형 회귀
1. 단순 선형 회귀 class 구현
2. Gradient descent 보완


---

## 2. Gradient descent를 사용한 단순 선형 회귀

### 2-1. 단순 선형 회귀 class 구조

지금까지 정리한 gradient descent 기법을 사용한 단순 선형 회귀를 class로 구현해 봅시다.

##### <예제 1> gradient descent 단순 선형 회귀 class

class는 least square를 사용했던 단순 선형 회귀 구조와 비슷하게 초기화, 학습, 예측, loss 함수로 구성합니다.

In [14]:
import numpy as np

class simple_linaer_regression_gd:
    # 초기화 함수
    def __init__(self, initial_w0, initial_w1, initial_lr):
        self.w1 = initial_w1
        self.w0 = initial_w0
        self.lr = initial_lr
        
    # gradient 함수 정의
    def gradient(self, feature, label):

        gradient_w0 = -2/(feature.size) * np.sum(label - (self.w0+self.w1*feature))
        gradient_w1 = -2/(feature.size) * np.sum((label - (self.w0+self.w1*feature))*(feature))

        return gradient_w0, gradient_w1
        
    # 학습 함수    
    def fit(self, feature, label):
        
        # 현재 파라미터로 계산한 loss 값 저장 
        loss1 = self.loss(self.predict(feature), label)

        # 반복 횟수를 세기 위하여 변수 초기화
        num_iter = 0

        while True:

            num_iter = num_iter + 1

            gradient_w0, gradient_w1 = self.gradient(feature, label)

            self.w0 = self.w0 - self.lr*gradient_w0
            self.w1 = self.w1 - self.lr*gradient_w1

            if loss1 < self.loss(self.predict(feature), label):
                print("diverges")
                print("updates learning rate * 50%")
                status = 'diverges'
                self.lr = self.lr/2

            if abs(loss1 - self.loss(self.predict(feature), label)) < 0.00001:
                print("saturates")
                print("number of iteration : {}".format(num_iter))
                print("loss : {}".format(loss1))
                print("W0 : {}".format(w0))
                print("W1 : {}".format(w1))
                status = 'converges'
                break

            loss1 = self.loss(self.predict(feature), label)
        
    # 예측값 계산 함수
    def predict(self, feature):
        
        prediction = self.w1*feature + self.w0
        
        return prediction
    
    # loss 값 계산 함수
    def loss(self, feature, label):
        
        error = label - self.predict(feature)
        ls = np.mean(error**2)
        
        return ls

### 2-2. 함수 정의

#### 초기화 함수: `__init__`

class에 사용되는 변수 `w0, w1, lr`을 초기값을 받아 저장합니다.

#### 학습 함수: `fit`

feature 데이터와 label 데이터를 `feature, label`로 입력 받아 loss 값을 최소로 만드는 파라미터 `w0, w1`을 gradient descent로 구하여 저장합니다.

여기서 입력하는 `feature, label`은 N개의 row를 갖는 벡터를 사용해야합니다.

#### 예측값 계산 함수: `predict`

입력 받은 `feature` 데이터를 넣어 단순 선형 모델로 계산된 예측값을 계산합니다.

#### loss 값 계산 함수: `loss`

feature 데이터와 label 데이터를 feature, label로 입력 받아 loss 값을 계산하여 출력합니다.

##### <예제 2> gradient descent 단순 선형 회귀 학습

`<예제 1> gradient descent 단순 선형 회귀 class`에서 구현한 class를 사용하여 학습 과정을 수행해봅시다.

In [15]:
import numpy as np


feature_data = np.array([1,2,3,4]).reshape((-1,1))
label_data = np.array([3.1,4.9,7.2,8.9]).reshape((-1,1))

# 단순 선형 회귀 모델 불러오기 및 초기화
model = simple_linaer_regression_gd(0,0,1)

# 학습 수행
model.fit(feature_data, label_data)

print("loss: {}\n".format(model.loss(feature_data, label_data))) 

diverges
updates learning rate * 50%
diverges
updates learning rate * 50%
diverges
updates learning rate * 50%
diverges
updates learning rate * 50%
diverges
updates learning rate * 50%
saturates
number of iteration : 862
loss : 52.80384565893719
W0 : 1.1394225687172648
W1 : 1.9565915191845342
loss: 0.015750000651418353



---