# 1. 최적화 기법과 Greedy 알고리즘

---

## 학습 목표
- 최적화 기법이 왜 필요하고 무엇인지 학습합니다.
- Greedy 알고리즘을 구현하고 그 문제점을 파악합니다.

---

## 목차

### 1. 최적화 기법
1. 최적화 기법이란?

### 2. Greedy 알고리즘
1. Greedy 알고리즘 정의
2. Greedy 알고리즘 문제점



---

## 1. 최적화 기법

### 1-1. 최적화 기법이란?

1장에서는 간단한 형태인 단순 선형 회귀 방식에 대해서 학습하였습니다.

단순 선형 회귀는 1차 함수 형태의 근사선 모델을 사용하여 1개의 feature 종류에 따른 label의 관계를 분석했습니다.

##### 단순 선형 회귀 모델 

> $$f(x_i)=w_O+w_1 x_i$$

여기서 우리는 학습 과정으로 하이퍼 파라미터 $w_0, w_1$을 튜닝하여 loss 값을 최소로 만들었습니다.

##### 최소값 문제

> $$\min_{w_0,w_1}Loss(w_0, w_1)$$

위 최소값 문제를 해결하는 방법으로 1장에서는 least square라는 방법을 사용해서 해결할 수 있었습니다.

least square 좋은 해결책이였지만 최소값을 푸는 방법은 다양한 방식이 존재합니다.

이러한 최소값 또는 최대값 문제를 해결하는 방법들을 최적화 기법이라 합니다. 

수 많은 과학자, 수학자, 공학자들이 다양한 방법을 제안해왔고, 각 방식들은 장단점을 갖기에 한 가지 방식만을 고집하여 쓸 필요가 없습니다.

따라서 2장에서는 2가지 중요한 최적화 기법인 Greedy 알고리즘과 Gradient descent 알고리즘을 학습하여 최적화 기법의 선택 폭을 넓힐 것입니다.

---

## 2. Greedy 알고리즘

### 2-1. Greedy 알고리즘 정의

최소 or 최대 값을 구하는 방식으로 greedy 알고리즘은 지금 환경의 모든 경우를 고려하여 최소 or 최대 값을 찾는 방식을 의미합니다.

만일 모델링한 1차 함수의 기울기가 $[0.1,0.2,...,1]$, y절편은 $[0.1,0.2,...,1]$로 각각 10개의 값만을 갖는다고 가정해 봅시다.

그렇다면 우리가 얻을 수 있는 Loss 함수 값은 총 100개가 될 것입니다.

##### Greedy 예시

> $$Loss(기울기=0.1, y절편=0.1), \\ Loss(기울기=0.1, y절편=0.2),\\ Loss(기울기=0.1, y절편=0.3),\\ \vdots \\ Loss(기울기=0.2, y절편=0.1), \\ \vdots \\ Loss(기울기=1, y절편=1)$$

100개의 Loss 값들을 계산하며 낮은 값이 나올때마다 최소 값을 갱신해 나가는 방식으로 최소 값을 구합니다.

<img src="img/1-1-1.png" width="30%" height="30%" title="greedy1" alt="greedy1"></img>

위 예에서는 기울기 0.3과 y절편 0.1을 가정 했을 때 가장 낮은 loss 값을 갖는 것을 구할 수 있었습니다.

다소 무식해보이는 방식이지만 자동으로 연산을 해주는 컴퓨터가 있기에 범위만 잡아주게 되면 최소 값을 찾을 수 있습니다.

##### <예제 1> greedy 알고리즘을 사용항 최적화

1장 단순 선형 회귀에서 수행했던 데이터와 모델을 가져와 greedy 알고리즘을 사용하여 최적의 파라미터를 구해봅시다.

In [6]:
import numpy as np

# feature, label 데이터 선언
feature_data = np.array([1,2,3,4])
label_data = np.array([3.1, 4.9, 7.2, 8.9])


# 1차 선형 모델 함수 정의
def linear_model(w_0, w_1, feature_data):
    f_x = w_0 + w_1*feature_data
    return f_x

# loss 함수 정의
def loss(f_x, label_data):
    error = label_data - f_x
    ls = np.mean(error**2)
    return ls

# 최소 loss값을 저장할 변수 초기화
min_loss_f_x = 100000

# greedy 알고리즘 시작
for i in np.arange(0.1, 1.1, 0.1):
    for j in np.arange(0.1, 1.1, 0.1):
        
        # 1차 선형 함수 출력값 저장
        f_x = linear_model(i,j,feature_data)
        
        # 1차 선형 함수의 loss 값 저장
        loss_f_x = loss(f_x,label_data)
        print("w_0: {}, w_1: {}, loss: {}\n".format(i,j,loss_f_x))
        
        # 최소 loss 값을 저장
        if (loss_f_x < min_loss_f_x):
            min_loss_f_x = loss_f_x
            min_w_0 = i
            min_w_1 = j
            
# 최소 loss 값 출력
print("Minimum Loss: {} when w_0: {}, w_1: {}".format(min_loss_f_x,min_w_0, min_w_1))


w_0: 0.1, w_1: 0.1, loss: 36.5925

w_0: 0.1, w_1: 0.2, loss: 33.3625

w_0: 0.1, w_1: 0.30000000000000004, loss: 30.2825

w_0: 0.1, w_1: 0.4, loss: 27.352500000000003

w_0: 0.1, w_1: 0.5, loss: 24.5725

w_0: 0.1, w_1: 0.6, loss: 21.942500000000006

w_0: 0.1, w_1: 0.7000000000000001, loss: 19.4625

w_0: 0.1, w_1: 0.8, loss: 17.132499999999997

w_0: 0.1, w_1: 0.9, loss: 14.9525

w_0: 0.1, w_1: 1.0, loss: 12.922500000000001

w_0: 0.2, w_1: 0.1, loss: 35.4675

w_0: 0.2, w_1: 0.2, loss: 32.2875

w_0: 0.2, w_1: 0.30000000000000004, loss: 29.2575

w_0: 0.2, w_1: 0.4, loss: 26.377500000000005

w_0: 0.2, w_1: 0.5, loss: 23.6475

w_0: 0.2, w_1: 0.6, loss: 21.067500000000003

w_0: 0.2, w_1: 0.7000000000000001, loss: 18.637500000000003

w_0: 0.2, w_1: 0.8, loss: 16.3575

w_0: 0.2, w_1: 0.9, loss: 14.2275

w_0: 0.2, w_1: 1.0, loss: 12.247500000000002

w_0: 0.30000000000000004, w_1: 0.1, loss: 34.36250000000001

w_0: 0.30000000000000004, w_1: 0.2, loss: 31.2325

w_0: 0.30000000000000004, w_1: 0.30000

---

### 2-2. Greedy 알고리즘 문제점

그렇다면 greedy 알고리즘의 문제점은 무엇일까요?

**1. 무한 범위에서의 계산 불가능**

아래 그림과 같이 실수 범위(무한)에서의 기울기, y 절편에 해당되는 Loss 값들은 비교가 불가능합니다.

<img src="img/1-1-2.png" width="30%" height="30%" title="greedy2" alt="greedy2"></img>

**2. 특정 범위에만 한정된 최소 값을 구할 수 있음**

항상 특정 범위를 설정하여 기울기, y절편에 해당되는 Loss 값들 비교해야 합니다. 그렇기에 범위를 벗어 난 곳에 더 작은 값이 있을 수 있습니다.

<img src="img/1-1-3.png" width="30%" height="30%" title="greedy3" alt="greedy3"></img>

**3. 범위 내의 모든 값을 비교하기에 계산양이 매우 많음**

항상 특정 범위를 설정하여 기울기, y절편에 해당되는 Loss 값들 비교해야 합니다. 그렇기에 범위를 벗어 난 곳에 더 작은 값이 있을 수 있습니다.

---