### 경사 하강법
- 앞서 살펴본 오차 계산법을 통하면 오차를 구할 수 있다. 
- 최적의 기울기보다 기울기가 크거나 작으면 오차는 커진다
- 최적의 y절편보다 y절편이 크거나 작으면 오차는 커진다. 
- 그러므로 오차와 기울기, 오차와 y절편간의 관계는 2차 함수 관계가 된다. 
- 이를 이용해 2차 함수를 통한 오차 그래프를 만들고 그 그래프의 접선의 기울기를 구해 접선의 기울기가 최소가 되는 지점을 찾게 된다. 
- 이때, 접선의 기울기를 구하기 위해 미분을 사용한다. 

In [1]:
# 기본
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# 경고가 뜨지 않도록..
import warnings
warnings.filterwarnings('ignore')

# 그래프 설정
plt.rcParams['font.family'] = 'Malgun Gothic'
# plt.rcParams['font.family'] = 'AppleGothic'
plt.rcParams['font.size'] = 16
plt.rcParams['figure.figsize'] = 20, 10
plt.rcParams['axes.unicode_minus'] = False

# 저장
import pickle

# 딥러닝
import tensorflow as tf

# 딥러닝 신경망 구조를 정의하는 것.
from tensorflow.keras.models import Sequential
# 층 구조를 정의하는 것
from tensorflow.keras.layers import Dense
# 활성화 함수를 정의하는 것
from tensorflow.keras.layers import Activation

# 평가함수
# 분류용
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import recall_score
from sklearn.metrics import f1_score

# 회귀용
from sklearn.metrics import r2_score
from sklearn.metrics import mean_squared_error

# 현재 프로젝트를 GPU에 할당한다.
# 사용한 가능한 GPU 목록을 가져온다.
gpus = tf.config.experimental.list_physical_devices('GPU')
# gpu가 있다면...
if len(gpus) > 0 :
    try :
        for gpu in gpus :
            tf.config.experimental.set_memory_growth(gpu, True)
    except RuntimeError as e :
        print(e)


In [2]:
# 입력 데이터
공부한시간 = [2, 4, 6, 8]
# 결과데이터
성적 = [81, 93, 91, 97]


In [3]:
# 계산의 편리성을 위해 ndarray를 생성한다. 
x_data = np.array(공부한시간)
y_data = np.array(성적)

print(x_data)
print(y_data)

[2 4 6 8]
[81 93 91 97]


In [4]:
# 임의의 기울기와 절편
기울기 = 0
절편 = 0

In [7]:
# 학습률
lr = 0.03
# 학습 횟수
epochs = 5000


In [6]:
# 학습 횟수 만큼 반복한다.
for i in range(epochs):

    # 현재의 기울기와 절편을 이용해 예측 결과를 가져온다.
    y_pred = (기울기 * x_data) + 절편
    # print(y_pred)
    # 오차를 구한다
    error = y_data - y_pred
    # print(error)

    # 오차값을 기울기로 미분한 값
    a_diff = -(2 / len(x_data)) * sum(x_data * error)
    # 오차값을 절편으로 미분한 값
    b_diff = -(2 / len(x_data)) * sum(error)

    # print(a_diff)
    # print(b_diff)

    # 학습률을 곱해 기존의 가중치와 절편을 업데이트 한다.
    기울기 = 기울기 - (lr * a_diff)
    절편 = 절편 - (lr * b_diff)

    # print(기울기)
    # print(절편)
    
    # 100 회마다 한번씩 결과를 출력한다.
    if i % 100 == 0 :
        print(f'epoch : {i}, 기울기 : {기울기}, 절편 : {절편}')


epoch : 0, 기울기 : 9.28, 절편 : 1.81
epoch : 100, 기울기 : 11.53011876080582, 절편 : 23.918598680072773
epoch : 200, 기울기 : 8.97032309847226, 절편 : 39.19436444515965
epoch : 300, 기울기 : 7.120437460344023, 절편 : 50.23369079298396
epoch : 400, 기울기 : 5.783581974373916, 절편 : 58.21147260031546
epoch : 500, 기울기 : 4.817477609037756, 절편 : 63.97677027882213
epoch : 600, 기울기 : 4.11930368185049, 절편 : 68.14317368825714
epoch : 700, 기울기 : 3.6147548462446433, 절편 : 71.15410535877027
epoch : 800, 기울기 : 3.250132912370932, 절편 : 73.3300131222791
epoch : 900, 기울기 : 2.986631849085022, 절편 : 74.90247477647904
epoch : 1000, 기울기 : 2.7962077305599884, 절편 : 76.03884447716045
epoch : 1100, 기울기 : 2.6585940736591147, 절편 : 76.86006392831712
epoch : 1200, 기울기 : 2.5591449140026836, 절편 : 77.45353398172813
epoch : 1300, 기울기 : 2.4872760633442614, 절편 : 77.8824165463088
epoch : 1400, 기울기 : 2.4353386541916175, 절편 : 78.19235679206184
epoch : 1500, 기울기 : 2.3978050851310653, 절편 : 78.41634108023509
epoch : 1600, 기울기 : 2.3706807285371108, 절편