# **경사 하강법**

In [None]:
# 사용할 라이브러리 불러오기
import numpy as np
import matplotlib.pyplot as plt

## 사용할 함수 생성

In [None]:
 def function(x) :
  return np.power(x, 2) + 1

## 함수 시각화

In [None]:
delta = 1e-6
x = np.arange(-2, 2, delta)
y = function(x)

In [None]:
plt.plot(x, y)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Function")
plt.show()

## **SciPy를 활용한 미분 값 계산**

In [None]:
from scipy.misc import derivative

### 미분 값 계산

In [None]:
derivative(function, 0, delta)

## **경사 하강법을 이용한 최소 값 확인**

### 경사 하강법 수식

In [None]:
def gradientDescent(function, x, delta, lr) :
  # 코드를 작성해주세요
  return newX

### 시작점

In [None]:
initialX = -1.5

### **경사 하강법을 적용하여 최소 값 확인**

In [None]:
newXList, newYList = [], []

startX = initialX
iteration = 10
lr = 1e-1

for i in range(iteration) :
  newX = gradientDescent(function, startX, delta, lr)
  newXList.append(newX)
  newYList.append(function(newX))
  startX = newX

### **경사 하강 과정 시각화**

In [None]:
plt.figure(figsize=(10, 5))

regionX, regionY = np.arange(initialX, 0, delta), function(np.arange(initialX, 0, delta))
plt.plot(regionX, regionY)

plt.scatter(newXList, newYList)

for i in range(iteration - 1) :
  deltaX, deltaY = newXList[i+1]-newXList[i], newYList[i+1]-newYList[i]
  plt.arrow(newXList[i], newYList[i], deltaX, deltaY, head_width=0.05, head_length=0.1, fc="k", ec="k")

plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Gradient Descent")
plt.show()

### **경사 하강법을 적용하여 최소 값 확인 (Iteration 증가)**

In [None]:
newXList, newYList = [], []

startX = initialX
iteration = 50
lr = 1e-1

for i in range(iteration) :
  newX = gradientDescent(function, startX, delta, lr)
  newXList.append(newX)
  newYList.append(function(newX))
  startX = newX

### **경사 하강 과정 시각화**

In [None]:
plt.figure(figsize=(10, 5))

regionX, regionY = np.arange(initialX, 0, delta), function(np.arange(initialX, 0, delta))
plt.plot(regionX, regionY)

plt.scatter(newXList, newYList)

for i in range(iteration - 1) :
  deltaX, deltaY = newXList[i+1]-newXList[i], newYList[i+1]-newYList[i]
  plt.arrow(newXList[i], newYList[i], deltaX, deltaY, head_width=0.05, head_length=0.1, fc="k", ec="k")

plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Gradient Descent")
plt.show()

### 경사 하강법을 통해 얻은 최소 값 출력

In [None]:
latestX, latestY = newXList[-1], newYList[-1]
print(latestX, latestY)

### 해당 지점에서의 Gradient 계산

In [None]:
derivative(function, latestX, delta)

### **경사 하강법을 적용하여 최소 값 확인 (낮은 학습률)**

In [None]:
newXList, newYList = [], []

startX = initialX
iteration = 10
lr = 1e-2

for i in range(iteration) :
  newX = gradientDescent(function, startX, delta, lr)
  newXList.append(newX)
  newYList.append(function(newX))
  startX = newX

### **경사 하강 과정 시각화**

In [None]:
plt.figure(figsize=(10, 5))

regionX, regionY = np.arange(initialX, 0, delta), function(np.arange(initialX, 0, delta))
plt.plot(regionX, regionY)

plt.scatter(newXList, newYList)

for i in range(iteration - 1) :
  deltaX, deltaY = newXList[i+1]-newXList[i], newYList[i+1]-newYList[i]
  plt.arrow(newXList[i], newYList[i], deltaX, deltaY, head_width = 0.05, head_length=0.1, fc="k", ec="k")

plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Gradient Descent")
plt.show()

### **경사 하강법을 적용하여 최소 값 확인 (낮은 학습률 + Iteration 증가)**

In [None]:
newXList, newYList = [], []

startX = initialX
iteration = 500
lr = 1e-2

for i in range(iteration) :
  newX = gradientDescent(function, startX, delta, lr)
  newXList.append(newX)
  newYList.append(function(newX))
  startX = newX

### **경사 하강 과정 시각화**

In [None]:
plt.figure(figsize=(10, 5))

regionX, regionY = np.arange(initialX, 0, delta), function(np.arange(initialX, 0, delta))
plt.plot(regionX, regionY)

plt.scatter(newXList, newYList)

for i in range(iteration - 1) :
  deltaX, deltaY = newXList[i+1]-newXList[i], newYList[i+1]-newYList[i]
  plt.arrow(newXList[i], newYList[i], deltaX, deltaY, head_width=0.05, head_length=0.1, fc="k", ec="k")

plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Gradient Descent")
plt.show()

### 경사 하강법을 통해 얻은 최소 값 출력

In [None]:
latestX, latestY = newXList[-1], newYList[-1]
print(latestX, latestY)

### 해당 지점에서의 Gradient 계산

In [None]:
derivative(function, latestX, delta)

## **경사 하강법에 기반한 선형 회귀 분석**

### 정량적 평가를 위한 Scikit-Learn 라이브러리 사용

In [None]:
from sklearn.metrics import r2_score

### 선형 모델 함수 샘플링

In [None]:
def function(x) :
  return 10*x + 5

### 선형 모델 함수 시각화

In [None]:
x = np.arange(0, 10, 1e-2)
y = function(x)

In [None]:
plt.plot(x, y)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Function")
plt.show()

### **경사 하강법 기반 매개변수 최신화 함수 (MSE 손실 함수)**

In [None]:
def gradientDescent(input, target, a, b, lr) :
  # 코드를 작성해주세요
  return newA, newB

### 시드 고정

In [None]:
np.random.seed(42)

### 모델 파라미터 (매개변수) 초기화

In [None]:
a, b = np.random.random(), np.random.random()
print(a, b)

### 하이퍼파라이터 선정

In [None]:
iteration, lr = 100, 1e-2

### **경사 하강을 통한 파라미터 최신화**

In [None]:
oldA, oldB = a, b

listA, listB = [], []
listLoss = []

for i in range(iteration) :
  pred = oldA * x + b
  target = function(x)

  loss = np.power((pred - target), 2).mean()
  listLoss.append(loss)

  newA, newB = gradientDescent(x, y, oldA, oldB, lr)
  oldA, oldB = newA, newB

  listA.append(oldA)
  listB.append(oldB)

### 손실 함수 시각화

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(np.arange(iteration), listLoss)
plt.xlabel("Iteration")
plt.ylabel("MSE Loss")
plt.title("Loss Graph")
plt.show()

### **최신화 된 모델 파라미터 출력**

In [None]:
finalA, finalB = listA[-1], listB[-1]
print(finalA, finalB)

### **모델 파라미터를 기준으로 결과 추론**

In [None]:
yPred = finalA*x + finalB

### **추론 결과의 정성적 및 정략성 평가**

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(x, y, label="Ground Truth")
plt.plot(x, yPred, label="Prediction")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Regression Result")
plt.legend(loc="best")
plt.show()

In [None]:
r2_score(y, yPred)

### **훈련된 모델 파라미터의 외삽법 (Extrapolation) 결과**

In [None]:
x = np.arange(20, 30, 1e-2)

In [None]:
y = function(x)

In [None]:
yPred = finalA*x + finalB

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(x, y, label="Ground Truth")
plt.plot(x, yPred, label="Prediction")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Regression Result")
plt.legend(loc="best")
plt.show()

In [None]:
r2_score(y, yPred)

## **경사 하강법에 기반한 다중 레이어 모델 기반 회귀 분석**

### 비선형 모델 함수 샘플링

In [None]:
def function(x) :
  return 4*np.power(x, 2) + 2*x + 1

### 비선형 모델 함수 시각화

In [None]:
x = np.arange(0, 10, 1e-2)
y = function(x)

In [None]:
plt.plot(x, y)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Function")
plt.show()

### **경사 하강법 기반 매개변수 최신화 함수 (MSE 손실 함수)**

In [None]:
def f(x, a, b) :
  return a*x + b

def g(function, x, c, d) :
  return c*x*function + d

In [None]:
def gradientDescent(input, target, a, b, c, d, lr) :
  # 코드를 작성해주세요
  return newA, newB, newC, newD

### 모델 파라미터 (매개변수) 초기화

In [None]:
a, b, c, d, = np.random.random(), np.random.random(), np.random.random(), np.random.random()

### 하이퍼파라이터 선정

In [None]:
iteration, lr = 2000, 1e-7

### **경사 하강을 통한 파라미터 최신화**

In [None]:
oldA, oldB, oldC, oldD = a, b, c, d

listA, listB, listC, listD = [], [], [], []
listLoss = []

for i in range(iteration) :
  pred = oldC*x*(oldA*x + oldB) + oldD
  target = function(x)

  loss = np.power((pred - target), 2).mean()
  listLoss.append(loss)

  newA, newB, newC, newD = gradientDescent(x, y, oldA, oldB, oldC, oldD, lr)
  oldA, oldB, oldC, oldD = newA, newB, newC, newD

  listA.append(oldA)
  listB.append(oldB)
  listC.append(oldC)
  listD.append(oldD)

### 손실 함수 시각화

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(np.arange(iteration), listLoss)
plt.xlabel("Iteration")
plt.ylabel("MSE Loss")
plt.title("Loss Graph")
plt.show()

### **최신화 된 모델 파라미터 출력**

In [None]:
finalA, finalB, finalC, finalD = listA[-1], listB[-1], listC[-1], listD[-1]
print(finalA, finalB, finalC, finalD)

### **모델 파라미터를 기준으로 결과 추론**

In [None]:
yPred = finalC*x*(finalA*x + finalB) + finalD

### **추론 결과의 정성적 평가**

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(x, y, label="Ground Truth")
plt.plot(x, yPred, label="Prediction")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Regression Result")
plt.legend(loc="best")
plt.show()

### **훈련된 모델 파라미터의 외삽법 (Extrapolation) 결과**

In [None]:
x = np.arange(20, 30, 1e-2)

In [None]:
y = function(x)

In [None]:
yPred = finalC*x*(finalA*x + finalB) + finalD

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(x, y, label="Ground Truth")
plt.plot(x, yPred, label="Prediction")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Regression Result")
plt.legend(loc="best")
plt.show()

# **[ 경사 하강법 개인 실습 ]**

## 하단의 손실 함수가 구간 내에서 수렴할 때까지 경사 하강을 실행하세요.

### 수렴 기준 → 이전 값과 현재 값의 차이의 절댓값이 1e-16 이하일 때

In [None]:
def LossFunction(x) :
  loss = 4*np.power(x, 4) - 10*np.power(x, 3) - 2*np.power(x, 2) + x - 50

  return loss

In [None]:
x = np.arange(-2, 3, 1e-3)
y = LossFunction(x)

In [None]:
plt.plot(x, y)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.title("Function")
plt.show()

### **조건 1**

In [None]:
startX, lr = -1, 1e-4
diff = np.inf

In [None]:
# 코드를 작성해주세요

### **조건 2**

In [None]:
startX, lr = 1, 1e-4
diff = np.inf

In [None]:
# 코드를 작성해주세요