## 파이썬으로 Gradient Descent Algorithm 작성하기


### 과제 방법

gradient_descent 함수를 완성하시오.

반드시 스스로 직접! 해보세요.


In [0]:

import numpy as np
import os

# w에 대한 cost 함수를 f(w)라고 하고, b에 대한 cost 함수를 f(b)라 할 때, 
# 함수 f를 w와 b로 각각 편미분한 값이 w에 대한 gradient와 b에 대한 gradient
# 현재 w와 b 지점의 gradient와 learning rate를 곱해 w와 b에 각각 빼주면, cost 함수의 global optimization 지점에 도달할 수 있다(기울기가 0인 지점근방까지) 
# gradient만큼 빼주는 이유 - 기울기가 0이상이면, 왼쪽으로 기울기가 0이하이면 오른쪽 방향을 가지기 때문에 언제나 cost가 낮은 방향으로 w,b가 업데이트되기 때문. 
# 그리고 gradient가 클수록 이차함수의 특성으로 optimization 지점과 더 먼 지점에 위치한 w인데 . 이 때 더 많이 업데이트 할 수 있다.


# 잔차 
def get_residual(w,b,x,y):
  return (w*x+b)-y

# 잔차 제곱 합
def get_sse(residuals):
  return sum(residual**2 for residual in residuals)
  
# 잔차 제곱 평균
def get_mse(w, b, points):
  x=points[:,0] #독립변수 x
  y=points[:,1] #종속변수 y
  residuals=[]
  len_data=len(points)
  for i in range(0,len_data):
    residual=get_residual(w,b,x[i],y[i])
    residuals.append(residual)
  sse=get_sse(residuals)
  return sse/len_data

# mse cost , w-편미분, b-편미분
def get_gradient(w,b,points):
  h = 0.00001 # 0에 가까운 수(0으로 극한)
  w_gradient = 0 
  b_gradient = 0
  mse = get_mse(w,b,points) # f(x)
  w_mse = get_mse((w+h),b,points) # f(w+h)
  b_mse = get_mse(w,(b+h),points) # f(b+h)
  w_gradient = (w_mse-mse)/h # f(w+h)-f(w)/h
  b_gradient = (b_mse-mse)/h # f(b+h)-f(b)/h
  return mse, w_gradient, b_gradient

  
def gradient_descent(points, starting_b, starting_m, learning_rate, num_iterations):
    b = starting_b #b 초기화
    w = starting_m #w 초기화
    pointss = points # x,y 데이터
    for i in range(0,num_iterations): # 업데이트 반복
      mse,w_gradient,b_gradient = get_gradient(w,b,pointss)
      w = w - learning_rate * w_gradient
      b = b - learning_rate * b_gradient
      if i%2000==0:
        print(i,w,b,mse)
    return [b, w]



In [67]:



# 학습 데이터 다운로드
if os.path.exists('20190407_data.csv')==False:
    print('Train data downloading..')
    ! curl 'https://raw.githubusercontent.com/unizard/2019.Spring.AI/master/20190407_data.csv' -o './20190407_data.csv'        
    print('Done..\n')
else:
    print('File already exists \n')
    



def run():
    points = np.genfromtxt("20190407_data.csv", delimiter=",")
    learning_rate = 0.0004 # learning rate
    initial_b = 10.0 # initial y-intercept guess
    initial_m = 0.5 # initial slope guess
    num_iterations = 300001 # iteration
    
    print("========================")
    print(" Start")    
    print("========================")
    [b, w] = gradient_descent(points, initial_b, initial_m, learning_rate, num_iterations)
    print("b=",b)
    print("w=",w)
    

    
    
    
if __name__ == '__main__':
    run()


File already exists 

 Start
0 2.060220018191103 10.030604699823016 1637.3790484995645
2000 1.284964877501011 9.89707795921106 110.39455157299935
4000 1.2871509197644855 9.785762865843708 110.37899793604322
6000 1.2892105833610685 9.680970420614017 110.36521075930769
8000 1.2911495589729611 9.582318389031457 110.35298921772737
10000 1.2929749184557977 9.489446967627941 110.34215536955324
12000 1.2946933193096584 9.402017436328833 110.33255150593266
14000 1.2963110287221298 9.319710922217155 110.32403784970425
16000 1.2978339469246976 9.242227237124325 110.31649051611899
18000 1.299267628335656 9.169283782618436 110.30979970541136
20000 1.300617301762827 9.10061451982017 110.30386810102442
22000 1.301887889750219 9.03596899832678 110.2986094499145
24000 1.3030840264729022 8.975111443005517 110.29394730441604
26000 1.3042100743995206 8.917819894580248 110.28981390721744
28000 1.3052701404704976 8.863885399332503 110.28614920307673
30000 1.3062680909989695 8.81311124732349 110.28289996301