<a href="https://colab.research.google.com/github/cku7808/DL-for-everyone2/blob/main/ML_3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Cost Function in Python

$cost(W) = \frac{1}{m}\sum_{i=1}^{m}(W{x_i} - y_i)^2$

In [1]:
import numpy as np

X = np.array([1,2,3])
Y = np.array([1,2,3])

def cost_func1(W, X, Y):
  c = 0
  for i in range(len(X)):
    c += (W * X[i] - Y[i]) ** 2
  return c / len(X)

for feed_W in np.linspace(-3,5,num=15): #np.linspace : 구간 내에 균일한 간격으로 숫자 채우기 -> 구간 시작점, 구간 끝점, 구간 내 숫자 개수
  curr_cost = cost_func1(feed_W, X, Y)
  print("{:6.3f} | {:10.5f}".format(feed_W, curr_cost))

-3.000 |   74.66667
-2.429 |   54.85714
-1.857 |   38.09524
-1.286 |   24.38095
-0.714 |   13.71429
-0.143 |    6.09524
 0.429 |    1.52381
 1.000 |    0.00000
 1.571 |    1.52381
 2.143 |    6.09524
 2.714 |   13.71429
 3.286 |   24.38095
 3.857 |   38.09524
 4.429 |   54.85714
 5.000 |   74.66667


# Cost Function in TensorFlow

$cost(W) = \frac{1}{m}\sum_{i=1}^{m}(W{x_i} - y_i)^2$

In [2]:
import tensorflow as tf

def cost_func2(W, X, Y):
  hypothesis = W * X
  return tf.reduce_mean(tf.square(hypothesis - Y))

for feed_W in np.linspace(-3,5,num=15): #np.linspace : 구간 내에 균일한 간격으로 숫자 채우기 -> 구간 시작점, 구간 끝점, 구간 내 숫자 개수
  curr_cost = cost_func2(feed_W, X, Y)
  print("{:6.3f} | {:10.5f}".format(feed_W, curr_cost))

-3.000 |   74.66667
-2.429 |   54.85714
-1.857 |   38.09524
-1.286 |   24.38095
-0.714 |   13.71429
-0.143 |    6.09524
 0.429 |    1.52381
 1.000 |    0.00000
 1.571 |    1.52381
 2.143 |    6.09524
 2.714 |   13.71429
 3.286 |   24.38095
 3.857 |   38.09524
 4.429 |   54.85714
 5.000 |   74.66667


# Gradient Descent

$cost(W) = \frac{1}{m} \sum ^{m}_{i=1} (Wx_i - y_i)^2$

=> $W := W - α \frac{1}{m} \sum ^{m}_{i=1} (W(x_i) - y_i)^2$

In [3]:
alpha = 0.01
gradient = tf.reduce_mean(tf.multiply(tf.multiply(W, X) - Y, X)) #tf.multiply : 행렬 원소 간의 곱셈
descent = W - tf.multiply(alpha, gradient)
W.assign(descent)

NameError: ignored

In [7]:
# tf.set_random_seed(0) 버전 변경으로 인해 사용 불가

tf.random.set_seed(0) #매번 동일한 결과를 얻기 위함

x_data = [1.,2.,3.,4.]
y_data = [1.,3.,5.,7.]

#tf.random_normal : 버전 변경으로 사용 불가
W = tf.Variable(tf.random.normal([1], -100., 100.)) #tf.random.normal : 정규 분포를 따르는 1 shape의 난수 반환
# W의 값에 관계 없이 cost는 0으로 수렴 

for step in range(300):
  hypothesis = W * X
  cost = tf.reduce_mean(tf.square(hypothesis - Y))

  alpha = 0.01
  gradient = tf.reduce_mean(tf.multiply(tf.multiply(W, X) - Y, X)) #tf.multiply : 행렬 원소 간의 곱셈
  descent = W - tf.multiply(alpha, gradient)
  W.assign(descent)

  if step % 10 == 0:
    print("{:5} | {:10.4f} | {:10.6f}".format(step, cost.numpy(), W.numpy()[0])) #__.numpy() : tensor를 np.ndarray로 변경

    0 | 11716.3086 |  48.767971
   10 |  4504.9126 |  30.619968
   20 |  1732.1364 |  19.366755
   30 |   666.0052 |  12.388859
   40 |   256.0785 |   8.062004
   50 |    98.4620 |   5.379007
   60 |    37.8586 |   3.715335
   70 |    14.5566 |   2.683725
   80 |     5.5970 |   2.044044
   90 |     2.1520 |   1.647391
  100 |     0.8275 |   1.401434
  110 |     0.3182 |   1.248922
  120 |     0.1223 |   1.154351
  130 |     0.0470 |   1.095710
  140 |     0.0181 |   1.059348
  150 |     0.0070 |   1.036801
  160 |     0.0027 |   1.022819
  170 |     0.0010 |   1.014150
  180 |     0.0004 |   1.008774
  190 |     0.0002 |   1.005441
  200 |     0.0001 |   1.003374
  210 |     0.0000 |   1.002092
  220 |     0.0000 |   1.001297
  230 |     0.0000 |   1.000804
  240 |     0.0000 |   1.000499
  250 |     0.0000 |   1.000309
  260 |     0.0000 |   1.000192
  270 |     0.0000 |   1.000119
  280 |     0.0000 |   1.000074
  290 |     0.0000 |   1.000046
