# ML Lab02 : TensorFlow로 간단한 linear regression 구현

## Hypothesis and cost function

$$H(x) = Wx + b $$
$$cost(W,b) = \frac{1}{m}\sum_{i=1}^m (H(x_i)-y_i)^2 $$

cost function의 결과 값이 가장 작은 값이 되도록 W,b를 구해야한다.

### 1. Build graph using TF operations

In [2]:
import tensorflow as tf
# X and Y data
x_train = [1, 2, 3]
y_train = [1, 2, 3]

# Variable이라는 Node
# 기존의 변수와는 조금 다른 개념
# Tensorflow가 사용하는 variable 또 다른 말로는 trainable variable이라고 한다.
# tf.random_normal([1]) 여기서 [1]은 값이 하나인 1차원 array. rank가 1.
W = tf.Variable(tf.random_normal([1]), name = 'weight')
b = tf.Variable(tf.random_normal([1]), name = 'bias')

# Wx + b
hypothesis = x_train * W + b

# cost/Loss function
# tf.reduce_mean()이라는 함수는 tensor가 주어줬을 때 평균을 내주는 함수
# t = [1., 2., 3., 4.]
# tf.reduce_mean(t) ==> 2.5
cost = tf.reduce_mean(tf.square(hypothesis - y_train))

# cost를 minmize해줘야한다. 이때 tensorflow에서 쓰는 방법중에 하나는
# GradientDescent를 사용하는 것이다.

# Minmize
optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.01)
#train은 그래프의 이름이 될 것이다.
train = optimizer.minimize(cost)


sess = tf.Session()
# 우리는 W,b라는 tensorflow를 사용했고, tensorflow에서 변수를 사용하기 위해서는
# tf.global_variables_initializer()를 실행해야한다.
sess.run(tf.global_variables_initializer())

# sess.run(train)을 2000번 정도 step을 돌 것이고
for step in range(2001):
    sess.run(train)
    
    # step이 20번 돌 때마다 출력을 하라
    if step % 20 == 0:
        print(step, sess.run(cost), sess.run(W), sess.run(b))


(0, 0.8835327, array([1.3799015], dtype=float32), array([-1.6471113], dtype=float32))
(20, 0.3060555, array([1.6097605], dtype=float32), array([-1.4607337], dtype=float32))
(40, 0.27346393, array([1.6046908], dtype=float32), array([-1.3817085], dtype=float32))
(60, 0.24832338, array([1.5785186], dtype=float32), array([-1.3157853], dtype=float32))
(80, 0.22553106, array([1.5515443], dtype=float32), array([-1.2538543], dtype=float32))
(100, 0.20483094, array([1.5256443], dtype=float32), array([-1.1949189], dtype=float32))
(120, 0.18603076, array([1.500943], dtype=float32), array([-1.1387615], dtype=float32))
(140, 0.16895615, array([1.4774005], dtype=float32), array([-1.0852438], dtype=float32))
(160, 0.15344863, array([1.4549645], dtype=float32), array([-1.0342412], dtype=float32))
(180, 0.13936456, array([1.4335828], dtype=float32), array([-0.9856358], dtype=float32))
(200, 0.12657316, array([1.4132061], dtype=float32), array([-0.93931466], dtype=float32))
(220, 0.11495576, array([1.39

## Placeholders

우리가 직접 그 값을 주지 않고, 그 값을 placeholder라는 이름을 주고
필요 할 때 값을 던져 준다.

In [3]:
import tensorflow as tf
# X and Y data
W = tf.Variable(tf.random_normal([1]), name = 'weight')
b = tf.Variable(tf.random_normal([1]), name = 'bias')

X = tf.placeholder(tf.float32, shape=[None])
Y = tf.placeholder(tf.float32, shape=[None])

# Wx + b
hypothesis = X * W + b

cost = tf.reduce_mean(tf.square(hypothesis - Y))

# Minmize
optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.01)
train = optimizer.minimize(cost)


sess = tf.Session()
sess.run(tf.global_variables_initializer())


for step in range(2001):
    cost_val, W_val, b_val, _ = sess.run([cost, W, b, train],
                                        feed_dict={X: [1, 2, 3, 4, 5],
                                                  Y: [2.1, 3.1, 4.1, 5.1, 6.1]})
    if step % 20 == 0:
        print(step, cost_val, W_val, b_val)


(0, 1.7194917, array([1.5546955], dtype=float32), array([0.12136886], dtype=float32))
(20, 0.1770086, array([1.2733887], dtype=float32), array([0.11760484], dtype=float32))
(40, 0.15455587, array([1.2543777], dtype=float32), array([0.18163626], dtype=float32))
(60, 0.13497475, array([1.2377133], dtype=float32), array([0.24177927], dtype=float32))
(80, 0.11787455, array([1.2221453], dtype=float32), array([0.2979848], dtype=float32))
(100, 0.10294062, array([1.2075968], dtype=float32), array([0.35050946], dtype=float32))
(120, 0.08989887, array([1.1940012], dtype=float32), array([0.39959413], dtype=float32))
(140, 0.078509346, array([1.181296], dtype=float32), array([0.4454642], dtype=float32))
(160, 0.068562806, array([1.1694227], dtype=float32), array([0.48833022], dtype=float32))
(180, 0.059876412, array([1.1583271], dtype=float32), array([0.5283889], dtype=float32))
(200, 0.05229051, array([1.147958], dtype=float32), array([0.5658242], dtype=float32))
(220, 0.04566572, array([1.13826

(1880, 5.9834736e-07, array([1.0005006], dtype=float32), array([1.0981929], dtype=float32))
(1900, 5.2263147e-07, array([1.0004678], dtype=float32), array([1.0983112], dtype=float32))
(1920, 4.563596e-07, array([1.0004371], dtype=float32), array([1.0984218], dtype=float32))
(1940, 3.9865782e-07, array([1.0004085], dtype=float32), array([1.0985249], dtype=float32))
(1960, 3.4832578e-07, array([1.000382], dtype=float32), array([1.0986215], dtype=float32))
(1980, 3.0408208e-07, array([1.0003569], dtype=float32), array([1.0987118], dtype=float32))
(2000, 2.655946e-07, array([1.0003334], dtype=float32), array([1.0987961], dtype=float32))


In [4]:
#Testing our model
print(sess.run(hypothesis, feed_dict={X: [5]}))
print(sess.run(hypothesis, feed_dict={X: [2.5]}))
print(sess.run(hypothesis, feed_dict={X: [1.5, 3.5]}))

[6.100463]
[3.5996296]
[2.5992963 4.599963 ]


---

## 총 정리

1. Graph를 TensorFlow 툴을 통해서 빌드한다.
    - TensorFlow를 통해 hypothesis와 cost에 해당하는 그래프를 만듦
    
    
$$H(x) = Wx + b $$
$$cost(W,b) = \frac{1}{m}\sum_{i=1}^m (H(x_i)-y_i)^2 $$

2. sess.run(op)을 통해서 Graph를 실행시킨다
    - sess.run(op, feed_dict={x: x_data})
    - feed_dict를 통해 학습 x y data를 주면서 그래프를 실행
    <br><br>
3. 그 결과로 Graph 속의 어떤 값들이 업데이트되거나 리턴한다.
    - 내부적으로 W와 b 값을 업데이트 시켰고, 원할 때 hypothesis와 같은 값을 return했다.