# 05. 텐서플로우를 이용한 Linear Regression

## Hypothesis and cost function

$ H(x) = Wx + b $

$ cost(W, b) = \frac{1}{m}\sum_{(i=1)}^{m}{(H(x^{(i)})-y^{(i)})^2} $

- $ H(x^{(i)}) $: 가설에 대한 값

- $ y^{(i)} $: 실제 값

- cost function은 w와 b의 함수이다. 

- cost function은 w, b의 값에 따라서 값이 달라질 수 있다.

- 학습이란 w와 b를 조절하여 cost 값을 최소화하는 과정이다.

- Tensorflow 저리 절차
  - 그래프 빌드
  - 세션을 실행하고 변수값 feed
  - 그래프 업데이트 및 값 반환

![](./images/03/tensorflow_machanics3.jpg)

## Tensorflow 그래프 빌드

### $ H(x) = Wx + b $

In [43]:
import tensorflow as tf

In [44]:
x_train = [1, 2 ,3]
y_train = [1, 2, 3]

W = tf.Variable(tf.random_normal([1]), name='weight') 
b = tf.Variable(tf.random_normal([1]), name='bias')

hypothesis = x_train*W+b

- variable은 tensorflow가 사용하는 변수
  - trainable variable이다.
  - tf가 학습을 하면서 사용하는 변수

### $ cost(W, b) = \frac{1}{m}\sum_{(i=1)}^{m}{(H(x^{(i)})-y^{(i)})^2} $

In [45]:
cost = tf.reduce_mean(tf.square(hypothesis-y_train))

#### numpy 테스트 : np.reduce_mean은 numpyp.mean과 호환 메서드

In [46]:
import numpy as np
a = np.array([[1, 2], [3, 4]])
print("axis[None]:",np.mean(a))
print("axis[0]:",np.mean(a, 0))
print("axis[1]:",np.mean(a, 1))

axis[None]: 2.5
axis[0]: [ 2.  3.]
axis[1]: [ 1.5  3.5]


#### cost값을 최소화하는 방법

- GradientDescent

In [47]:
optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.1)
train = optimizer.minimize(cost)

- minimize방법을 선택
- minimize대상 cost를 설정
  - W와 b를 조정하여 cost를 최소화
- train인도 하나의 node임: 연산 대상
  - train 실행
  - cost 최소화 수행
  - cost 수행
  - hypothesis수행

![](./images/04/graph.png)

- 그래프 구현 완료

##  그래프 실행 및 업데이트

In [48]:
sess = tf.Session()
sess.run(tf.global_variables_initializer()) #그래프에 글로벌 변수 초기화, Variable을 사용하기 위한 필수 전처리

In [49]:
for step in range(3001):
    sess.run(train) ## train 노드 수행하는 코드
    if step%200 == 0:
        print(step, sess.run(cost), sess.run(W), sess.run(b))

0 0.152771 [ 1.47859097] [-0.96563435]
200 8.25903e-06 [ 1.00333786] [-0.00758763]
400 4.91673e-10 [ 1.00002575] [ -5.84950358e-05]
600 4.85538e-14 [ 1.00000036] [ -6.46736510e-07]
800 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
1000 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
1200 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
1400 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
1600 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
1800 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
2000 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
2200 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
2400 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
2600 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
2800 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]
3000 3.78956e-14 [ 1.00000036] [ -6.22894675e-07]


## placeholders

- 값은 runtime에 설정하는 방법

In [52]:
import tensorflow as tf

a = tf.placeholder(tf.float32)
b = tf.placeholder(tf.float32)
add_node= a+b
sess = tf.Session()

print(sess.run(add_node, feed_dict={a:3, b:4.5}))

7.5


In [53]:
print(sess.run(add_node, feed_dict={a:[1, 3], b:[2, 4]}))

[ 3.  7.]


## placeholder 적용

In [68]:
import tensorflow as tf

X= tf.placeholder(tf.float32)
Y= tf.placeholder(tf.float32)
W = tf.Variable(tf.random_normal([1]), name='weight')
b = tf.Variable(tf.random_normal([1]), name='bias')

hypothesis = W*X+b
cost = tf.reduce_mean(tf.square(hypothesis-Y))

optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.05)
train = optimizer.minimize(cost)

sess = tf.Session()
sess.run(tf.global_variables_initializer())

for step in range(2001):
    cost_val, W_val, b_val, _ = sess.run([cost, W, b, train], feed_dict={X:[1, 2, 3, 4, 5], Y:[2.1, 3.1, 4.1, 5.1, 6.1]})
    if step % 100 == 0:
        print(step, cost_val, W_val, b_val)

0 61.8839 [ 1.49621606] [ 0.87698233]
100 0.000697508 [ 1.01685655] [ 1.03914249]
200 2.30497e-05 [ 1.00306427] [ 1.08893692]
300 7.61459e-07 [ 1.00055707] [ 1.09798896]
400 2.51785e-08 [ 1.00010133] [ 1.09963441]
500 8.27288e-10 [ 1.00001848] [ 1.09993351]
600 2.86491e-11 [ 1.00000334] [ 1.09998763]
700 2.28511e-12 [ 1.00000107] [ 1.09999621]
800 2.28511e-12 [ 1.00000107] [ 1.09999621]
900 2.28511e-12 [ 1.00000107] [ 1.09999621]
1000 2.28511e-12 [ 1.00000107] [ 1.09999621]
1100 2.28511e-12 [ 1.00000107] [ 1.09999621]
1200 2.28511e-12 [ 1.00000107] [ 1.09999621]
1300 2.28511e-12 [ 1.00000107] [ 1.09999621]
1400 2.28511e-12 [ 1.00000107] [ 1.09999621]
1500 2.28511e-12 [ 1.00000107] [ 1.09999621]
1600 2.28511e-12 [ 1.00000107] [ 1.09999621]
1700 2.28511e-12 [ 1.00000107] [ 1.09999621]
1800 2.28511e-12 [ 1.00000107] [ 1.09999621]
1900 2.28511e-12 [ 1.00000107] [ 1.09999621]
2000 2.28511e-12 [ 1.00000107] [ 1.09999621]


- placeholder를 사용하는 이유는 학습데이터를 직접 넘길수 잇음
  - shape=[None]
- 모델에 feed_dict로 결과를 계산할 수 있음

In [71]:
print(sess.run(hypothesis, feed_dict={X:5}))
print(sess.run(hypothesis, feed_dict={X:2.5}))
print(sess.run(hypothesis, feed_dict={X:[1.5,3.5]}))

[ 6.10000134]
[ 3.59999895]
[ 2.599998   4.5999999]


## overview

![](./images/04/overview.jpg)

## last update

In [72]:
import datetime
print(datetime.datetime.now())

2017-05-29 04:58:00.522258
