### lac 01 - linear_regression의 hypothesis 와 cost 설명

supervised learning - 데이터를 가지고 학습을 시키는 것.

예를 들어 학생들의 점수와 시간을 가지고 학습을 시킬 때,  
학생들의 점수와 시간이 모두 training set, 이후 새로   
7시간을 공부한 학생이 어느정도의 점수를 받을까? 예측하는 것이 linear regression

linear regression의 첫 번째, 가설(함수) 
$$ H(x) = Wx + b$$

#### cost(loss) function
$$ H(x) - y $$

세운 가설과 실제 데이터 값($y$)의 차이를 구하는 것을 바로 cost function 이라  함.  

linear regression 의 경우, cost function은 차이의 제곱을 취해준 후, 개수만큼 나누어 평균을 구해줌 -> 차이만을 고려할 경우 0이 되므로  

$$ cost(W, b) = \frac{1}{m}\sum_{ i = 1}^m(H(x^{(i)}) - y^{(i)})^2$$

cost function 을 가장 작게 하는 W, b를 구하는 것이 cost function 의 목적  
'학습'을 한다는 것은 가장 작은 W, b를 구하게 하는 것

### TensorFlow 로 간단한 linear regression 을 구현

![2-1.png](img/2-1.png)
- 텐서플로 작동의 흐름
1. 그래프를 그림
2. sess.run(op)를 통해 그래프를 실현
3. 결과값을 리턴

#### tensorflow에 대한 설명
- 구글에서 제작
- 머신러닝을 위한 알고리즘은 상당히 많은데 왜 하필 텐서플로우인가?
> 텐서플로우가 대다수의 분야에서 1등을 차지  
> 많은 사람들이 사용하여 도움을 받거나 오픈 소스를 쉽게 얻을 수 있음.  
> 가장 좋은 선택이라 생각
- tensorflow는 numerical computation을 가능하게 하는 data flow graph
- data flow graph란?
> 노드(node)는 하나의 오퍼레이션, 하나의 더하기 혹은 빼기  
> 에지(edge)는 다차원의 텐서를 뜻함. 텐서들이 노드에 들어와 오퍼레이션(operation)이 일어남  

In [2]:
import tensorflow as tf

In [3]:
#하나의 node를 만들어 진 것
hello = tf.constant("Hello, Tensorflow")

#start a tf session
sess = tf.Session()

# run the op and result
print(sess.run(hello))

b'Hello, Tensorflow'


#### (1) 그래프를 만듬

In [4]:
node1 = tf.constant(3.0, tf.float32)
node2 = tf.constant(4.0)
node3 = tf.add(node1, node2)

#### (2) sess.run(op)를 통해 원하는 노드의 결과값을 얻어냄

In [5]:
#그래프의 하나의 요소로 써, 텐서라는 것만 표현
print("node1 : ", node1, "node2 : ", node2)
print("node3 : ", node3)

node1 :  Tensor("Const_1:0", shape=(), dtype=float32) node2 :  Tensor("Const_2:0", shape=(), dtype=float32)
node3 :  Tensor("Add:0", shape=(), dtype=float32)


In [7]:
sess = tf.Session()
print("sess.run(node1, node2) : ", sess.run([node1, node2]))
print("sess.run(node3) : ", sess.run(node3))

sess.run(node1, node2) :  [3.0, 4.0]
sess.run(node3) :  7.0


#### placeholder

그래프를 만들어 놓고 실행시키는 단계에서 값들을 던져 주고 싶다면?  
** placeholder** 라는 특별한 노드를 만들어줌

In [10]:
#노드를 constant를 통해 미리 만들어 주지 않고 placeholder라는 특별한 노드를 만들어
#값들을 실행시킬 때 바로 던져 줄 수 있게 해줌
a = tf.placeholder(tf.float32)
b = tf.placeholder(tf.float32)
adder_node = a + b

print(sess.run(adder_node, feed_dict = {a : 3, b : 4.5}))
#n개 이상의 값을 넣어 줄 수 있음
print(sess.run(adder_node, feed_dict = {a : [1,3], b : [2,4]}))

7.5
[ 3.  7.]


#### 1. Build graph using TF operations

$$ H(x) = Wx + b $$

In [11]:
#hypothesis를 텐서플러로 구현하는 과정
x_train = [1, 2, 3]
y_train = [1, 2, 3]

W = tf.Variable(tf.random_normal([1]), name = 'weight')
b = tf.Variable(tf.random_normal([1]), name = 'bias')

hypothesis = x_train * W + b

$$ cost(W, b) = \frac{1}{m}\sum_{ i = 1}^m(H(x^{(i)}) - y^{(i)})^2$$

In [13]:
# 코스트 함수를 텐서플러로 구현하는 과정
cost = tf.reduce_mean(tf.square(hypothesis - y_train))# reudce_mean의 경우, 평균을 내주는 것

#gradientdescent
optimizer = tf.train.GradientDescentOptimizer(learning_rate = 0.01)
train = optimizer.minimize(cost)

#### 2. run/update graph and get results

In [16]:
sess = tf.Session()
sess.run(tf.global_variables_initializer())

In [18]:
for step in range(2001) : 
    sess.run(train)
    if step % 20 == 0 :
        print(step, sess.run(cost), sess.run(W), sess.run(b))

0 12.4835 [-0.58267403] [-0.12305211]
20 0.142932 [ 0.66808599] [ 0.40022257]
40 0.0283138 [ 0.79569882] [ 0.43068877]
60 0.0247948 [ 0.81596613] [ 0.41513991]
80 0.0225107 [ 0.82563066] [ 0.39607662]
100 0.0204445 [ 0.83392209] [ 0.37750497]
120 0.018568 [ 0.84173644] [ 0.35976765]
140 0.0168637 [ 0.84917516] [ 0.34286025]
160 0.0153159 [ 0.85626334] [ 0.32674715]
180 0.0139102 [ 0.86301845] [ 0.3113912]
200 0.0126334 [ 0.86945611] [ 0.29675698]
220 0.0114739 [ 0.87559122] [ 0.28281048]
240 0.0104208 [ 0.88143796] [ 0.26951942]
260 0.0094643 [ 0.88700992] [ 0.25685298]
280 0.00859563 [ 0.89231998] [ 0.24478187]
300 0.0078067 [ 0.89738065] [ 0.23327807]
320 0.00709015 [ 0.90220338] [ 0.2223148]
340 0.00643939 [ 0.90679938] [ 0.21186683]
360 0.00584837 [ 0.91117948] [ 0.20190988]
380 0.00531157 [ 0.91535378] [ 0.19242086]
400 0.00482406 [ 0.91933191] [ 0.18337776]
420 0.00438129 [ 0.92312294] [ 0.17475966]
440 0.00397916 [ 0.92673582] [ 0.16654661]
460 0.00361393 [ 0.93017906] [ 0.15871

#### placeholder를 사용하게 된다면?

In [22]:
X = tf.placeholder(tf.float32)
Y = tf.placeholder(tf.float32)

for step in range(2001) : 
    cost_val, W_val, b_val, _ = \
    sess.run([cost, W, b, train],
           feed_dict = {X : [1, 2, 3], Y : [1, 2, 3]})
    if step % 20 == 0 :
        print(step, cost_val, W_val, b_val)

0 2.18052e-06 [ 0.99828905] [ 0.00388931]
20 1.98033e-06 [ 0.99836946] [ 0.00370653]
40 1.79868e-06 [ 0.99844611] [ 0.00353235]
60 1.63357e-06 [ 0.99851912] [ 0.00336635]
80 1.48359e-06 [ 0.99858874] [ 0.00320814]
100 1.34755e-06 [ 0.99865508] [ 0.00305738]
120 1.22384e-06 [ 0.99871826] [ 0.00291368]
140 1.11138e-06 [ 0.99877846] [ 0.00277675]
160 1.00951e-06 [ 0.9988358] [ 0.00264628]
180 9.16842e-07 [ 0.99889052] [ 0.00252196]
200 8.32625e-07 [ 0.99894267] [ 0.00240347]
220 7.56402e-07 [ 0.99899238] [ 0.00229054]
240 6.86852e-07 [ 0.99903971] [ 0.0021829]
260 6.23821e-07 [ 0.99908483] [ 0.00208032]
280 5.66561e-07 [ 0.99912786] [ 0.00198255]
300 5.14654e-07 [ 0.99916887] [ 0.0018894]
320 4.6735e-07 [ 0.99920779] [ 0.00180064]
340 4.24412e-07 [ 0.99924511] [ 0.00171605]
360 3.85635e-07 [ 0.99928045] [ 0.00163545]
380 3.50184e-07 [ 0.99931431] [ 0.00155864]
400 3.18096e-07 [ 0.99934655] [ 0.00148541]
420 2.88929e-07 [ 0.99937719] [ 0.00141563]
440 2.62392e-07 [ 0.9994064] [ 0.00134914]

placeholder를 쓰는 가장 큰 이유는 ** 만들어진 모델에 대해 값을 넘겨줄 수 있다는 것 **

### lec 03 - Linear regression의 cost 최소화 알고리즘의 원리 설명

![image.png](img/2-2.png)
- 우리가 가진 데이터로 포물선의 가장 작은 값을 찾는 것이 목표
- Gradient descent algorithm : 경사를 따라 내려가는 알고리즘
> 많은 cost function의 minimazation에 사용됨.
> 많은 w들이 있는 함수에서도 사용됨
- 아무 점에서 시작해도 가능 

![image.png](img/2-3.png)
- 위 수식을 기계적으로 적용만 시키면 되는 것.(미분 과정 생략)
- 만들어놓은 cost function이 convex function인지 반드시 확인할 것!