# 텐서플로 - 선형회귀 모델

**선형 회귀** 란? 주어진 x와 y값을 가지고 서로 간의 관계를 파악하는 것.
이 관계를 알고 나면 새로운 x값이 주어졌을 때 y값을 쉽게 알 수 있다.  

아래 `x_data`와 `y_data`의 상관관계를 파악해보자.

In [24]:
x_data = [1, 2, 3]
y_data = [1, 2, 3]

In [25]:
import tensorflow as tf

x와 y의 상관관계를 설명하기 위한 변수들인 W와 b를 각각 -1.0부터 1.0사이의 <u>균등분포(uniform distribution)</u>를 가진 무작위 값으로 초기화

In [26]:
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
b = tf.Variable(tf.random_uniform([1], -1.0, 1.0))

자료를 입력 받을 플레이스홀더

In [27]:
X = tf.placeholder(tf.float32, name='X')
Y = tf.placeholder(tf.float32, name='Y')

X와 Y의 상관관계(선형관계)를 분석하기 위한 수식

`W`는 가중치(weight)  
`b`는 편향(bias)

In [28]:
hypothesis = W * X + b

손실 함수(loss fuction)는 한 쌍(x, y)의 데이터에 대한 **손실값**을 계산하는 함수.  
손실값이란 실제값과 모델로 예측한 값이 얼마나 차이가 나는가를 나타내는 값.  
즉, 손실값이 작을수록 그 모델이 X와 Y의 관계를 잘 설명하고 있다는 뜻이며, 주어진 X값에 대한 Y값을 정확하게 예측할 수 있다는 뜻.  
이 손실을 전체 데이터에 대해 구한 경우 이를 **비용(cost)** 라고 한다.  
**학습**이란 변수들의 값을 다양하게 넣어 계산해보면서 이 손실값을 최소화 하는 `W`와 `b` 값을 구하는 것.  
손실값은 예측값에서 실제값을 뺀 뒤 제곱하여, 그리고 비용은 모든 데이터에 대한 손실값의 평균을 내어 구한다.

In [29]:
cost = tf.reduce_mean(tf.square(hypothesis - Y))

**최적화 함수**란 가중치(W)와 편향(b) 값을 변경해가면서 손실값을 최소화하는 가장 최적화된 가중치와 편향값을 찾아주는 함수  
이 값들을 무작위로 변경하면 시간이 너무 오래 걸리고, 학습 시간 예측이 어렵기 때문에 빠르게 최적화하기 위한 다양한 방법을 활용한다.  
**경상하강법(gradient descent)** 은 함수의 기울기를 구하고 기울기가 낮은 쪽으로 계속 이동시키면서 최적화의 값을 찾아 나가는 방법.  
최적화 함수의 매개변수인 **학습률(learning_rate)** 은 학습을 얼마나 '급하게' 할 것인가를 설정하는 값으로 값이 너무 크면 최적의 손실값을 찾지 못하고 지나치게 되고, 값이 너무 작으면 학습 속도가 너무 느려진다. 이렇게 학습을 진행하는 과정에 영향을 주는 변수를 **하이퍼파라미터(hyperparameter)** 라고 한다. 머신러닝에서는 이 하이퍼파라미터를 잘 튜닝하는 것이 큰 과제 

In [30]:
optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.1)
train_op = optimizer.minimize(cost)

In [40]:
sess = tf.Session()
sess.run(tf.global_variables_initializer())

for step in range(100):
    _, cost_val = sess.run([train_op, cost], feed_dict={X: x_data, Y: y_data})
    print(step, cost_val, sess.run(W), sess.run(b))

0 1.488463 [0.88190377] [0.4080097]
1 0.03881898 [0.828923] [0.37364626]
2 0.020503325 [0.83913636] [0.3673478]
3 0.019332647 [0.84233665] [0.3582237]
4 0.018411972 [0.84619963] [0.3496443]
5 0.017537368 [0.8498889] [0.34123558]
6 0.016704306 [0.85349834] [0.33303288]
7 0.015910862 [0.8570201] [0.325027]
8 0.015155096 [0.8604572] [0.31721357]
9 0.014435202 [0.86381173] [0.309588]
10 0.01374952 [0.8670856] [0.3021457]
11 0.013096403 [0.87028074] [0.2948823]
12 0.012474318 [0.87339914] [0.28779355]
13 0.011881781 [0.8764425] [0.28087518]
14 0.011317376 [0.8794128] [0.27412313]
15 0.010779787 [0.8823116] [0.2675334]
16 0.01026776 [0.8851408] [0.26110208]
17 0.009780024 [0.8879019] [0.25482535]
18 0.009315462 [0.8905966] [0.24869952]
19 0.008872982 [0.8932267] [0.24272098]
20 0.008451498 [0.8957934] [0.2368861]
21 0.008050057 [0.8982985] [0.23119153]
22 0.0076676607 [0.90074325] [0.22563381]
23 0.007303449 [0.90312934] [0.22020975]
24 0.006956522 [0.90545803] [0.21491605]
25 0.006626088 [0

학습에 사용되지 않았던 값인 5와 2.5를 X값으로 넣고 결과를 확인해보자

In [41]:
sess.run(hypothesis, feed_dict={X: 5})

array([4.9584384], dtype=float32)

In [42]:
sess.run(hypothesis, feed_dict={X: 2.5})

array([2.4965436], dtype=float32)

In [43]:
sess.close()