 ## 3.3 선형 회귀 모델 구현하기
 * 선형 회귀 : 주어진 x와 y값을 가지고 서로 간의 관계를 파악하는 것
 -> 이 관꼐를 알고나면 새로운 x값이 주어졌을 때, y값을 쉽게 알 수 있다.
*     어떤 입력에 대한 출력을 예측하는 것이 머신러닝의 기본! 

In [3]:
import tensorflow as tf

  from ._conv import register_converters as _register_converters


In [4]:
x_data = [1,2,3]
y_data = [1,2,3]

x_data와 y_data의 상관관계를 파악

In [5]:
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
b = tf.Variable(tf.random_uniform([1], -1.0, 1.0))

x와 y사이의 상관관계를 설명하기 위한 변수들은 W와 b를 각각 -1.0부터 1.0 사이의 균등분포(uniform distribution)을 가진 무작위 값으로 초기화

In [6]:
X = tf.placeholder(tf.float32, name = "X")
Y = tf.placeholder(tf.float32, name = "Y")

In [7]:
print(X)
print(Y)

Tensor("X:0", dtype=float32)
Tensor("Y:0", dtype=float32)


## 플레이스홀더에 이름 부여하기
플레이스홀더의 name 매개변수로는 플레이스 홀더의 이름을 설정한다. 위의 플레이스홀더를 출력하면 위와 같이 나온다. 

In [9]:
X_noname = tf.placeholder(tf.float32)
Y_noname = tf.placeholder(tf.float32)

In [10]:
print(X_noname)
print(Y_noname)

Tensor("Placeholder:0", dtype=float32)
Tensor("Placeholder_1:0", dtype=float32)


name 없이 설정한 플레이스홀더를 출력하면 위와 같이 이름이 자동으로 부여되는 것을 확인할 수 있다. 


* 이는 각각의 텐서에 이름을 주면 어떠한 텐서가 어떻게 사용되고 있는지 쉽게 파악할 수 있다. 
* 또한 5장에서 배우게 될 일종의 디버깅 도구인 TensorBoard 에서 역시 이름을 출력해 주어 디버깅이 더 쉬울 수 있다. 
- 변수와 연산 혹은 연산함수에도 이름 지정이 가능하다.

In [11]:
hypothesis = W * X + b

* X와 Y의 상관관계를 분석하기 위한 수식을 작성한다.
> 이는 W와의 곱과 b와의 합을 통해 X와 Y의 관계를 설명하겠다는 것을 의미한다.
> X가 주어졌을 때 Y를 만들어 낼 수 있는 W와 b를 찾아낸다는 뜻이다. 

* W 는 weight(가중치), b는 bias(편향)이며, 이는 선형회귀와 신경망 학습에 가장 기본이 되는 수식이다. 

* 이 경우 W와 X는 행렬이 아니므로, tf.matmul이 아닌 * 을 사용하여 연산한다.

In [12]:
cost = tf.reduce_mean(tf.square(hypothesis - Y))

* loss function(손실 함수)는 한 쌍의 데이터(x, y)의 데이터에 대한 손실값을 계산하는 함수이다. 
> 손실값이란 실제값과 모델로 예측한 값이 얼마나 차이나는 지를 나타낸다.
> 손실값이 작을수록, 그 모델이 X와 Y의 관계를 잘 설명하고 있음을 의미한다.
> 또한, 주어진 X 값에 대한 Y값을 정확하게 예측 가능하다.

* 이 손실을 전체 데이터에 대해 구한 경우 이를 cost(비용)이라 한다.

* 학습이란 변수들의 값을 다양하게 넣어 계산하며 이 손실값을 최소화 하는 W와 b의 값을 구하는 것을 의미한다.

* 주로 '예측값과 실제값의 거리'를 가장 많이 사용한다.
> 손실값 = (예측값 - 실제값)^2 

    > 비용 = 모든 데이터에 대한 손실값의 평균

In [14]:
optimizer = tf.train.GradientDescentOptimizer(learning_rate = 0.1)
train_op = optimizer.minimize(cost)

텐서플로가 기본 제공하는 gradient descent(경사하강법) 최적화 함수를 이용해 최소화하는 연산 그래프를 작성한다.

* 최적화 함수 : W와 b를 변경해가면서 손실값을 최소화하는 가장 최적화된 W와 b 값을 찾아주는 함수

> 값을 무작위로 변경하면 시간이 너무 오래걸리며, 학습시간도 예측이 어렵다

> 따라서 빠르게 최적화 하기 위해, 다양한 방법을 사용하게 된다.

* 경사하강법 : 최적화 방법 중 가장 기본적인 알고리즘

> 함수의 기울기를 구하고, 기울기가 낮은 쪽으로 계속 이동시키며 최적의 값을 찾아 나가는 방법

* learning rate(학습률) : 학습을 얼마나 '급하게' 할 것인가를 설정하는 값
> 최적화 함수의 매개변수

> 값이 너무 크게 되면 최적의 손실값을 찾지 못하고 지나치게 됨

> 값이 너무 작으면 학습 속도가 매우 느려짐

**=> 학습을 진행하는 과정에 영향을 주는 변수 : hyperparameter(하이퍼파라미터)**

이 값에 따라 학습속도나 신경망 성능이 크게 달라질 수 있다.

이를 잘 튜닝하는 것도 과제!

In [27]:
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    for step in range(100):
        _, cost_val = sess.run([train_op, cost], feed_dict = {X : x_data,Y : y_data})
        print(step, cost_val, sess.run(W), sess.run(b))
        
    print('\n==== Test ====\n')
    print("X : 5, Y : ", sess.run(hypothesis, feed_dict={X:5}))
    print("X : 2.5, Y : ", sess.run(hypothesis, feed_dict = {X:2.5}))

0 3.6770508 [1.2306402] [-0.30381963]
1 0.060257126 [1.1369039] [-0.33531177]
2 0.016277857 [1.1432517] [-0.32301098]
3 0.015013504 [1.1387545] [-0.31570944]
4 0.014294499 [1.135534] [-0.30806935]
5 0.013615403 [1.1322634] [-0.3006691]
6 0.012968662 [1.1290852] [-0.29344064]
7 0.012352659 [1.1259819] [-0.2863866]
8 0.011765905 [1.1229534] [-0.27950206]
9 0.011206992 [1.1199977] [-0.272783]
10 0.010674663 [1.1171131] [-0.2662255]
11 0.010167598 [1.1142977] [-0.25982565]
12 0.009684631 [1.1115501] [-0.2535796]
13 0.009224611 [1.1088685] [-0.2474837]
14 0.008786428 [1.1062514] [-0.24153434]
15 0.008369083 [1.1036971] [-0.23572803]
16 0.00797153 [1.1012044] [-0.23006125]
17 0.0075928755 [1.0987715] [-0.22453076]
18 0.0072322073 [1.096397] [-0.21913318]
19 0.0068886825 [1.0940797] [-0.21386537]
20 0.006561464 [1.0918181] [-0.20872419]
21 0.00624978 [1.0896109] [-0.20370658]
22 0.005952912 [1.0874567] [-0.19880962]
23 0.0056701456 [1.0853543] [-0.19403037]
24 0.0054008164 [1.0833024] [-0.189

그래프를 실행해 학습시키고 결과 확인

1. 세션을 생성하고 변수 초기화
2. 파이썬의 with 기능을 사용하여 세션 블록을 만들고 세션 종료를 자동으로 처리하도록 만듦
3. 최적화를 수행하는 그래프인 train_op를 실행하고, 실행 시마다 변화하는 손실값을 출력하는 코드
4. 학습은 100번 수행, feed_dict를 통해 상관관계를 알아내고자 하는 데이터인 x_data와 y_data 입력!

**-> 손실값과 변수들의 변화 확인**

손실값이 점점 줄어든다면 학습이 정상적

마지막으로 학습에 사용되지 않은 5와 2.5를 X값으로 넣어 결과 확인

In [29]:
##### 전체 코드
import tensorflow as tf

x_data = [1,2,3]
y_data = [1,2,3]

W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
b = tf.Variable(tf.random_uniform([1], -1.0, 1.0))

X = tf.placeholder(tf.float32, name = 'X')
Y = tf.placeholder(tf.float32, name = 'Y')

hypothesis = W * X + b

cost = tf.reduce_mean(tf.square(hypothesis - Y))
optimizer = tf.train.GradientDescentOptimizer(learning_rate = 0.1)
train_op = optimizer.minimize(cost)

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    for step in range(100):
        _, cost_val = sess.run([train_op, cost], feed_dict = {X:x_data, Y:y_data})
        
        print(step, cost_val, sess.run(W), sess.run(b))
        
    print("\n==== Test=====\n")
    print("X : 5, Y : ", sess.run(hypothesis, feed_dict = {X:5}))
    print("X : 2.5, Y : ", sess.run(hypothesis, feed_dict = {X:2.5}))
    

0 12.223809 [1.0091162] [0.38197625]
1 0.16022225 [0.8478173] [0.30193454]
2 0.01544565 [0.8690807] [0.30242074]
3 0.013073489 [0.8703038] [0.2943043]
4 0.01243291 [0.8736319] [0.28732193]
5 0.011842108 [0.87664676] [0.2804048]
6 0.011279591 [0.87961453] [0.27366513]
7 0.010743801 [0.8825083] [0.2670863]
8 0.010233462 [0.8853327] [0.26066574]
9 0.009747366 [0.88808924] [0.2543995]
10 0.00928435 [0.8907795] [0.24828391]
11 0.008843341 [0.8934051] [0.24231534]
12 0.008423271 [0.89596754] [0.23649023]
13 0.008023158 [0.89846843] [0.23080517]
14 0.0076420694 [0.9009092] [0.22525676]
15 0.007279062 [0.9032913] [0.21984173]
16 0.006933298 [0.90561604] [0.21455686]
17 0.006603951 [0.90788496] [0.20939906]
18 0.0062902756 [0.91009945] [0.20436528]
19 0.0059914794 [0.91226053] [0.19945244]
20 0.0057068695 [0.91436976] [0.19465776]
21 0.0054357895 [0.9164282] [0.1899783]
22 0.0051775766 [0.9184372] [0.18541135]
23 0.0049316497 [0.92039794] [0.1809542]
24 0.004697389 [0.92231154] [0.1766042]
25 0