# 텐서와 그래프 실행

In [2]:
# 텐서플로 import
import tensorflow as tf

In [3]:
# 상수를 hello 변수에 저장
hello = tf.constant('Hello, TensorFlow!')
print(hello)

Tensor("Const:0", shape=(), dtype=string)


hello가 텐서플로의 **텐서** 라는 자료형을 담고 있다
**텐서는** 텐서플로에서 다양한 수학식을 계산하기 위한 가장 기본적이고 중요한 자료형이다.
다음과 같이 **랭크(Rank)** 와 **셰이프(Shape)** 라는 개념을 가지고 있다.

</bn>

```python
3                              # 랭크가 0인 텐서, 셰이프는 []
[1., 2., 3.]                   # 랭크가 1인 텐서, 셰이프는 [3]
[[1., 2., 3.], [4., 5., 6.]]   # 랭크가 2인 텐서, 셰이프는 [2, 3]
```
> 텐서 자료형의 형태는 배열과 비슷하다고 생각하면 된다.

</bn>

**dtype** 은 해당 텐서에 담긴 요소들의 자료형이다. ex) string, float, int


In [4]:
# 텐서를 이용한 덧셈
a = tf.constant(10)
b = tf.constant(32)
c = tf.add(a, b)
print(c)

Tensor("Add:0", shape=(), dtype=int32)


42가 나올 것으로 생각할 수 있지만, 위와 같이 텐서의 형태로 출력된다.
왜냐하면 텐서플로 프로그램의 구조는 **그래프의 생성과 그래프 실행** 으로 구성되어 있다.

<br>

* **그래프** : 텐서들의 연산 모음. 연산이 필요할 때만 실행하는 코드를 넣어 <u>원하는 시점</u> 에 실제 연산을 수행하도록 한다.
* **그래프 실행** : Session 객체와 run 메소드를 이용하면 된다.

In [5]:
sess = tf.Session()

print(sess.run(hello))
print(sess.run([a, b, c]))

sess.close

b'Hello, TensorFlow!'
[10, 32, 42]


<bound method BaseSession.close of <tensorflow.python.client.session.Session object at 0x138f73b00>>

In [6]:
print(type(sess.run(hello)))
print(type(sess.run([a, b, c])))

<class 'bytes'>
<class 'list'>


# 플레이스홀더와 변수
**플레이스홀더** : 그래프에 사용할 입력값을 나중에 받기 위해 사용하는 매개변수

**변수** : 그래프를 최적화하는 용도로 텐서플로가 학습한 결과를 갱신하기 위해 사용하는 변수

In [7]:
# 플레이스홀더 사용
X = tf.placeholder(tf.float32, [None, 3])
print(X)

Tensor("Placeholder:0", shape=(?, 3), dtype=float32)


In [8]:
# X에 넣을 자료 정의
x_data = [[1, 2, 3], [4, 5, 6]]

In [11]:
# 변수 정의(W와 b의 값은 바뀔 수 있다)
# tf.random_normal : 정규분포의 무작위 값으로 초기화
W = tf.Variable(tf.random_normal([3, 2]))
b = tf.Variable(tf.random_normal([2, 1]))

In [12]:
print(W)
print(b)

<tf.Variable 'Variable_2:0' shape=(3, 2) dtype=float32_ref>
<tf.Variable 'Variable_3:0' shape=(2, 1) dtype=float32_ref>


In [13]:
# 행렬 곱셈 실행
expr = tf.matmul(X, W) + b

텐서플로로 딥러닝을 하기 위해서는 **행렬곱** 정의를 알아야 한다.
* 행렬곱 A x B 에 대하여, 행렬 A의 열 수와 행렬 B의 행 수는 같아야 한다.
* 행렬곱 A x B 를 계산한 행렬 AB의 크기는 A의 행 개수와 B의 열 개수가 된다.

<br>

<img src="https://t1.daumcdn.net/cfile/tistory/2433A83D566050DA1A">

In [18]:
sess = tf.Session()
sess.run(tf.global_variables_initializer()) # 정의한 변수들을 초기화

print("=== x_data ===")
print(x_data)
print("=== W ===")
print(sess.run(W))
print("=== b ===")
print(sess.run(b))
print("=== expr ===")
# feed_dict : 그래프를 실행할 때 사용할 입력값을 지정
print(sess.run(expr, feed_dict={X: x_data}))

sess.close

=== x_data ===
[[1, 2, 3], [4, 5, 6]]
=== W ===
[[ 1.1246768  -2.6514158 ]
 [ 0.18266274  0.24924745]
 [ 0.23630461 -0.70764595]]
=== b ===
[[-0.37909147]
 [ 0.06363609]]
=== expr ===
[[  1.8198245  -4.65495  ]
 [  6.893485  -13.541667 ]]


<bound method BaseSession.close of <tensorflow.python.client.session.Session object at 0x139034f98>>

# 선형 회귀 모델 구현하기
**선형 회귀** : 주어진 x 와 y 값을 가지고 서로 간의 관계를 파악하는 것입니다. x 값이 주어졌을 때 y 값을 쉽게 알 수 있다.

<br>
    
x_data 와 y_data의 상관관계를 파악해보자.

In [19]:
x_data = [1, 2, 3]
y_data = [1, 2, 3]

In [20]:
# -1.0 ~ 1.0 사이의 균등분포를 가진 무작위 값으로 초기화
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
b = tf.Variable(tf.random_uniform([1], -1.0, 1.0))

In [21]:
print(W)
print(b)

<tf.Variable 'Variable_4:0' shape=(1,) dtype=float32_ref>
<tf.Variable 'Variable_5:0' shape=(1,) dtype=float32_ref>


In [22]:
# 자료를 입력받을 플레이스홀더를 설정
# name 매개변수로 플레이스홀더의 이름을 설정한다.
X = tf.placeholder(tf.float32, name="X")
Y = tf.placeholder(tf.float32, name="Y")

print(X)
print(Y)

Tensor("X:0", dtype=float32)
Tensor("Y:0", dtype=float32)


In [23]:
# X와 Y의 상관관계(선형관계)를 분석하기 위한 수식 작성
hypothesis = W * X + b

이 수식은 W와의 곱과 b와의 합을 통해 **X와 Y의 관계를** 설명하겠다는 뜻이다.
즉, X가 주어졌을 때 Y를 만들어 낼 수 있는 W와 b를 찾아내겠다는 의미이다.
* **W** : 가중치
* **b** : 편향
> 이 수식은 선형 회귀는 물론 신경망 학습에 가장 기본이 되는 수식이다.

<br>

손실 함수를 작성해보자.
* **손실 함수(loss function)** : 한 쌍(x,y)의 데이터에 대한 **손실값**을 계산하는 함수이다.
* 손실값 : 실제값과 모델로 예측한 값이 얼마나 차이가 나는지를 나타내는 값
> 손실값이 작을수록 X와 Y의 관계가 잘 설명되고 있는 것이며, X 값에 대한 Y 값을 정확하게 예측할 수 있다는 뜻이다.
* **비용(cost)** : 손실을 전체 데이터에 대해 구한 경우
> 즉 **학습**이란 변수들의 값을 다양하게 넣어 계산해보면서 이 손실값을 최소화하는 것이다.

In [24]:
# 손실값 = (예측값 - 실제값)^2
# 모든 데이터에 대한 손실값의 평균을 낸다.
cost = tf.reduce_mean(tf.square(hypothesis - Y))

텐서플로 함수을 볼 수 있는 사이트
[https://www.tensorflow.org/api_docs/](https://www.tensorflow.org/api_docs/)

<br>

## 경사하강법 (gradient descent)
최적화 함수를 이용해 손실값을 최소화하는 연산 그래프 생성
* **최적화 함수** : 가중치와 편향 값을 변경해가면서 손실값을 최소화하는 가장 최적화된 가중치와 편향 값을 찾아주는 함수.
* **경사하강법** : 빠르게 최적화하기 위한, 즉 빠르게 학습하기 위한 다양한 방법 중에 가장 기본적인 알고리즘이다.
* **learning_rate(학습률)** : 학습을 얼마나 '급하게' 할 것인가를 설정하는 값
  * 값이 너무 작으면 학습 속도가 매우 느려지고, 너무 크면 최적의 손실값을 찾지 못한다.
* **하이퍼파라미터(hyperparameter)** : 학습을 진행하는 과정에 영향을 주는 변수. 이 값에 따라 학습 속도나 신경망 성능이 크게 달라진다.

In [25]:
# 최적화 함수를 이용해 손실값을 최소화하는 연산 그래프 생성 
optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.1)
train_op = optimizer.minimize(cost)

In [26]:
# 세션을 생성하고 변수들 초기화
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    # 최적화 수행 그래프 실행, 실행 시마다 변화하는 손실값 출력
    for step in range(1000):
        # feed_dict 를 통해 x_data 와 y_data 의 상관관계를 알아낸다
        _, cost_val = sess.run([train_op, cost], feed_dict={X: x_data, Y: y_data})
        
        print(step, cost_val, sess.run(W), sess.run(b))
        
    # X 값을 넣고 결과 확인
    print("\nX: 5, Y: ", sess.run(hypothesis, feed_dict={X: 5}))
    print("X: 2.5, Y: ", sess.run(hypothesis, feed_dict={X: 2.5}))
        
# 결과를 보면 손실값이 점점 줄어드는것을 확인할 수 있다.
# 그리고, X가 5일 때는 Y 값으로 5를 2.5일 때는 2.5를 정확히 예측해내는것을 확인할 수 있다

0 0.03543609 [0.78691053] [0.48498124]
1 0.033729132 [0.7918015] [0.47322077]
2 0.03212667 [0.7968318] [0.461856]
3 0.030600647 [0.8017131] [0.4507521]
4 0.029147087 [0.80648005] [0.43991643]
5 0.027762577 [0.8111321] [0.4293411]
6 0.026443817 [0.81567234] [0.41902006]
7 0.025187738 [0.8201035] [0.4089471]
8 0.023991317 [0.8244281] [0.39911628]
9 0.022851685 [0.8286487] [0.38952178]
10 0.021766193 [0.83276784] [0.38015795]
11 0.020732315 [0.83678806] [0.3710192]
12 0.01974752 [0.8407116] [0.36210015]
13 0.018809477 [0.8445407] [0.3533955]
14 0.017916003 [0.84827787] [0.3449001]
15 0.017064977 [0.85192513] [0.33660895]
16 0.016254388 [0.8554848] [0.3285171]
17 0.015482289 [0.8589588] [0.32061976]
18 0.014746866 [0.86234933] [0.3129123]
19 0.014046389 [0.86565834] [0.3053901]
20 0.013379164 [0.86888784] [0.29804873]
21 0.012743662 [0.87203974] [0.29088387]
22 0.0121383285 [0.8751158] [0.2838912]
23 0.011561754 [0.8781179] [0.27706662]
24 0.0110125495 [0.8810479] [0.27040613]
25 0.0104894

219 8.327325e-07 [0.9989656] [0.00235142]
220 7.9320404e-07 [0.9989905] [0.00229489]
221 7.555554e-07 [0.9990148] [0.00223973]
222 7.19705e-07 [0.99903846] [0.00218587]
223 6.8540635e-07 [0.9990616] [0.00213332]
224 6.528944e-07 [0.9990841] [0.00208201]
225 6.2175445e-07 [0.9991061] [0.00203194]
226 5.92318e-07 [0.9991276] [0.00198311]
227 5.642005e-07 [0.99914855] [0.00193542]
228 5.373693e-07 [0.99916905] [0.00188892]
229 5.1185225e-07 [0.999189] [0.00184352]
230 4.875533e-07 [0.9992085] [0.00179921]
231 4.6438268e-07 [0.9992276] [0.00175597]
232 4.4235665e-07 [0.9992461] [0.00171373]
233 4.2132297e-07 [0.99926424] [0.00167253]
234 4.0129066e-07 [0.99928194] [0.00163233]
235 3.8222348e-07 [0.9992992] [0.00159309]
236 3.640558e-07 [0.9993161] [0.0015548]
237 3.4686403e-07 [0.99933255] [0.00151741]
238 3.302907e-07 [0.9993486] [0.00148092]
239 3.1464057e-07 [0.99936426] [0.00144531]
240 2.9969186e-07 [0.9993795] [0.00141056]
241 2.855014e-07 [0.9993945] [0.00137666]
242 2.7188284e-07 [

441 1.6716703e-11 [0.9999953] [1.05743065e-05]
442 1.6110372e-11 [0.99999547] [1.0343835e-05]
443 1.5560886e-11 [0.9999956] [1.0097469e-05]
444 1.5101401e-11 [0.9999957] [9.859051e-06]
445 1.41398004e-11 [0.99999577] [9.612685e-06]
446 1.3268202e-11 [0.9999959] [9.382214e-06]
447 1.2846613e-11 [0.999996] [9.159689e-06]
448 1.1960803e-11 [0.99999607] [8.929218e-06]
449 1.1861327e-11 [0.99999624] [8.738483e-06]
450 1.0724459e-11 [0.99999624] [8.48417e-06]
451 1.0174972e-11 [0.9999963] [8.277541e-06]
452 9.4360075e-12 [0.9999964] [8.086807e-06]
453 9.4360075e-12 [0.99999654] [7.896072e-06]
454 9.080736e-12 [0.99999666] [7.7132845e-06]
455 8.682832e-12 [0.9999967] [7.514602e-06]
456 7.977026e-12 [0.9999967] [7.3079727e-06]
457 7.541227e-12 [0.99999684] [7.149027e-06]
458 7.2238513e-12 [0.99999696] [6.9980288e-06]
459 6.9964776e-12 [0.999997] [6.8152412e-06]
460 6.6885755e-12 [0.9999971] [6.640401e-06]
461 6.257513e-12 [0.99999714] [6.4894025e-06]
462 5.968559e-12 [0.99999726] [6.3463513e-0

662 0.0 [1.] [5.210203e-08]
663 0.0 [1.] [5.210203e-08]
664 0.0 [1.] [5.210203e-08]
665 0.0 [1.] [5.210203e-08]
666 0.0 [1.] [5.210203e-08]
667 0.0 [1.] [5.210203e-08]
668 0.0 [1.] [5.210203e-08]
669 0.0 [1.] [5.210203e-08]
670 0.0 [1.] [5.210203e-08]
671 0.0 [1.] [5.210203e-08]
672 0.0 [1.] [5.210203e-08]
673 0.0 [1.] [5.210203e-08]
674 0.0 [1.] [5.210203e-08]
675 0.0 [1.] [5.210203e-08]
676 0.0 [1.] [5.210203e-08]
677 0.0 [1.] [5.210203e-08]
678 0.0 [1.] [5.210203e-08]
679 0.0 [1.] [5.210203e-08]
680 0.0 [1.] [5.210203e-08]
681 0.0 [1.] [5.210203e-08]
682 0.0 [1.] [5.210203e-08]
683 0.0 [1.] [5.210203e-08]
684 0.0 [1.] [5.210203e-08]
685 0.0 [1.] [5.210203e-08]
686 0.0 [1.] [5.210203e-08]
687 0.0 [1.] [5.210203e-08]
688 0.0 [1.] [5.210203e-08]
689 0.0 [1.] [5.210203e-08]
690 0.0 [1.] [5.210203e-08]
691 0.0 [1.] [5.210203e-08]
692 0.0 [1.] [5.210203e-08]
693 0.0 [1.] [5.210203e-08]
694 0.0 [1.] [5.210203e-08]
695 0.0 [1.] [5.210203e-08]
696 0.0 [1.] [5.210203e-08]
697 0.0 [1.] [5.2102