## 목표
- 다음의 선형회귀식을 TensorFlow 기반 학습과정을 통해서 유추해내는 프로그래밍 작성 

$$ y = 0.1 \times x1 + 0.2 \times x2 + 0.3 $$

- 즉, 위 식은 Ground Truth 로서 머신러닝 알고리즘 내부에서는 알지 못함. 

In [14]:
import tensorflow as tf
import numpy as np

# Numpy 랜덤으로 100개의 가짜 데이터 채우기.
x = np.float32(np.random.rand(2, 100))

# 학습 레이블(목표값)은 아래의 식으로 산출. (W = [0.1, 0.2], b = 0.3)
y_target = np.dot([0.100, 0.200], x) + 0.300

print(type(x), x.shape)
#print(x)
print(type(y_target), y_target.shape)
#print(y_target)

(<type 'numpy.ndarray'>, (2, 100))
(<type 'numpy.ndarray'>, (100,))


In [15]:
# b는 0 으로 초기화
b = tf.Variable(tf.zeros([1]))

# W는 1x2 형태의 가중치 변수, 역시 0으로 초기화
W = tf.Variable(tf.zeros([1, 2]))

# 모델 생성 --> Tenforflow Graph 완성
y = tf.matmul(W, x) + b

print(b.get_shape())
print(W.get_shape())
print(y.get_shape())

(1,)
(1, 2)
(1, 100)


In [16]:
# 손실 함수 정의
loss = tf.reduce_mean(tf.square(y - y_target))

# 경사하강법으로 Backpropagation 적용 (0.0005는 learning rate) --> W와 b 변수 변경
optimizer = tf.train.GradientDescentOptimizer(0.0005)

# optimizer의 학습 목표 정의
train = optimizer.minimize(loss)

In [44]:
# 세션 시작
with tf.Session() as sess:
    # 모든 변수를 초기화.
    init = tf.global_variables_initializer()
    sess.run(init)

    # 100000번 학습.
    for step in xrange(0, 100001):
        sess.run(train)
        if step % 10000 == 0:
            loss_value = sess.run(loss)
            w_value = sess.run(W)
            b_value = sess.run(b)
            print("step: {0}, loss: {1}, w: {2}, b: {3}".format(step, loss_value, w_value, b_value))
    
    print
    
    # 학습된 모델을 활용한 값과 실제 값 비교
    sample_x = [[x[0][0]], [x[1][0]]] # 0번째 데이터
    sample_y = sess.run(tf.matmul(W, sample_x) + b)
    sample_y_target = y_target[0]
    print("sample_x: {0}, sample_y: {1}, sample_y_target: {2}".format(sample_x, sample_y, sample_y_target))
    
    sample_x = [[x[0][1]], [x[1][1]]] # 1번째 데이터
    sample_y = sess.run(tf.matmul(W, sample_x) + b)
    sample_y_target = y_target[1]
    print("sample_x: {0}, sample_y: {1}, sample_y_target: {2}".format(sample_x, sample_y, sample_y_target))
    
    sample_x = [[x[0][2]], [x[1][2]]] # 2번째 데이터
    sample_y = sess.run(tf.matmul(W, sample_x) + b)
    sample_y_target = y_target[2]
    print("sample_x: {0}, sample_y: {1}, sample_y_target: {2}".format(sample_x, sample_y, sample_y_target))
    
    print
    
    # 학습된 모델을 활용한 새로운 데이터 값에 대한 y 값 예측
    new_x = [[1.5], [1.5]]
    y_value = sess.run(tf.matmul(W, new_x) + b)
    print("new_x: {0}, y_value: {1}".format(new_x, y_value))

step: 0, loss: 0.204359933734, w: [[ 0.00021392  0.00024636]], b: [ 0.0004477]
step: 10000, loss: 5.43206224393e-05, w: [[ 0.12033177  0.18457642]], b: [ 0.29849723]
step: 20000, loss: 1.02688081824e-05, w: [[ 0.10928672  0.1938528 ]], b: [ 0.29881892]
step: 30000, loss: 1.99211535801e-06, w: [[ 0.10432488  0.19764251]], b: [ 0.29916909]
step: 40000, loss: 4.03324861509e-07, w: [[ 0.10205571  0.1991457 ]], b: [ 0.29946741]
step: 50000, loss: 8.41069081048e-08, w: [[ 0.10097214  0.19969499]], b: [ 0.29969388]
step: 60000, loss: 1.9703401577e-08, w: [[ 0.10048394  0.19991095]], b: [ 0.29980817]
step: 70000, loss: 5.94555116251e-09, w: [[ 0.10026656  0.19999748]], b: [ 0.29986396]
step: 80000, loss: 2.56540344523e-09, w: [[ 0.10017057  0.19999893]], b: [ 0.29990733]
step: 90000, loss: 1.60646640435e-09, w: [[ 0.10013111  0.19999951]], b: [ 0.29992515]
step: 100000, loss: 1.60646640435e-09, w: [[ 0.10013111  0.19999951]], b: [ 0.29992515]

sample_x: [[0.23011421], [0.025370412]], sample_y: