# Linear Regression

## 목표

* 다음의 선형회귀식을 TensorFlow 기반 학습과정을 통해서 유추해내는 프로그래밍 작성

$y = 0.1 \times x_1 + 0.2 \times x_2 + 0.3$

* 즉, 위 식은 Ground Truth 로서 머신러닝 알고리즘 내부에서는 알지 못함.

In [2]:
import tensorflow as tf
import numpy as np

# Numpy 랜덤으로 100개의 가짜 데이터 채우기.
x = np.float32(np.random.rand(2, 5))

# 학습 레이블(목표값)은 아래의 식으로 산출. (W = [0.1, 0.2], b = 0.3)
y_target = np.dot([0.100, 0.200], x) + 0.300

print(type(x), x.shape)
#print(x)
print(type(y_target), y_target.shape)
#print(y_target)

<class 'numpy.ndarray'> (2, 5)
<class 'numpy.ndarray'> (5,)


In [3]:
# b는 0 으로 초기화
b = tf.Variable(tf.zeros([1]))

# W는 1x2 형태의 가중치 변수, 역시 0으로 초기화
W = tf.Variable(tf.zeros([1, 2]))

# 모델 생성 --> Tenforflow Graph 완성
y = tf.matmul(W, x) + b

print(b.get_shape())
print(W.get_shape())
print(y.get_shape())

(1,)
(1, 2)
(1, 5)


In [4]:
# 손실 함수 정의
loss = tf.reduce_mean(tf.square(y - y_target))

# 경사하강법으로 Backpropagation 적용 (0.0005는 learning rate) --> W와 b 변수 변경
optimizer = tf.train.GradientDescentOptimizer(0.0005)

# optimizer의 학습 목표 정의
train = optimizer.minimize(loss)

In [18]:
# 세션 시작
with tf.Session() as sess:
    # 모든 변수를 초기화.
    init = tf.global_variables_initializer()
    sess.run(init)

    # 100000번 학습.
    for step in range(0, 100001):
        sess.run(train)
        if step % 10000 == 0:
            loss_value = sess.run(loss)
            w_value = sess.run(W)
            b_value = sess.run(b)
            print("step: {0:6d}, loss: {1:15.7e}, w: {2}, b: {3}".format(step, loss_value, w_value, b_value))
    
    print()
    
    sample_format = "sample_x: {0}, sample_y: {1}, sample_y_target: {2}"
    
    # 학습된 모델을 활용한 값과 실제 값 비교
    sample_x = [[x[0][0]], [x[1][0]]] # 0번째 데이터
    sample_y = sess.run(tf.matmul(W, sample_x) + b)
    sample_y_target = y_target[0]
    print(sample_format.format(sample_x, sample_y, sample_y_target))
    
    sample_x = [[x[0][1]], [x[1][1]]] # 1번째 데이터
    sample_y = sess.run(tf.matmul(W, sample_x) + b)
    sample_y_target = y_target[1]
    print(sample_format.format(sample_x, sample_y, sample_y_target))
    
    sample_x = [[x[0][2]], [x[1][2]]] # 2번째 데이터
    sample_y = sess.run(tf.matmul(W, sample_x) + b)
    sample_y_target = y_target[2]
    print(sample_format.format(sample_x, sample_y, sample_y_target))
    
    print()
    
    # 학습된 모델을 활용한 새로운 데이터 값에 대한 y 값 예측
    new_x = [[1.5], [1.5]]
    y_value = sess.run(tf.matmul(W, new_x) + b)
    print("new_x: {0}, y_value: {1}".format(new_x, y_value))

step:      0, loss:   2.0793641e-01, w: [[ 0.00022511  0.00024929]], b: [ 0.00045402]
step:  10000, loss:   6.0591166e-05, w: [[ 0.13716976  0.17500462]], b: [ 0.29511097]
step:  20000, loss:   3.1873431e-05, w: [[ 0.12899412  0.18364918]], b: [ 0.29447356]
step:  30000, loss:   1.7420020e-05, w: [[ 0.12274571  0.18935014]], b: [ 0.29447967]
step:  40000, loss:   9.8851597e-06, w: [[ 0.11793569  0.19310141]], b: [ 0.29482564]
step:  50000, loss:   5.7923676e-06, w: [[ 0.11417728  0.19553389]], b: [ 0.29537913]
step:  60000, loss:   3.4865352e-06, w: [[ 0.1112418   0.19712128]], b: [ 0.29597518]
step:  70000, loss:   2.1409473e-06, w: [[ 0.10893264  0.19815104]], b: [ 0.29656589]
step:  80000, loss:   1.3350303e-06, w: [[ 0.10711205  0.19882044]], b: [ 0.29710293]
step:  90000, loss:   8.4760268e-07, w: [[ 0.10569443  0.19928561]], b: [ 0.29755047]
step: 100000, loss:   5.4946179e-07, w: [[ 0.10459129  0.19958363]], b: [ 0.29793242]

sample_x: [[0.81195801], [0.56258202]], sample_y: [[ 