Tensorflow로 단순한 선형회귀모델을 만들어보자

데이터는 1부터 10까지의 정수형 데이터와 그 데이터들에 2를 곱하고 1을 더한 데이터로 구성한다.

잘 학습된다면 가중치는 2, 편향은 1에 가까워질 것이다.

데이터를 준비한다.

In [8]:
import tensorflow as tf
import numpy as np

x_data = np.arange(1, 11, dtype=np.float32)
y_data = x_data * 2 + 1

가중치와 편향을 초기화한다.

`tf.uniform`은 균등확률분포 값을 생성해주는 함수이다.

이번에는 -1.0과 1.0 사이의 균등확률분포값으로 초기화한다.

In [9]:
W = tf.Variable(tf.random.uniform([1], -1.0, 1.0))
b = tf.Variable(tf.random.uniform([1], -1.0, 1.0))

학습에 사용될 연산을 `tf.function`으로 정의한다.

데이터와 가중치를 곱하고 편향을 더한다.

수식으로는 `W * X + b`가 된다.

In [10]:
@tf.function
def hypothesis(x):
    return tf.add(tf.multiply(W, x), b)

학습에 사용할 optimizer를 정한다.

이번에는 확률적 경사하강법 (Stochastic Gradient Descent)를 사용한다.

In [11]:
optimizer = tf.optimizers.SGD(learning_rate=0.01)

학습 함수를 `tf.function`으로 정의한다.

In [12]:
@tf.function
def train_step():
    with tf.GradientTape() as tape:
        predictions = hypothesis(x_data)
        loss = tf.reduce_mean(tf.square(predictions - y_data))
    gradients = tape.gradient(loss, [W, b])
    optimizer.apply_gradients(zip(gradients, [W, b]))
    return loss

100번의 학습을 진행한다. `tf.GradientTape`를 이용하여 gradient를 계산하고 weight를 업데이트한다.

In [13]:
for step in range(100):
    cost = train_step()
    print(f'{step}. {cost.numpy()} {W.numpy()} {b.numpy()}')

0. 356.55499267578125 [1.347764] [1.0024102]
1. 16.361068725585938 [1.8497206] [1.0741079]
2. 0.7524663209915161 [1.9572839] [1.0891565]
3. 0.03630606085062027 [1.9803681] [1.0920721]
4. 0.0034325658343732357 [1.9853568] [1.0923902]
5. 0.0019094638992100954 [1.9864691] [1.0921531]
6. 0.0018249232089146972 [1.9867511] [1.0917984]
7. 0.0018064674222841859 [1.9868549] [1.0914198]
8. 0.0017911831382662058 [1.9869205] [1.0910374]
9. 0.0017761692870408297 [1.9869776] [1.0906554]
10. 0.0017612905940040946 [1.9870328] [1.0902748]
11. 0.0017465248238295317 [1.9870874] [1.0898957]
12. 0.0017318788450211287 [1.9871415] [1.0895182]
13. 0.001717371167615056 [1.9871956] [1.0891423]
14. 0.0017029836308211088 [1.9872494] [1.088768]
15. 0.001688705524429679 [1.9873029] [1.0883952]
16. 0.0016745462780818343 [1.9873562] [1.088024]
17. 0.0016605176497250795 [1.9874092] [1.0876544]
18. 0.0016466060187667608 [1.9874622] [1.0872862]
19. 0.0016327971825376153 [1.9875147] [1.0869197]
20. 0.001619120710529387 [

학습에 사용된 데이터가 아닌 랜덤한 데이터로 예측해본다.

In [14]:
x_test = np.random.randint(1, 101, 5).astype(np.float32)
y_test = x_test * 2 + 1

print('Target:    ', y_test)
print('Prediction:', hypothesis(x_test).numpy())

Target:     [197. 161. 129. 119.  45.]
Prediction: [196.1883   160.34879  128.49144  118.53602   44.865917]
