## Linear Regression(선형 회귀)

학습한다는 것은 : 어떤 선을 찾아야/그어야 데이터에 잘 맞을 것인가 찾아가는 것

H(x) = Wx + b

선의 모양은 W,b에 따라 달라짐

어떤 Hypothesis가 좋냐를 판단할 때, 실제 y값과 Hypothesis의 값을 비교함 => Cost Function, Loss Function이라고 함

Cost Function :  (H(x) - y)^2

각 x 별 cost 계산 후 평균을 구함 => cost

minimize cost(W,b) : cost 값을 최소화하는 W와 b를 구하는 것이 목표

### (1) Build graph using TF operations

In [24]:
import tensorflow as tf
from jinja2.optimizer import optimize

# X  and Y data
x_train = [1,2,3]
y_train = [1,2,3]

W = tf.Variable(tf.random.normal([1]), name = 'weights')
b = tf.Variable(tf.random.normal([1]), name = 'bias')

hypothesis = x_train * W + b

Cost 값 구하기

In [25]:
# cost/Loss Function
cost = tf.reduce_mean(tf.square(hypothesis - y_train))

GradientDescent

In [26]:
# Minimize
optimizer = tf.keras.optimizers.SGD(learning_rate = 0.01)
# SGD = Stochastic Gradient Descent = 경사하강법

학습 루프

In [27]:
for step in range(2001):
    with tf.GradientTape() as tape:
        # 가설: y = W * x + b
        hypothesis = W * x_train + b
        # 비용함수 : MSE/Loss function/cost
        cost = tf.reduce_mean(tf.square(hypothesis - y_train))

    #W, b에 대한 Gradient  계산
    grads = tape.gradient(cost,[W,b])
    #Gradient를 이용해 W, b 업데이트
    optimizer.apply_gradients(zip(grads,[W, b]))

    if step % 100 == 0:
        print(step, "cost:", cost.numpy(), "W:", W.numpy(), "b:",b.numpy())

0 cost: 36.449066 W: [-0.5699553] b: [-2.0761838]
100 cost: 0.12004665 W: [1.4014285] b: [-0.91258526]
200 cost: 0.07418154 W: [1.3155721] b: [-0.7173696]
300 cost: 0.04583971 W: [1.2480685] b: [-0.563918]
400 cost: 0.028326152 W: [1.1950045] b: [-0.443291]
500 cost: 0.017503826 W: [1.153291] b: [-0.34846672]
600 cost: 0.010816295 W: [1.1205007] b: [-0.27392656]
700 cost: 0.006683796 W: [1.0947245] b: [-0.21533114]
800 cost: 0.0041301786 W: [1.0744622] b: [-0.16927]
900 cost: 0.0025522003 W: [1.0585339] b: [-0.13306144]
1000 cost: 0.0015771015 W: [1.046013] b: [-0.10459833]
1100 cost: 0.00097454776 W: [1.0361702] b: [-0.08222358]
1200 cost: 0.0006022134 W: [1.0284331] b: [-0.06463526]
1300 cost: 0.00037213112 W: [1.0223511] b: [-0.0508093]
1400 cost: 0.00022995257 W: [1.0175699] b: [-0.03994063]
1500 cost: 0.00014209574 W: [1.0138116] b: [-0.03139694]
1600 cost: 8.780649e-05 W: [1.0108571] b: [-0.0246808]
1700 cost: 5.4258566e-05 W: [1.0085347] b: [-0.01940131]
1800 cost: 3.3528664e-05

## GradientTape

자동 미분을 통해 동적으로 Gradient 값을 확인해 볼 수 있다는 장점이 있음

텐서플로는 자동 미분(주어진 입력 변수에 대한 연산의 그래디언트(gradient)를 계산하는 것) 을 위한 tf.GradientTape API를 제공

tf.GradientTape는 컨텍스트(context) 안에서 실행된 모든 연산을 테이프(tape)에 "기록"

그 다음 텐서플로는 후진 방식 자동 미분(reverse mode differentiation)을 사용해 테이프에 "기록된" 연산의 그래디언트를 계산



In [43]:
import tensorflow as tf

x_str = input("x 값을 공백으로 입력해주세요(예 : 1 2 3): ")
y_str = input("y 값을 공백으로 입력해주세요(예 : 4 5 6): ")

x_list = list(map(int, x_str.split(" ")))
y_list = list(map(int, y_str.split(" ")))

if len(x_list) != len(y_list):
    raise ValueError("x와 y의 개수가 같아야 합니다.")

W = tf.Variable(tf.random.normal([1]), name = 'weights')
b = tf.Variable(tf.random.normal([1]), name = 'bias')

x_data = tf.constant(x_list, dtype = tf.float32)
y_data = tf.constant(y_list, dtype = tf.float32)

optimizer = tf.keras.optimizers.SGD(learning_rate = 0.01)

for step in range(2001):
    with tf.GradientTape() as tape:
        hypothesis = W * x_data + b
        cost = tf.reduce_mean(tf.square(hypothesis - y_data))

    #W,b에 대한 Gradient 계산
    grads = tape.gradient(cost,[W,b])
    #graident를 이용해 W,b 업데이트
    optimizer.apply_gradients(zip(grads,[W,b]))

    if step % 100 ==0:
        print(step, "cost:", cost.numpy(), "W:", W.numpy(), "b:",b.numpy())

# 학습 끝난 후 예측해보기
x_test_str = input("예측하고 싶은 x 값들을 공백으로 입력:" )
x_test_list = list(map(int, x_test_str.split(" ")))
x_test_tensor = tf.constant(x_test_list, dtype = tf.float32)

y_pred = W * x_test_tensor + b
print("입력한 x: ", x_test_list)
print("예측한 y: ", y_pred)



0 cost: 586.78467 W: [0.42445678] b: [-0.9217541]
100 cost: 0.6770739 W: [9.046549] b: [2.1672406]
200 cost: 0.41839007 W: [9.250552] b: [1.7036716]
300 cost: 0.25853923 W: [9.410867] b: [1.3392402]
400 cost: 0.15976106 W: [9.536887] b: [1.0527639]
500 cost: 0.09872282 W: [9.635952] b: [0.82756793]
600 cost: 0.061004426 W: [9.713826] b: [0.6505422]
700 cost: 0.037696842 W: [9.775041] b: [0.51138586]
800 cost: 0.023294555 W: [9.823161] b: [0.40199584]
900 cost: 0.014394385 W: [9.86099] b: [0.31600332]
1000 cost: 0.0088947965 W: [9.890725] b: [0.24840659]
1100 cost: 0.00549645 W: [9.914101] b: [0.19527037]
1200 cost: 0.0033965122 W: [9.932475] b: [0.15350035]
1300 cost: 0.0020988777 W: [9.9469185] b: [0.12066617]
1400 cost: 0.0012969421 W: [9.958273] b: [0.09485454]
1500 cost: 0.0008014426 W: [9.967198] b: [0.07456483]
1600 cost: 0.00049526006 W: [9.974215] b: [0.05861543]
1700 cost: 0.00030605224 W: [9.97973] b: [0.04607829]
1800 cost: 0.0001891451 W: [9.984065] b: [0.03622288]
1900 cos