In [None]:
# 선형회귀 분석
# Y = WX + b
# 데이터 전처리중 해야할 것: x에 대한 y의 값이 극단적이어서 보편적이라고 볼 수 없는경우 해당 데이터를 배제하는것이 합리적

In [4]:
# 텐서플로우 라이브러리
import tensorflow as tf
# 넘파이 -> 수학 관련 기능: 배열 연산 쉽게
import numpy as np
# 랜덤 함수 관련 변수
rng = np.random

In [5]:
#학습률 -> 낮으면 느리고 높으면 정확도가 떨어짐, 각 프로젝트마다 적절한 값을 위한 연구필요, 보통 기본값은 0.01
learning_rate = 0.01
#학습 횟수
training_steps =1000
#출력 단위
display_step =50

In [6]:
# 배열, X가 문제
X = np.array([3.3, 4.4, 5.5, 6.71, 6.93, 4.168, 9.779, 6.182, 7.59, 2.167, 7.042,10.791,5.313, 7.997, 5.654,9.27,3.1])
# 배열, Y가 답
Y = np.array([1.7, 2.76, 2.09, 3.19,1.694, 1.573, 3.366, 2.596, 2.53, 1.221,2.827, 3.464, 1.65, 2.905, 2.42, 2.94, 1.3])

In [7]:
# 가중치 
W = tf.Variable(rng.rand(), name = "weight")
# 편향성(외부요인, 편차)
b = tf.Variable(rng.rand(), name = "bias")

# 선형 회귀 분석 -> 일차 방정식 (Y = WX + B) -> Y를 예측
def linear_regression(x):
    return W * x + b

# Y_Predict -> 예측 Y_True -> 답,
# reduce_mean 평균 -> reduce -> 차원 제거 -> 넘파이 배열 여러개 -> 함수 여러번 호출 -> 결과 여러개 -> 1차원
# square 제곱
# Y = Wx + b
def mean_square(y_pred, y_true):
    return tf.reduce_mean(tf.square(y_pred - y_true)) 

# 최적화 알고리즘
# Stochastic Gradient Descent -> SGD: 확률적 경사 하강법, 기울기가 0에 가까운 근사값을 찾는 알고리즘
optimizer = tf.optimizers.SGD(learning_rate)

In [3]:
# 최적화 함수
def run_optimization():
    # GradientTape: 미분 -> 기울기를 얻기 위해
    with tf.GradientTape() as g:
        # prad -> 넘파이배열
        # y 예측 배열 - > 넘파이 배열의 함수연산 결과값도 배열로
        pred = linear_regression(X)
        # loss: 편차, 제곱의 평균 -> 예측 결과와 답과의 오차
        loss = mean_square(pred, Y)
        #gradients 기울기 관련 데이터
        gradients = g.gradient(loss,[W,b])
        # 기울기 관련 데이터를 이용해서 loss가 0에 수렴하도록 W, b를 설정
        optimizer.apply_gradients(zip(gradients, [W,b]))

In [9]:
for step in range(1, training_steps +1):
    run_optimization()
    
    #step -> 현제 반복횟수
    if step % display_step == 0:
        pred = linear_regression(X)
        loss = mean_square(pred, Y)
        print("step: %i, loss: %f. W: %f, b: %f" % (step, loss, W.numpy(), b.numpy()))

step: 50, loss: 0.195438. W: 0.333334, b: 0.219563
step: 100, loss: 0.186469. W: 0.323982, b: 0.285870
step: 150, loss: 0.179436. W: 0.315699, b: 0.344589
step: 200, loss: 0.173921. W: 0.308364, b: 0.396589
step: 250, loss: 0.169595. W: 0.301869, b: 0.442638
step: 300, loss: 0.166203. W: 0.296117, b: 0.483417
step: 350, loss: 0.163543. W: 0.291023, b: 0.519529
step: 400, loss: 0.161457. W: 0.286512, b: 0.551509
step: 450, loss: 0.159821. W: 0.282518, b: 0.579830
step: 500, loss: 0.158538. W: 0.278980, b: 0.604910
step: 550, loss: 0.157531. W: 0.275848, b: 0.627119
step: 600, loss: 0.156742. W: 0.273073, b: 0.646787
step: 650, loss: 0.156124. W: 0.270617, b: 0.664204
step: 700, loss: 0.155638. W: 0.268441, b: 0.679628
step: 750, loss: 0.155258. W: 0.266514, b: 0.693287
step: 800, loss: 0.154959. W: 0.264808, b: 0.705383
step: 850, loss: 0.154725. W: 0.263297, b: 0.716095
step: 900, loss: 0.154542. W: 0.261959, b: 0.725581
step: 950, loss: 0.154398. W: 0.260774, b: 0.733981
step: 1000, l

In [None]:
import matplotlib.pyplot as plt

plt.plot(X,Y ,'ro', label ="Original data")
plt.plot(X, np.array(W * X + b ), label ='Fitted.line')
plt.legend()
plt.show()