<a href="https://colab.research.google.com/github/codeplanets/ml_basic/blob/main/linear_regression.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Linear Regression

## Method of least squares (최소 제곱법)

In [None]:
import numpy as np
from matplotlib import pyplot as plt

# 공부 시간 x와 성적 y의 넘파이 배열
x = np.array([2, 4, 6, 8])
y = np.array([81, 93, 91, 97])

# x, y 의 평균값
mx = np.mean(x)
my = np.mean(y)
print("mean x:", mx)
print("mean y:", my)

# 기울기 공식의 분모
divisor = sum([(mx - i)**2 for i in x])

# 기울기 공식의 분자
def top(x, mx, y, my):
  d = 0
  for i in range(len(x)):
    d += (x[i] - mx) * (y[i] - my)
  return d

dividend = top(x, mx, y, my)

print("분모:", divisor)
print("분자:", dividend)

# 기울기와 y절편
a = dividend / divisor
b = my - (mx * a)

# 출력값 최종 확인
print("기울기 a =", a)
print("y 절편 b =", b)

plt.plot(x, y, marker='o', linestyle='dashed')
plt.show()


## Mean Square Error(MSE, 평균 제곱 오차)

In [None]:
import numpy as np

# 가상의 기울기 a와 y 절편 b
fake_a = 3
fake_b = 76

# 공부 시간 x와 성적 y의 넘파이 배열
x = np.array([2, 4, 6, 8])
y = np.array([81, 93, 91, 97])

# y = ax + b에 가상의 a값과 b값을 대입한 결과를 출력하는 함수
def predict(x):
  return fake_a * x + fake_b

# 예측값이 들어갈 빈 리스트
predict_result = []

# 모든 x값을 한번씩 대입
for i in range(len(x)):
  predict_result.append(predict(x[i]))
  print("공부시간=%.f, 실제점수=%.f, 예측점수=%.f" % (x[i], y[i], predict(x[i])))

# 평균 제곱 오차 함수를 각 y값에 대입해 최종값을 구하는 함수
n = len(x)
def mse(y, y_pred):
  return (1/n) * sum((y - y_pred)**2)

# 평균 제곱 오차 값을 출력
print("평균 제곱 오차:", mse(y, predict_result))

### (OLD) Root Mean Square Error(RMSE, 평균 제곱근 오차)

In [None]:
import numpy as np

# 기울기 a와 y 절편 b
ab = [2.3, 79]

data = [[2, 81], [4, 93], [6, 91], [8, 97]]
# data list의 첫번째 값만 x에 list로 저장
x = [i[0] for i in data]
# data list의 두번째 값만 y에 list로 저장
y = [i[1] for i in data]

# y = ax + b에 a와 b값을 대입하여 결과를 출력하는 함수
def predict(x):
  return ab[0]*x + ab[1]

# RMSE 함수 구현
def rmse(p, a):
  return np.sqrt(((p - a) ** 2).mean())

# RMSE 함수를 각 y값에 대입하여 최종 값을 구하는 함수
def rmse_val(predict_result, y):
  return rmse(np.array(predict_result), np.array(y))

# 예측값이 들어갈 빈 리스트 선언
predict_result = []

# 모든 x 값을 한번씩 대입하여
for i in range(len(x)):
  # 그 결과 predict_result 리스트에 입력
  predict_result.append(predict(x[i]))
  print("공부한 시간=%.f, 실제 점수=%.f, 예측 점수=%.f" % (x[i], y[i], predict(x[i])))

# 최종 RMSE 출력
print("rmse 최종값:", rmse_val(predict_result, y))


# Gradient Decent(경사 하강법)

##선형 회귀 모델

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# 공부 시간 x와 성적 y의 넘파이 배열
x = np.array([2, 4, 6, 8])
y = np.array([81, 93, 91, 97])

plt.scatter(x, y)
plt.show()

a = 0
b = 0
lr = 0.03
epochs = 2001

n = len(x)

# 경사하강법
for i in range(epochs):
  y_pred = a * x + b  # 예측값
  error = y - y_pred  # 실제 값과 비교한 오차

  a_diff = (2/n) * sum(-x * error)  # 오차 함수를 a로 편미분
  b_diff = (2/n) * sum(-error)      # 오차 함수를 b를 편미분

  a = a - lr * a_diff   # 학습률을 곱해 기존의 a 값을 업데이트
  b = b - lr * b_diff   # 학습률을 곱해 기존의 b 값을 업데이트

  if i % 100 == 0:     # 100번 반복될 때마다 현재의 a 값, b 값을 출력
    print("epochs=%.f, 기울기=%.04f, 절편=%.04f" % (i, a, b))

# 최종 a 값을 기울기, b 값을 y 절편에 대입해 그래프 생성
y_pred = a * x + b
plt.scatter(x, y)
plt.plot(x, y_pred, 'r')
plt.show()

## 다중 선형 회귀

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# 공부 시간 x1과 과외 시간 x2, 성적 y의 넘파이 배열
x1 = np.array([2, 4, 6, 8])
x2 = np.array([0, 4, 2, 3])
y = np.array([81, 93, 91, 97])

# 데이터의 분포 그래프
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
ax.scatter3D(x1, x2, y)
plt.show()

a1 = 0
a2 = 0
b = 0
lr = 0.01
epochs = 2001

n = len(x1)

# 경사 하강법
for i in range(epochs):
  y_pred = a1 * x1 + a2 * x2 + b    # 예측값을 구하는 식
  error = y - y_pred                # 실제 값과 비교한 오차

  a1_diff = (2/n) * sum(-x1 * error)  # 오차 함수를 a1로 편미분
  a2_diff = (2/n) * sum(-x2 * error)  # 오차 함수를 a2로 편미분
  b_diff = (2/n) * sum(-error)        # 오차 함수를 b로 편미분

  a1 = a1 - lr * a1_diff      # 학습률을 곱해 기존의 a1 값을 업데이트
  a2 = a2 - lr * a2_diff      # 학습률을 곱해 기존의 a2 값을 업데이트
  b = b - lr * b_diff         # 학습률을 곱해 기존의 b 값을 업데이트

  if i % 100 == 0:
    print("epochs=%.f, 기울기1=%.04f, 기울기2=%.04f, 절편=%.04f" % (i, a1, a2, b))

# 실제 점수와 예측된 점수를 출력
print("실제 점수:", y)
print("예측 점수:", y_pred)

## Tensorflow 선형 회귀

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Tensorflow-Keras API에서 필요한 함수 import
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

x = np.array([2, 4, 6, 8])
y = np.array([81, 93, 91, 97])

model = Sequential()

# 출력 값, 입력 변수, 분석 방법에 맞게끔 모델을 설정
model.add(Dense(1, input_dim=1, activation='linear'))

# 오차 수정을 위해 경사 하강법(SGD)을, 오차의 정도를 판단하기 위해 평균 제곱 오차(MSE)를 사용
model.compile(optimizer='sgd', loss='mse')

# 오차를 최소화하는 과정을 2000번 반복
model.fit(x, y, epochs=2000)

plt.scatter(x, y)
plt.plot(x, model.predict(x), 'r')    # 예측 결과 그래프
plt.show()

# 임의의 시간을 집어넣어 점수를 예측하는 모델 테스트
hour = 7
prediction = model.predict([hour])
print("%.f시간을 공부할 경우의 예상 점수는 %.02f점입니다." % (hour, prediction))

## Tensorflow 다중 선형 회귀

In [9]:
import numpy as np
import matplotlib.pyplot as plt

# Tensorflow-Keras API에서 필요한 함수
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

x = np.array([[2, 0], [4, 4], [6, 2], [8, 3]])
y = np.array([81, 93, 91, 97])

model = Sequential()

# 입력 변수가 두 개(학습 시간 과외 시간)이므로 input_dim에 2를 입력
model.add(Dense(1, input_dim=2, activation='linear'))
model.compile(optimizer='sgd', loss='mse')

model.fit(x, y, epochs=2000)

# 임의의 학습 시간과 과외 시간을 집어넣어 점수를 예측하는 모델 테스트
hour = 7
private_class = 4
prediction = model.predict([[hour, private_class]])

print("%.f시간을 공부하고 %.f시간의 과외를 받을 경우, 예상 점수는 %.02f점입니다." % (hour, private_class, prediction))

Epoch 1/2000
Epoch 2/2000
Epoch 3/2000
Epoch 4/2000
Epoch 5/2000
Epoch 6/2000
Epoch 7/2000
Epoch 8/2000
Epoch 9/2000
Epoch 10/2000
Epoch 11/2000
Epoch 12/2000
Epoch 13/2000
Epoch 14/2000
Epoch 15/2000
Epoch 16/2000
Epoch 17/2000
Epoch 18/2000
Epoch 19/2000
Epoch 20/2000
Epoch 21/2000
Epoch 22/2000
Epoch 23/2000
Epoch 24/2000
Epoch 25/2000
Epoch 26/2000
Epoch 27/2000
Epoch 28/2000
Epoch 29/2000
Epoch 30/2000
Epoch 31/2000
Epoch 32/2000
Epoch 33/2000
Epoch 34/2000
Epoch 35/2000
Epoch 36/2000
Epoch 37/2000
Epoch 38/2000
Epoch 39/2000
Epoch 40/2000
Epoch 41/2000
Epoch 42/2000
Epoch 43/2000
Epoch 44/2000
Epoch 45/2000
Epoch 46/2000
Epoch 47/2000
Epoch 48/2000
Epoch 49/2000
Epoch 50/2000
Epoch 51/2000
Epoch 52/2000
Epoch 53/2000
Epoch 54/2000
Epoch 55/2000
Epoch 56/2000
Epoch 57/2000
Epoch 58/2000
Epoch 59/2000
Epoch 60/2000
Epoch 61/2000
Epoch 62/2000
Epoch 63/2000
Epoch 64/2000
Epoch 65/2000
Epoch 66/2000
Epoch 67/2000
Epoch 68/2000
Epoch 69/2000
Epoch 70/2000
Epoch 71/2000
Epoch 72/2000
E