# 선형회귀 이해하기
- 성적데이터를 기반으로 선형회귀를 이해해보자

In [1]:
# 성적데이터 생성을 위한 데이터 분석 라이브러리 3대장 불러오기
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [2]:
# 성적데이터 생성
data = pd.DataFrame([[2, 20], [4, 40], [8, 80], [9, 90]],
                    index = ['승호', '영표', '자영', '민수'],
                    columns = ['시간', '성적'])

## LinearRegression(선형회귀) -> 수학 공식을 활용한 해석적 모델
- 공식을 이용해서 적은 계산으로 한 번에 최적의 선형함수를 찾는 방법
- 공식이 완벽하지 않을 경우 잘 못 찾을 수도 있고, 공식이 잘못되었더라도 고칠 수 없다는 문제가 있음 --> 규제를 접속해서 해결

In [3]:
# Python에서 머신러닝 모델 종류를 많이 포함하고 있는 라이브러리 -> sklearn
from sklearn.linear_model import LinearRegression

In [4]:
linear_model = LinearRegression() # 모델 객체 생성 -> Hyper Parameter 튜닝(조정)
linear_model.fit(data[['시간']], data['성적']) # 문제데이터 : 2차원, 답데이터 : 1차원


In [5]:
display('기울기, 가중치 : ', linear_model.coef_)
display('절편 : ', linear_model.intercept_)

'기울기, 가중치 : '

array([10.])

'절편 : '

7.105427357601002e-15

In [6]:
# 예측
linear_model.predict([[7]])



array([70.])

## H(x) -> 가설함수

In [7]:
def h(w, x):
    return (w * x) + 0

## Loss Function 정의

In [8]:
# Loss Function 정의
def cost(data, target, weight):
    y_pred = h(weight, data)

    # 평균 제곱 오차
    error = ((y_pred - target) ** 2).mean()
    return error

In [9]:
linear_model.score(data[['시간']], data['성적']) # 100점

# 회귀모델에서의 score -> 유사도(MSE에 기반해서 R^2 score)

1.0

### SDGRegressor(경사하강법)

In [11]:
from sklearn.linear_model import SGDRegressor

# 모델 생성 및 하이퍼파라미터 Tuning
sdg_model = SGDRegressor(max_iter = 5000, # 가중치 업데이트 반복 횟수
                         eta0 = 0.001,    # 학습률(Learning Rate)
                         verbose = 1)     # 학습과정을 눈으로 확인

# 학습
sdg_model.fit(data[['시간']], data['성적'])

-- Epoch 1
Norm: 1.20, NNZs: 1, Bias: 0.175382, T: 4, Avg. loss: 1895.532670
Total training time: 0.00 seconds.
-- Epoch 2
Norm: 2.06, NNZs: 1, Bias: 0.296417, T: 8, Avg. loss: 1490.061601
Total training time: 0.00 seconds.
-- Epoch 3
Norm: 2.75, NNZs: 1, Bias: 0.394038, T: 12, Avg. loss: 1217.312314
Total training time: 0.00 seconds.
-- Epoch 4
Norm: 3.33, NNZs: 1, Bias: 0.476212, T: 16, Avg. loss: 1014.163223
Total training time: 0.00 seconds.
-- Epoch 5
Norm: 3.84, NNZs: 1, Bias: 0.547347, T: 20, Avg. loss: 855.544259
Total training time: 0.00 seconds.
-- Epoch 6
Norm: 4.29, NNZs: 1, Bias: 0.609813, T: 24, Avg. loss: 728.488493
Total training time: 0.00 seconds.
-- Epoch 7
Norm: 4.69, NNZs: 1, Bias: 0.665369, T: 28, Avg. loss: 624.712183
Total training time: 0.00 seconds.
-- Epoch 8
Norm: 5.04, NNZs: 1, Bias: 0.715148, T: 32, Avg. loss: 538.881581
Total training time: 0.00 seconds.
-- Epoch 9
Norm: 5.36, NNZs: 1, Bias: 0.760086, T: 36, Avg. loss: 467.085168
Total training time: 0.00