In [0]:
import numpy as np
import matplotlib.pyplot as plt

In [0]:
# 나이 age 와 키 height
X = np.array([15.4, 23.0, 5.0, 12.6, 
              8.7, 7.3, 9.7, 13.6, 
              15.0, 18.5, 15.5, 22.1, 
              10.1, 27.0, 5.7, 21.8])
y = np.array([170.91, 160.68, 129.0, 159.7, 
              155.46, 140.56, 153.65, 159.43, 
              164.7, 169.65, 160.71, 173.29, 
              159.31, 171.52, 138.96, 165.87])


# 시각화
plt.plot(X, y, 'ko')
plt.show()


# 평균제곱오차 MSE 함수
# 변수 w 에 기울기와 절편을 배열로 저장

def get_mse(x, y, w):
    pred = w[0] * x + w[1]   # y = ax + b
    mse = np.mean((pred - y)**2)
    return mse

# 평균제곱오차 기울기
def get_dmse(x, y, w):
    pred = w[0] * x + w[1]   # y = ax + b
    # d_a = 2 * (pred - y) * x   # OLS
    # d_b = 2 * (pred - y)       # OLS
    d_a = 2 * np.mean((pred - y) * x)   # MSE
    d_b = 2 * np.mean((pred - y))       # MSE
    return d_a, d_b


# 경사하강법 함수
def run_gd(X, y):
    w_init = [10.0, 165.0]   # 계수 초기값
    eta = 0.001              # 학습률
    n_max = 100000           # 최대 학습률
    eps = 0.1                # 기울기 절대값 한계
    
    
    # 반복시 사용할 가중치 변수 정의
    w_i = np.zeros([n_max, 2])   # 영행렬 생성
    w_i[0, :] = w_init   # 가중치로 영행렬에 초기화   
    
    
    # 반복법에 의한 경사하강법 실행
    for i in range(1, n_max):
        dmse = get_dmse(X, y, w_i[i - 1])
        w_i[i, 0] = w_i[i - 1, 0] - eta * dmse[0]   # a 의 가중치 값
        w_i[i, 1] = w_i[i - 1, 1] - eta * dmse[1]   # b 의 가중치 값
        
        if (max(np.abs(dmse)) < eps): break
        # 가중치의 기울기 최소인가?    
        
    
    a0 = w_i[i-1, 0]          # 기울기
    b0 = w_i[i-1, 1]          # 절편
    a1 = w_i[i, 0]          
    b1 = w_i[i, 1]
    history = w_i[:i, :]   # 가중치 변화값 모음
    
    return a0, b0, a1, b1, dmse, history


# 경사하강법 호출 및 결과 확인
a0, b0, a1, b1, dMSE, history = run_gd(X, y)


print('반복횟수', history.shape[0])
print('회귀계수', a0, b0, a1, b1,)
print('MSE 기울기', dMSE[0], dMSE[1])
print('평균제곱오차', np.sqrt(get_mse(X, y, [a, b])))



# 계산된 계수로 선형 그래프 그림
plt.plot(X, y, 'ko')     # 산점도

W = np.array([a, b])     # y = ax + b
xb = np.linspace(4, 30, 100)   # 방정식에 사용할 x 값들 정의
yy = W[0] * xb + W[1]    # 선형 방정식
plt.plot(xb, yy, 'r-')   # 선형 직선

plt.show()



In [0]:
# 피자크기에 따른 가격에 대한 데이터가 다음과 같을때
# 12인치 피자의 가격을 예측하시오

X = 6, 8, 10, 14, 18
y = 7, 9, 13, 17.5, 18








In [0]:
## 다변량 선형회귀분석

# 흡연 여부와 임신주차에 따른 신생아 몸무게 측정
# 37주차, 흡연 일 때 몸무게는?
# 40주차, 흡연 일 때 몸무게는?
# 42주차, 흡연 일 때 몸무게는?




In [0]:
# Big Mart Sales 데이터셋을 이용한 회귀분석

# 상품 item 의 특징(weight, fatcontent, type, mrp)
# 매장 outlet 의 특징(year, size, location, type)
# 에 따라 상품판매량을 예측함



