# 선형회귀(최소제곱법)

In [None]:
# 행렬 연산을 위한 형변환(Pandas Series => np.array)
X = np.array(df['x']).reshape(-1, 1)
y = np.array(df['y']).reshape(-1, 1)
# print(X, type(X), end = '\n\n')
# print(y, type(y))

# 절편에 의해 x와 w의 개수가 다르므로 행렬 연산을 위해 x의 1열에 1을 가가
X = np.hstack((X ** 0, X))

# 최소제곱법 적용 => 만약 X, y를 np.matrix형으로 바꿔준다면 조금 더 쉽게 가능
w = np.linalg.inv(X.T @ X) @ X.T @ y
print(f"parameter : {w}")

# 예측 데이터를 시각화하기 위해 x의 범위를 설정하고 이를 이용해서 직선 생성
xp = np.arange(-2, 1, 0.01)
yp = w[0, 0] + w[1, 0] * xp

# 시각화
plt.figure(figsize = (6, 4))
plt.scatter(df.x, df.y, label = 'Training Data')
plt.plot(xp, yp, 'r', label = 'Predict Data')
plt.title('Simple Linear Regression')
plt.xlabel('X')
plt.ylabel('Y')
plt.legend()
plt.grid(True)
plt.show()

# 비선형 회귀(최소제곱법)

In [None]:
# 행렬 연산을 위한 형변환(Pandas Series => np.array)
X = np.array(df['x']).reshape(-1, 1)
y = np.array(df['y']).reshape(-1, 1)
xp = np.arange(-4.5, 4.5, 0.01).reshape(-1, 1)
# print(X, type(X), end = '\n\n')
# print(y, type(y))

# 그래프 구역 별로 나누기
fig, axes = plt.subplots(2, 5, figsize=(20, 8))
axes = axes.ravel()

# 차수에 따른 예측함수를 구하기 위해 반복시행
for degree in range(1, 11):
    polybasis = np.hstack([xp** j for j in range(degree + 1)]) # 차수에 따른 테스트 데이터 생성
    
    A = np.hstack([X ** j for j in range(degree + 1)]) # 차수에 따른 훈련 데이터 생성
    w = np.linalg.inv(A.T @ A) @ A.T @ y # 최소제곱법으로 w 구하기
    yp = polybasis @ w # 구한 w와 테스트 데이터로 예측함수 구기기
    print(f"{degree}차 파라미터 : {w}", end = '\n\n')

    # 시각화
    ax = axes[degree-1]
    ax.plot(X, y, 'bo', label='Training Data')
    ax.plot(xp, yp, 'r', label='Predict Data')
    ax.set_title(f'Degree {degree}')
    ax.set_xlim(-2, 1)    
    ax.set_ylim(-30, 20)
    ax.grid(alpha=0.4)
plt.show()

# 선형회귀(경사하강법)

In [None]:
# 행렬 연산을 위한 형변환(Pandas Series => np.array)
X = np.array(df['x']).reshape(-1, 1)
y = np.array(df['y']).reshape(-1, 1)
# print(X, type(X), end = '\n\n')
# print(y, type(y))

# 파라미터의 초기값, 에포크, 학습률 설정
w1, w0 = 0, 0
lr = 0.001
epoch = 500
n = float(len(X))

# 설정한 에포크만큼 반복시행
for _ in range(epoch):
    y_pred = w0 + w1 * X # 예측함수 정의
    w0 -= lr * (1 / n) * sum(y_pred - y) # w0 업데이트
    w1 -= lr * (1 / n) * sum(X * (y_pred - y)) # w1 업데이트
print(f"Parameter : {w0, w1}")

# 테스트 데이터, 예측 데이터 생성
xp = np.arange(-2, 1, 0.01)
yp = w0 + w1 * xp

# 시각화
plt.figure(figsize = (6, 4))
plt.scatter(df.x, df.y, label = 'Training Data')
plt.plot(xp, yp, 'r', label = 'Predict Data')
plt.title('Simple Linear Regression')
plt.xlabel('X')
plt.ylabel('Y')
plt.legend()
plt.grid(True)
plt.show()

# 비선형회귀(경사하강법)

In [None]:
# 행렬 연산을 위한 형변환(Pandas Series => np.array)
X = np.array(df['x']).reshape(-1, 1)
y = np.array(df['y']).reshape(-1, 1)
xp = np.arange(-4.5, 4.5, 0.01).reshape(-1, 1)
# print(X, type(X), end = '\n\n')
# print(y, type(y))

# 그래프 구역 나기기
fig, axes = plt.subplots(1, 3, figsize=(20, 8))

# 학습률, 에포크, 데이터 개수 할당
lr = 0.001
epoch = 500
n = float(len(X))

# 2차 ~ 4차를 구하기 위해 반복문
for degree in range(2, 5):
    w = np.zeros((degree + 1, 1)) # 차수 + 1만큼의 가중치가 생기므로 degree + 1개의 0을 w에 할당
    A = np.hstack([X ** j for j in range(degree + 1)]) # X에 차수를 반영한 행렬 생성
    for _ in range(epoch): # epoch만큼 반복 실행
        y_pred = A @ w # 내적을 통해 예측함수 생성
        polybasis = np.hstack([xp ** j for j in range(degree + 1)]) 
        w -= lr * (1 / n) * (A.T @ (y_pred - y)) # 경사하강법
    print(f"{degree}차 파라미터 : {w}", end = '\n\n')
    yp = polybasis @ w # 예측된 값

    # 시각화
    ax = axes[degree - 2]
    ax.scatter(X, y, label='Training Data')
    ax.plot(xp, yp, 'r',label= 'Predict Data')
    ax.set_xlim(-2, 1)    
    ax.set_ylim(-30, 20)
    ax.set_title(f'Degree {degree}')
    ax.set_xlabel('X')
    ax.set_ylabel('Y')
    ax.grid(alpha=0.4)
    ax.legend()
plt.show()

# 경사하강법(규제)

In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv("lr_data.csv")
data.head()

X = np.array(data['x']).reshape(-1, 1)
y = np.array(data['y']).reshape(-1, 1)
print(X.shape, y.shape)

w = np.zeros([2, 1]) # 2, 1
m = len(X)

A = np.hstack([X**0, X]) # 15, 2
X = np.asmatrix(X)
y = np.asmatrix(y)

epoch = 1000
lr = 0.01
lam = 0.1

for _ in range(epoch):
    y_pred = A @ w                    
    error = y_pred - y                  
    grad = (1/m) * (A.T @ error)      # MSE에 대한 gradient
    # subgrad = np.sign(w)               # L1 norm의 서브그래디언트
    subgrad = 2 * lam * w              # L2 norm의 서브그래디언트
    w = w - lr * (grad + lam * subgrad) # Lasso GD 업데이트

print(w)
xp = np.linspace(0, 5, 100).reshape(-1, 1)

yp = w[0, 0] + w[1, 0] * xp
plt.plot(X, y, 'bo')
plt.plot(xp, yp, color='red', linewidth=2, label='Lasso Regression')
plt.xlabel("x")
plt.ylabel("y")
plt.legend()
plt.title("Lasso Regression (Gradient Descent)")
plt.grid(True)
plt.show()

plt.figure(figsize=(6, 4))
plt.stem(range(len(w)), w)
plt.xlabel("Weight Index")
plt.ylabel("Weight Value")
plt.title("Weights (w) from Gradient Descent")
plt.grid(True)
plt.show()