In [1]:
import numpy as np
from sklearn.linear_model import LinearRegression


# LinearRegression 클래스 직접 구현
class MyLinearRegression:
    def fit(self, X, y):
        
        # 편향 추가
        X_b = np.c_[np.ones((X.shape[0], 1)), X]
        
        # 정규 방정식을 사용하여 모델 파라미터 계산
        self.theta_ = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y)
        
    def predict(self, X):
        
        # 편향 추가
        X_b = np.c_[np.ones((X.shape[0], 1)), X]
        
        # 예측 수행
        return X_b.dot(self.theta_)
    

# 임의의 데이터 생성
np.random.seed(42)
n = 3
m = 100
X = 2 * np.random.rand(m, n)
y = 4 + np.dot(X, [3, 4, 5]) + np.random.randn(m)

# MyLinearRegression 클래스를 사용하여 모델 훈련 및 예측
my_lin_reg = MyLinearRegression()
my_lin_reg.fit(X, y)
my_predictions = my_lin_reg.predict(X)

# scikit-learn의 LinearRegression 클래스를 사용하여 모델 훈련 및 예측
sk_lin_reg = LinearRegression()
sk_lin_reg.fit(X, y)
sk_predictions = sk_lin_reg.predict(X)

# 모델 파라미터와 예측 비교
my_theta, sk_theta = my_lin_reg.theta_, [sk_lin_reg.intercept_, *sk_lin_reg.coef_]
predictions_comparison = np.allclose(my_predictions, sk_predictions, rtol=1e-05, atol=1e-08)

my_theta, sk_theta, predictions_comparison

print('my_theta: ', np.round(my_theta, 8))
print('sk_theta: ', np.round(sk_theta, 8))
print('predictions_comparison: ', predictions_comparison)

my_theta:  [3.73501456 3.13900206 3.9211189  5.28520288]
sk_theta:  [3.73501456 3.13900206 3.9211189  5.28520288]
predictions_comparison:  True
