# 커스텀 함수 모델 회귀식 만들기

이번에는 원하는 여러 형태의 함수를 직접 만들고 학습시켜 다양한 회귀식을 만드는 방법을 배운다.

## 1. 커스텀 모델 함수 선언

사용자 정의 함수 선언을 통해 다양한 형태의 회귀식을 만들 수 있다. 예를 들어, 2차 함수, 3차 함수, 지수 함수 등을 선언할 수 있다.

1. 일차함수를 선언해본다
2. 이차함수를 선언해본다
3. 간단한 지수함수를 선언해본다

In [None]:
import numpy as np  # 수치 계산 라이브러리

# 일차함수
def linear_degree1_model(x, a, b):
    return a * x + b

# 이차함수
def linear_degree2_model(x, a, b, c):
    return a * x**2 + b * x + c

# 지수함수
def exp_model(x, a, b):
    return a * np.exp(b * x)


#### Practice1. 목적함수 선언 연습

여러 형태의 목적함수를 선언해보자. 아래의 함수들을 참고하여 다양한 형태의 목적함수를 선언한다.

1. 사인함수 (`np.sin()` 사용)
2. 코사인함수 (`np.cos()` 사용)
3. 로그함수 (`np.log()` 사용)
4. 제곱근함수 (`np.sqrt()` 사용)
5. 하이퍼볼릭 사인함수 (`np.sinh()` 사용)

In [None]:
# 사인함수
def sin_model(x, a, b, c, d):
    return a * np.sin(b * x + c) + d

# 코사인함수
def cos_model(x, a, b, c, d):
    return a * np.cos(b * x + c) + d

# 로그함수
def log_model(x, a, b, c, d):
    return a * np.log(b * x + c) + d

# 제곱근함수
def sqrt_model(x, a, b, c, d):
    return a * np.sqrt(b * x + c) + d

# 하이퍼볼릭 사인함수
def sinh_model(x, a, b, c, d):
    return a * np.sinh(b * x + c) + d


정의역 문제를 주의해야 한다. 여기서부터는 수학적으로 민감해지는 부분이 생기므로 항상 주의를 요한다.

알고리즘적인 안전장치로 적당히 제어해야 할 수 있다. 지금은 정의역 문제가 없는 지수함수, 삼각함수만 연습해본다.

## 2. 커스텀 모델 함수 학습과 평가, 시각화

커스텀 모델 함수를 학습하고 평가하는 방법을 배운다. 아래의 단계를 따라 진행한다.

1. `scipy.optimize.curve_fit` 함수를 사용하여 커스텀 모델 함수를 학습한다.
2. 학습된 모델을 사용하여 예측값을 계산한다.
3. 평가 지표를 계산하여 모델의 성능을 평가한다.
4. 실제 데이터와 예측값을 비교하여 시각화한다.

In [None]:
# 필요한 라이브러리 임포트
import matplotlib.pyplot as plt  # 시각화 라이브러리
import seaborn as sns
from scipy.optimize import curve_fit  # 곡선 피팅 라이브러리
from sklearn.model_selection import train_test_split

diamonds = sns.load_dataset("diamonds")
x = diamonds[["carat"]]
y = diamonds["price"]
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)

`curve_fit` 함수는 x값이 `numpy` 배열이어야 해서 입력 x값의 코드가 조금 다르다.

In [None]:
# 지수함수 모델 생성
def exp_model(x, a, b, c):
    return a * np.exp(b * x) + c

# curve_fit을 사용하여 모델 학습
params, _ = curve_fit(exp_model, x_train["carat"], y_train)

params  # 이 값으로 함수를 직접 새로 만드는 것

In [None]:
def fitted_model(x):
    return params[0] * np.exp(params[1] * x) + params[2]

# 예측값 계산
y_pred = fitted_model(x_test["carat"])

# 평가
from sklearn.metrics import mean_absolute_error, r2_score, root_mean_squared_error
rmse = root_mean_squared_error(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"RMSE: {rmse:.2f}, MAE: {mae:.2f}, R^2: {r2:.2f}")


# 시각화
plt.figure(figsize=(10, 6))
plt.scatter(x_test["carat"], y_test, label="Actual", color="blue")
plt.scatter(x_test["carat"], y_pred, label="Predicted", color="red")
plt.xlabel("Carat")
plt.ylabel("Price")
plt.title("Actual vs Predicted Price")
plt.legend()
plt.show()

#### Practice2. 커스텀 모델 함수 학습과 평가

1. 사차함수 `linear_degree4_model`을 선언한다.
2. `curve_fit` 함수를 사용하여 사차함수 모델을 학습한다.
3. 알아낸 계수를 이용해 `fitted_linear_degree4_model` 함수를 정의한다.
4. 테스트 데이터에 대해 예측값을 계산한다.
5. 평가 지표를 계산한다.
6. 실제 데이터와 예측값을 비교하여 시각화한다.

In [None]:
def linear_degree4_model(x, a, b, c, d, e):
    return a * x**4 + b * x**3 + c * x**2 + d * x + e

# 데이터셋 로드
diamonds = sns.load_dataset("diamonds")
x = diamonds["carat"]
y = diamonds["price"]

param, _ = curve_fit(linear_degree4_model, x, y)
param

# fitted_linear_degree4_model 함수 정의
def fitted_linear_degree4_model(x):
    return (param[0] * x**4 + param[1] * x**3 +
            param[2] * x**2 + param[3] * x + param[4])

def fitted_linear_degree4_model(x):
    return linear_degree4_model(x, *param)

# 예측값 계산
y_pred = fitted_linear_degree4_model(x)

# 평가
r2 = r2_score(y, y_pred)
print(f"R^2: {r2:.2f}")

# 시각화
plt.figure(figsize=(12, 6))
plt.scatter(x, y, label="Actual", color="blue", s=5)
plt.scatter(x, y_pred, label="Predicted", color="red", s=5)
plt.xlabel("Carat")
plt.ylabel("Price")
plt.title("Actual vs Predicted Price (4th Degree Polynomial)")
plt.legend()
plt.show()


1. 다항회귀 (x -> x, x^2, x^3)
PolynomialFeatures

In [None]:
from sklearn.preprocessing import PolynomialFeatures

x = diamonds[['carat']]
poly = PolynomialFeatures(degree=4, include_bias=False)
poly_x = poly.fit_transform(x, y)

# 모델선언
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(poly_x, y)
y_pred = model.predict(poly_x)

# 평가
from sklearn.metrics import r2_score
r2 = r2_score(y, y_pred)
print(f"R^2: {r2:.2f}")

# 시각화
plt.figure(figsize=(12, 6))
plt.title('Actual vs Predicted Price (Polynomial Regression)')
plt.scatter(x, y, label='Actual', color='blue', s=5)
plt.scatter(x, y_pred, label='Predicted', color='red', s=5)
plt.legend()
plt.show()

In [None]:
# curve_fit
def exp_model(x, a, b, c):
    return a * np.exp(b * x) + c

# curve_fit을 사용하여 모델 학습
params, _ = curve_fit(exp_model, x_train["carat"], y_train)

def fitted_exp_model(x):
    return exp_model(x, *params)

# 예측값 계산
y_pred = fitted_exp_model(x_test["carat"])

# 평가
r2 = r2_score(y_test, y_pred)
print(f"R^2: {r2:.2f}")

# 시각화
plt.figure(figsize=(10, 6))
plt.title('Actual vs Predicted Price (Exponential Regression)')
plt.scatter(x_test["carat"], y_test, label="Actual", color="blue", s=5)
plt.scatter(x_test["carat"], y_pred, label="Predicted", color="red", s=5)
plt.legend()
plt.show()