In [1]:
# 필요한 라이브러리 임포트
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# 데이터 생성 (임의의 데이터를 사용하며, 실제 데이터를 사용해야 합니다)
data = {
    '온도': [25, 28, 20, 30, 22, 26, 27, 23, 21, 29],
    '무게': [4, 6, 3, 5, 4.5, 5.5, 6.5, 3.5, 4, 5.5],
    '습도': [50, 60, 40, 65, 55, 45, 70, 30, 50, 75],
    '마르는_시간': [2, 3, 1.5, 3.5, 2.2, 2.8, 3.2, 2.1, 1.8, 3.3]
}

# 데이터프레임 생성
df = pd.DataFrame(data)

# 특성과 타겟 변수 분리
X = df.drop(columns=['마르는_시간'])
y = df['마르는_시간']

# 데이터 분할: 학습 데이터와 테스트 데이터로 나눔
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 머신러닝 모델 선택 및 학습
model = LinearRegression()
model.fit(X_train, y_train)

# 학습된 모델을 테스트 데이터로 평가
y_pred = model.predict(X_test)

# 성능 평가
mse = mean_squared_error(y_test, y_pred)        # -> 주로 예측값과 실제값 간의 오차를 계산하여 모델의 예측 정확도를 측정하는데 사용, 낮을수록 모델의 예측 정확도가 높음
r2 = r2_score(y_test, y_pred)                   # -> 주어진 데이터에 얼마나 잘 적합되는지를 나타내며, 0에서 1 사이의 값을 가집니다. 높을수록 모델이 데이터에 잘 적합되었다는 의미

# 결과 출력
print("Mean Squared Error:", mse)
print("R-squared:", r2)

# 새로운 데이터로 마르는 시간 예측
new_data = pd.DataFrame({'온도': [24], '무게': [4.5], '습도': [55]})
predicted_time = model.predict(new_data)
print("예측된 마르는 시간:", predicted_time[0])

Mean Squared Error: 0.031308050672617015
R-squared: 0.9130331925760639
예측된 마르는 시간: 2.3618696069384146
