# 예측 모델 예제

이 노트북은 예측 모델을 사용하는 기본적인 예제를 제공합니다.

In [None]:
import sys
import os

# 상위 디렉토리를 경로에 추가하여 src 모듈 import 가능하게 함
sys.path.append(os.path.abspath(os.path.join(os.getcwd(), '..')))

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from src.model import PredictionModel
from src.generate_sample_data import generate_sample_data

## 1. 샘플 데이터 생성

In [None]:
# 샘플 데이터 생성
data = generate_sample_data(n_samples=500, n_features=3, noise=0.2)
data.head()

## 2. 데이터 탐색

In [None]:
# 데이터 기본 정보
print("데이터 크기:", data.shape)
print("\n기술 통계:")
data.describe()

In [None]:
# 상관 관계 확인
plt.figure(figsize=(10, 8))
corr = data.corr()
plt.imshow(corr, cmap='coolwarm', interpolation='none', aspect='auto')
plt.colorbar()
plt.xticks(range(len(corr.columns)), corr.columns, rotation=45)
plt.yticks(range(len(corr.columns)), corr.columns)
plt.title('변수 간 상관관계')
plt.show()

## 3. 모델 학습 및 평가

In [None]:
# 예측 모델 인스턴스 생성
model = PredictionModel()

# 데이터 전처리
model.preprocess_data(data, target_column='target', test_size=0.3)

# 모델 학습
model.train()

# 모델 평가
mse, r2 = model.evaluate()

In [None]:
# 결과 시각화
model.visualize_results()

## 4. 새로운 데이터에 대한 예측

In [None]:
# 새로운 데이터 생성
new_data = pd.DataFrame({
    'feature_1': [0.5, -0.2, 1.1],
    'feature_2': [-0.3, 0.7, -0.8],
    'feature_3': [1.2, -0.5, 0.3]
})

# 예측
predictions = model.predict(new_data)
print("예측 결과:")
for i, pred in enumerate(predictions):
    print(f"샘플 {i+1}: {pred:.4f}")

## 5. 모델 개선 방향

1. 특성 선택 및 엔지니어링
2. 하이퍼파라미터 튜닝
3. 다양한 모델 시도 (Random Forest, Gradient Boosting 등)
4. 교차 검증 적용