| 구분 기준               | 분류 문제 (Classification)              | 회귀 문제 (Regression)             |
| ------------------- | ----------------------------------- | ------------------------------ |
| 🎯 **Target (예측값)** | 문자열 또는 정수형 클래스 (A, B, 1, 2 등)       | 연속적인 숫자 (예: 가격, 수량, 점수 등)      |
| 📊 **평가지표**         | `f1_macro`, `accuracy`, `roc_auc` 등 | `RMSE`, `MAE`, `MSE`, `R²` 등   |
| 📝 **문제 설명**        | “고객 유형 분류”, “이탈 여부 예측”, “등급 분류” 등   | “가격 예측”, “점수 예측”, “수요량 예측” 등   |
| 🧾 **target 컬럼값**   | 범주형 (A, B, C / 0, 1, 2...)          | 실수(float) 또는 정수(int)지만 값 범위가 큼 |


In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier # 분류
from sklearn.ensemble import RandomForestRegressor # 회귀

# 데이터 불러오기
train = pd.read_csv("train.csv")
test = pd.read_csv("test.csv")

# 전처리
train = pd.get_dummies(train)
test = pd.get_dummies(test)

# 타겟 분리
target = train.pop('Target')

# 학습/검증 분리
X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)

# 모델 학습
model = RandomForestClassifier(random_state=0) # 분류
model = RandomForestRegressor(random_state=0) # 회귀
model.fit(X_tr, y_tr)

# 예측
pred = model.predict(test) # 일반적인 경우
pred = model.predict_proba(test)[:,1] # (주의!) 분류-이진분류: 평가지표-roc_auc, 제출-확률값


# 제출
pd.DataFrame({ 'pred': pred }).to_csv("result.csv", index=False)