In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, classification_report

In [2]:
# 1. 데이터 로드
df = pd.read_csv("creditcard.csv")

# 2. 특성과 레이블 분리
X = df.drop(columns=['Class'])  # 특성
y = df['Class']                 # 레이블 (0: 정상, 1: 사기)

In [5]:
# 3. 데이터 분할 (학습:테스트 = 80:20)
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, stratify=y, random_state=42
)

# 4. 데이터 스케일링 (표준화)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# 5. 모델 학습 (랜덤 포레스트)
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train_scaled, y_train)

# 6. 예측 및 평가
y_pred = model.predict(X_test_scaled)

# 평가 지표 출력
print("🔍 모델 평가 결과")
print(f"정확도 (Accuracy): {accuracy_score(y_test, y_pred):.4f}")
print(f"정밀도 (Precision): {precision_score(y_test, y_pred):.4f}")
print(f"재현율 (Recall): {recall_score(y_test, y_pred):.4f}")
print(f"F1 점수 (F1-score): {f1_score(y_test, y_pred):.4f}")
print("\n📌 혼동 행렬 (Confusion Matrix):")
print(confusion_matrix(y_test, y_pred))
print("\n📋 분류 리포트:")
print(classification_report(y_test, y_pred))

🔍 모델 평가 결과
정확도 (Accuracy): 0.9996
정밀도 (Precision): 0.9412
재현율 (Recall): 0.8163
F1 점수 (F1-score): 0.8743

📌 혼동 행렬 (Confusion Matrix):
[[56859     5]
 [   18    80]]

📋 분류 리포트:
              precision    recall  f1-score   support

           0       1.00      1.00      1.00     56864
           1       0.94      0.82      0.87        98

    accuracy                           1.00     56962
   macro avg       0.97      0.91      0.94     56962
weighted avg       1.00      1.00      1.00     56962

