## Inference with Fresh Data

### Outline
- 학습/튜닝에 사용하지 않은 완전히 새로운 데이터(test_data.csv)에서 평가
- 데이터 분할도 랜덤하게 충분히 혼합된 상태에서 진행

In [1]:
import pandas as pd

# 테스트 데이터 불러오기
test_df = pd.read_csv('data/test_data.csv')

In [2]:
import numpy as np

# 컬럼명 공백 제거
test_df.columns = test_df.columns.str.strip()

# inf, -inf → NaN 변환
test_df.replace([np.inf, -np.inf], np.nan, inplace=True)

# NaN → 0 대체
test_df.fillna(0, inplace=True)

In [3]:
test_df['Label_binary'] = test_df['Label'].apply(lambda x: 0 if x == 'BENIGN' else 1)
test_df['Label_binary'].value_counts()

Label_binary
0    454434
1    111715
Name: count, dtype: int64

In [4]:
X_test = test_df.drop(columns=['Label', 'Label_binary'])
y_test = test_df['Label_binary']

In [5]:
import joblib

# 학습된 모델 불러오기
clf = joblib.load('prototype_RandomForest.pkl')

# 테스트
y_pred = clf.predict(X_test)

In [6]:
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, classification_report

# 평가 지표 계산
acc = accuracy_score(y_test, y_pred)
prec = precision_score(y_test, y_pred)
rec = recall_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred)
cm = confusion_matrix(y_test, y_pred)

print(f"Accuracy:  {acc:.4f}")
print(f"Precision: {prec:.4f}")
print(f"Recall:    {rec:.4f}")
print(f"F1-score:  {f1:.4f}")
print("\nConfusion Matrix:\n", cm)
print("\nClassification Report:\n")
print(classification_report(y_test, y_pred, digits=4))

Accuracy:  0.9989
Precision: 0.9972
Recall:    0.9970
F1-score:  0.9971

Confusion Matrix:
 [[454123    311]
 [   331 111384]]

Classification Report:

              precision    recall  f1-score   support

           0     0.9993    0.9993    0.9993    454434
           1     0.9972    0.9970    0.9971    111715

    accuracy                         0.9989    566149
   macro avg     0.9982    0.9982    0.9982    566149
weighted avg     0.9989    0.9989    0.9989    566149



### Result
- Prototype으로도 충분히 훌륭한 결과 도출
- 충분한 양의 데이터 때문에 좋은 테스트 결과가 나온 것으로 추측됨