In [1]:
import pandas as pd
import numpy as np
import os

# 1. 경로 설정
SUB_PATH = "./submissions/"
DATA_PATH = "../../data/raw/"

# 2. Optuna로 도출된 최적 가중치
# w1(m1): 0.0210, w2(m2): 0.0913, w4(m4): 0.9788, w5(m5): 0.5170
weights = np.array([0.0210, 0.0913, 0.9788, 0.5170])
norm_weights = weights / weights.sum()

print("--- 적용될 정규화 가중치 ---")
print(f"m1 (SOTA) : {norm_weights[0]:.4f}")
print(f"m2 (AUC)  : {norm_weights[1]:.4f}")
print(f"m4 (SNN)  : {norm_weights[2]:.4f} (Main)")
print(f"m5 (FE)   : {norm_weights[3]:.4f} (Sub-Main)")

# 3. 각 모델의 테스트 예측값(CSV) 로드
try:
    m1 = pd.read_csv(f"{SUB_PATH}0130-1923.csv")['voted']
    m2 = pd.read_csv(f"{SUB_PATH}Pure_0781_AUC_0.77322.csv")['voted']
    m4 = pd.read_csv(f"{SUB_PATH}Diversity_Focal_SNN_AUC_0.7708.csv")['voted']
    m5 = pd.read_csv(f"{SUB_PATH}m5_FE_test_preds.csv")['voted']
    print("\n모든 모델 로드 완료.")
except FileNotFoundError as e:
    print(f"\n파일 로드 실패: {e}")

# 4. 가중 평균 앙상블 수행
final_voted = (
    (m1 * norm_weights[0]) + 
    (m2 * norm_weights[1]) + 
    (m4 * norm_weights[2]) + 
    (m5 * norm_weights[3])
)

# 5. 최종 제출 파일 생성
submission = pd.read_csv(f"{DATA_PATH}sample_submission.csv")
submission['voted'] = final_voted

output_name = f"{SUB_PATH}22_Optuna_Ensemble_0.77437.csv"
submission.to_csv(output_name, index=False)

print("-" * 50)
print(f"파일 생성 완료")
print(f"결과 파일: {output_name}")
print("-" * 50)

--- 적용될 정규화 가중치 ---
m1 (SOTA) : 0.0131
m2 (AUC)  : 0.0568
m4 (SNN)  : 0.6087 (Main)
m5 (FE)   : 0.3215 (Sub-Main)

모든 모델 로드 완료.
--------------------------------------------------
파일 생성 완료
결과 파일: ./submissions/22_Optuna_Ensemble_0.77437.csv
--------------------------------------------------
