In [2]:
import requests
import json
from datetime import datetime, timedelta, UTC
import time
import math
import joblib  # <-- [추가 1] joblib 파일 로드용
import numpy as np # <-- [추가 2] 모델 입력 데이터 형식(배열)용

# (이 라이브러리들은 성능 리포트에 필요합니다)
from sklearn.metrics import confusion_matrix, recall_score, precision_score

# --- 1. Google Elevation API 키 ---
# (키가 없으면 2차 검사는 건너뜁니다)
GOOGLE_API_KEY = "AIzaSyCQt1-_LLhTfX_0l6JAZU1WwlZ1ldkTVTw" # <--- 여기에 실제 키를 넣어주세요

# --- 2. Google Elevation API 호출 함수 (지형 분석) ---
def check_elevation_difference(epicenter_lat, epicenter_lon):
    """
    진앙지 반경 60km 이내의 고도차(2km)를 확인합니다.
    """
    # (주의!) 키가 입력되었는지 확인하는 로직입니다. "YOUR_API_KEY"를 수정하시면 안 됩니다.
    if GOOGLE_API_KEY == "YOUR_API_KEY":
        # print("    [고도 분석 건너뜀] (Google API 키가 필요합니다)")
        return False # API 키가 없으면 실행 안 함

    base_url = "https://maps.googleapis.com/maps/api/elevation/json"
    delta = 0.54 # 60km
    path = [
        f"{epicenter_lat + delta},{epicenter_lon}", # 북
        f"{epicenter_lat - delta},{epicenter_lon}", # 남
        f"{epicenter_lat},{epicenter_lon + delta}", # 동
        f"{epicenter_lat},{epicenter_lon - delta}", # 서
        f"{epicenter_lat},{epicenter_lon}"          # 중앙
    ]
    params = { 'path': '|'.join(path), 'samples': 5, 'key': GOOGLE_API_KEY }

    try:
        response = requests.get(base_url, params=params)
        response.raise_for_status()
        data = response.json()

        if data['status'] == 'OK':
            elevations = [result['elevation'] for result in data['results']]
            difference = max(elevations) - min(elevations)

            # (디버깅용) print(f"    [고도 분석] 고도차: {difference:.2f} m")

            if difference > 2000:
                return True # 위험
            else:
                return False
        else:
            return False
    except requests.exceptions.RequestException as e:
        return False

# --- 3. (가짜) 모델: 우리가 만든 로직 ---
def my_placeholder_model(mag, depth, lat, lon):
    """
    [여기를 팀원의 모델로 교체하세요]
    이것은 우리가 만든 임시 모델(Placeholder)입니다.
    1. 규모 6.0 이상, 깊이 100km 미만인지 1차 확인
    2. Google API로 2km 고도차 2차 확인
    """
    # 1차 경보 (규모 6.0 이상, 깊이 100km 미만)
    if mag is not None and mag >= 6.0 and depth < 100.0:

        # 2차 경보 (Google API 호출)
        if check_elevation_difference(lat, lon):
            return 1 # (예측: 쓰나미 발생)
        else:
            return 0 # (예측: 쓰나미 미발생)
    else:
        return 0 # (예측: 쓰나미 미발생)

# --- 4. 시나리오(과거 데이터) 로더 (TypeError 수정된 버전) ---
def load_historical_data(start_date="2020-01-01",
                         minlatitude=33, maxlatitude=43,
                         minlongitude=128, maxlongitude=135):
    """
    지정한 날짜부터 현재까지 '지정된 좌표'의 모든 지진 기록을 불러옵니다.
    기본값은 '한국-일본 바다' 영역입니다.
    """
    print(f"  > 로딩 조건: {start_date}부터, Lat({minlatitude}~{maxlatitude}), Lon({minlongitude}~{maxlongitude})")

    params = {
        'format': 'geojson',
        'starttime': start_date,
        'minlatitude': minlatitude,   # 함수 인자로 받은 값을 사용
        'maxlatitude': maxlatitude,   # 함수 인자로 받은 값을 사용
        'minlongitude': minlongitude, # 함수 인자로 받은 값을 사용
        'maxlongitude': maxlongitude  # 함수 인자로 받은 값을 사용
    }
    base_url = "https://earthquake.usgs.gov/fdsnws/event/1/query"

    try:
        response = requests.get(base_url, params=params)
        response.raise_for_status()
        data = response.json()
        return data['features'] # 모든 지진 이벤트 목록을 반환

    except requests.exceptions.RequestException as e:
        print(f"과거 데이터 로딩 중 오류 발생: {e}")
        return []

# --- 5. 성능 리포트 출력 (IndexError 수정된 버전) ---
def print_performance_report(y_true, y_pred):
    """
    '실제 정답'과 '모델 예측'을 비교하여 성능을 리포트합니다.
    """
    # labels=[0, 1]을 추가하여, 쓰나미(1)가 없더라도 2x2 행렬을 강제로 생성
    cm = confusion_matrix(y_true, y_pred, labels=[0, 1])

    tn = cm[0][0] # (실제 X, 예측 X) - 잘 무시함
    fp = cm[0][1] # (실제 X, 예측 O) - 잘못된 경보
    fn = cm[1][0] # (실제 O, 예측 X) - 놓친 쓰나미 (가장 치명적)
    tp = cm[1][1] # (실제 O, 예측 O) - 잘 맞춘 쓰나미

    print("\n--- [모델 성능 최종 리포트] ---")
    print("=== 혼동 행렬 (Confusion Matrix) ===")
    print(f"                       (모델 예측)")
    print(f"                   '위험 낮음' | '쓰나미 경보'")
    print(f"(실제) 쓰나미 X  |     {tn:^6d} |     {fp:^6d}")
    print(f"(실제) 쓰나미 O  |     {fn:^6d} |     {tp:^6d}")
    print("---------------------------------")

    # 재현율 (Recall) 계산
    recall = recall_score(y_true, y_pred, zero_division=0)

    # 정밀도 (Precision) 계산
    precision = precision_score(y_true, y_pred, zero_division=0)

    print("=== 핵심 성능 지표 ===")
    print(f"  [재현율 (Recall)]   : {recall:.2%}")
    print(f"    (실제 쓰나미 {fn+tp}건 중 {tp}건을 탐지 성공)\n")

    print(f"  [정밀도 (Precision)] : {precision:.2%}")
    print(f"    (모델이 울린 총 {fp+tp}번의 경보 중 {tp}건이 실제 쓰나미)\n")

    print(f"  [총 '잘못된 경보'(False Positive)]: {fp} 건")
    print(f"  [총 '놓친 쓰나미'(False Negative)]: {fn} 건  <-- (가장 위험)")
    print("---------------------------------")


# --- 6. 메인 시나리오 실행기 ---
if __name__ == "__main__":

    # (1) 팀원의 모델로 교체하는 부분
    #
    try:
        # 1. 'tsunami_model.joblib' 파일 로드
        real_model = joblib.load('tsunami_model.joblib')

        # 2. 'tsunami_model_to_test'에 '진짜 모델'을 할당합니다.
        # 이 lambda 함수는 4개 변수를 받아 [1, 4] 형태의 2D 배열로 만들어 모델에 주입합니다.
        tsunami_model_to_test = lambda mag, depth, lat, lon: real_model.predict(
            np.array([[mag, depth, lat, lon]])
        )[0]

        model_name = "real_model (tsunami_model.joblib)"
        print("--- [모델 로딩 성공] 'tsunami_model.joblib'를 사용합니다. ---")

    except FileNotFoundError:
        print("--- [모델 로딩 실패] 'tsunami_model.joblib' 파일을 찾을 수 없습니다. ---")
        print("--- 임시 'my_placeholder_model'을 대신 사용합니다. ---")
        tsunami_model_to_test = my_placeholder_model
        model_name = "my_placeholder_model"
    except Exception as e:
        print(f"--- [모델 로딩 오류] {e} ---")
        print("--- 임시 'my_placeholder_model'을 대신 사용합니다. ---")
        tsunami_model_to_test = my_placeholder_model
        model_name = "my_placeholder_model"
    # -----------------------------------------------------------------

    print(f"\n--- [시나리오 백테스트 시작] ---")
    print(f"테스트할 모델: {model_name}")

    # A. 과거 데이터(시나리오) 로드
    print("1. USGS에서 과거 지진 데이터(시나리오)를 불러옵니다 (2020년 1월 1일부터)...")

    historical_events = load_historical_data(
        start_date="2020-01-01",
        minlatitude=30,  # 일본 동쪽 해역
        maxlatitude=45,
        minlongitude=140,
        maxlongitude=150
    )

    if not historical_events:
        print("데이터 로딩 실패 또는 해당 기간 지진 없음.")
    else:
        print(f"총 {len(historical_events)}건의 과거 지진(시나리오) 확보.")

        y_true = [] # 실제 정답 (Real answers)
        y_pred = [] # 모델 예측 (Model predictions)

        print("2. 확보된 시나리오를 모델에 하나씩 입력하여 예측을 수행합니다...")

        for i, event in enumerate(historical_events):
            # B. 시나리오 1건의 데이터 추출
            props = event['properties']
            geom = event['geometry']['coordinates']

            mag = props['mag']
            depth = geom[2]
            lat = geom[1]
            lon = geom[0]
            place = props.get('place', 'Unknown Location') # 위치 정보가 없을 경우 대비

            # C. '실제 정답' 추출
            actual_tsunami = props['tsunami']
            y_true.append(actual_tsunami)

            # D. '모델 예측' 수행
            try:
                # 이 부분은 수정할 필요 없음:
                # tsunami_model_to_test가 '진짜 모델'이든 '임시 모델'이든 동일하게 작동
                predicted_tsunami = tsunami_model_to_test(mag, depth, lat, lon)
            except Exception as e:
                print(f"  [모델 예측 오류] ({place}): {e}")
                print(f"  > 입력값: mag={mag}, depth={depth}, lat={lat}, lon={lon}")
                predicted_tsunami = 0 # 오류 시 0 (안전)으로 예측

            y_pred.append(predicted_tsunami)

            if (i+1) % 200 == 0:
                print(f"  ... {i+1} / {len(historical_events)} 건 처리 중 ...")

        print("3. 예측 완료. 모델 성능(재현율)을 계산합니다...")

        # E. 최종 성능 리포트 출력
        print_performance_report(y_true, y_pred)

--- [모델 로딩 실패] 'tsunami_model.joblib' 파일을 찾을 수 없습니다. ---
--- 임시 'my_placeholder_model'을 대신 사용합니다. ---

--- [시나리오 백테스트 시작] ---
테스트할 모델: my_placeholder_model
1. USGS에서 과거 지진 데이터(시나리오)를 불러옵니다 (2020년 1월 1일부터)...
  > 로딩 조건: 2020-01-01부터, Lat(30~45), Lon(140~150)
총 3456건의 과거 지진(시나리오) 확보.
2. 확보된 시나리오를 모델에 하나씩 입력하여 예측을 수행합니다...
  ... 200 / 3456 건 처리 중 ...
  ... 400 / 3456 건 처리 중 ...
  ... 600 / 3456 건 처리 중 ...
  ... 800 / 3456 건 처리 중 ...
  ... 1000 / 3456 건 처리 중 ...
  ... 1200 / 3456 건 처리 중 ...
  ... 1400 / 3456 건 처리 중 ...
  ... 1600 / 3456 건 처리 중 ...
  ... 1800 / 3456 건 처리 중 ...
  ... 2000 / 3456 건 처리 중 ...
  ... 2200 / 3456 건 처리 중 ...
  ... 2400 / 3456 건 처리 중 ...
  ... 2600 / 3456 건 처리 중 ...
  ... 2800 / 3456 건 처리 중 ...
  ... 3000 / 3456 건 처리 중 ...
  ... 3200 / 3456 건 처리 중 ...
  ... 3400 / 3456 건 처리 중 ...
3. 예측 완료. 모델 성능(재현율)을 계산합니다...

--- [모델 성능 최종 리포트] ---
=== 혼동 행렬 (Confusion Matrix) ===
                       (모델 예측)
                   '위험 낮음' | '쓰나미 경보'
(실제) 쓰나미 X  |      3446  |      