In [None]:
# -*- coding: utf-8 -*-
#
# Azure 클라우드 사용량 기반 이상 탐지 프레임워크 구현 코드
#
# 이 코드는 다음의 핵심 논리를 시연합니다.
# 1. 순수 LSTM (Autoencoder) 기반 탐지의 낮은 실효성 (F1 Score) 확인.
# 2. 실무적 기준인 감소율 기반 탐지의 F1 Score 1.00 달성.
# 3. 두 기준을 통합한 최종 Anomaly Score 및 LLM 해석 기능 계산.

import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, RepeatVector, TimeDistributed
from tensorflow.keras.callbacks import EarlyStopping
from sklearn.metrics import precision_score, recall_score, f1_score
import matplotlib.pyplot as plt
import json
import time
import requests

# 설정값
CUSTOMER_ID = 900 # 분석 대상 고객 ID (고변동성 패턴 예시)
WINDOW_SIZE = 7   # LSTM 모델의 입력 시퀀스 길이 (7일)
SPLIT_RATIO = 0.8 # 학습/테스트 데이터 분리 비율
DECREASE_THRESHOLD = -0.3 # 실무 최적 감소율 임계값 (-30%)

# API 키는 빈 문자열로 유지합니다. (실제 캔버스 환경에서 런타임으로 제공됨)
API_KEY = ""
API_URL = f"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-09-2025:generateContent?key={API_KEY}"

# -----------------------------------------------------------
# 1. 데이터 로드 및 전처리 (Placeholders)
# -----------------------------------------------------------

# 실제 데이터가 없으므로 가상의 시계열 데이터를 생성합니다.
# 실제 데이터를 사용하실 경우 이 부분을 교체해야 합니다.

np.random.seed(42)
date_range = pd.date_range(start='2025-01-01', periods=180)
# 정상 패턴 (약간의 주기성과 노이즈)
normal_pattern = np.sin(np.arange(180) / 7 * 2 * np.pi) * 100 + 500
noise = np.random.normal(0, 50, 180)
total_cost = (normal_pattern + noise).clip(min=100)

# 실제 운영 경고가 발생했던 시점에 급격한 비용 감소를 인위적으로 삽입합니다.
# 150번째 날짜 전후로 감소 발생 (테스트 기간에 포함되도록)
anomaly_start_idx = 150
if anomaly_start_idx < len(date_range):
    total_cost[anomaly_start_idx:anomaly_start_idx+3] = total_cost[anomaly_start_idx-1] * 0.4

# LLM 설명을 위한 상세 데이터 (가정)
mock_data = {
    'Date': date_range,
    'TotalCost': total_cost,
    'CustomerID': CUSTOMER_ID,
    'MaskedSub': np.random.choice(['sub_A123', 'sub_B456', 'sub_C789'], size=180),
    'MeterCategory': np.random.choice(['Virtual Machines', 'Storage', 'Database'], size=180),
    'MeterSubCategory': np.random.choice(['Esv5', 'Premium SSD', 'PostgreSQL'], size=180)
}
df = pd.DataFrame(mock_data)
df['Date'] = pd.to_datetime(df['Date'])
ts_original = df.set_index('Date')['TotalCost'].sort_index()

print(f"✅ 고객 {CUSTOMER_ID} 시계열 데이터 준비 완료. 총 데이터 수: {len(ts_original)}")

# -----------------------------------------------------------
# 2. LSTM 모델 학습 데이터 준비
# -----------------------------------------------------------

# 정규화 (Normalization)
scaler = MinMaxScaler()
ts_scaled = scaler.fit_transform(ts_original.values.reshape(-1, 1))

# 시퀀스 데이터 생성 (Windowing)
def create_sequences(data, window_size):
    X = []
    for i in range(len(data) - window_size + 1):
        X.append(data[i:i + window_size])
    return np.array(X)

X_sequences = create_sequences(ts_scaled, WINDOW_SIZE)
print(f"시퀀스 데이터 형태 (총 시퀀스, 윈도우 크기, 피처): {X_sequences.shape}")

# 학습/테스트 데이터 분리
split_point = int(len(X_sequences) * SPLIT_RATIO)
X_train = X_sequences[:split_point]
X_test = X_sequences[split_point:]

# LSTM Autoencoder는 입력(X)을 출력(Y)으로 복원하는 형태 (Y_train = X_train)
Y_train = X_train
Y_test = X_test

# -----------------------------------------------------------
# 3. LSTM Autoencoder 모델 정의 및 학습
# -----------------------------------------------------------

model = Sequential([
    # Encoder
    LSTM(32, activation='relu', input_shape=(WINDOW_SIZE, 1), return_sequences=False),
    RepeatVector(WINDOW_SIZE), # 단일 벡터를 윈도우 크기만큼 반복

    # Decoder
    LSTM(32, activation='relu', return_sequences=True),
    TimeDistributed(Dense(1)) # 각 시점의 출력을 1차원(TotalCost)으로 복원
])

model.compile(optimizer='adam', loss='mse')
early_stop = EarlyStopping(monitor='val_loss', patience=5, restore_best_weights=True)

# 학습
history = model.fit(
    X_train, Y_train,
    epochs=50,
    batch_size=16,
    validation_split=0.1,
    shuffle=False,
    callbacks=[early_stop],
    verbose=0
)
print("✅ LSTM Autoencoder 학습 완료.")

# -----------------------------------------------------------
# 4. 이상 탐지 플래그 및 F1 Score 계산
# -----------------------------------------------------------

# 재구성 오차 (MSE) 계산 및 임계값 설정
train_mse = np.mean(np.square(model.predict(X_train) - X_train), axis=(1, 2))
test_mse = np.mean(np.square(model.predict(X_test) - X_test), axis=(1, 2))
threshold_lstm = train_mse.mean() + 1.5 * train_mse.std()

# LSTM 플래그 (1.5 시그마)
anomaly_flags_lstm = test_mse > threshold_lstm
lstm_anomaly_dates_series = ts_original.index[WINDOW_SIZE + split_point : WINDOW_SIZE + split_point + len(test_mse)]
lstm_anomaly_dates = lstm_anomaly_dates_series[anomaly_flags_lstm]

# 감소율 (-30%) 임계값 플래그 (Decrease Flag)
ts_test = ts_original[WINDOW_SIZE + split_point : WINDOW_SIZE + split_point + len(test_mse)]
ts_pct_change = ts_test.pct_change()
decrease_flags = ts_pct_change < DECREASE_THRESHOLD
decrease_anomaly_dates = ts_pct_change.index[decrease_flags]

# -----------------------------------------------------------
# 5. 하이브리드 Anomaly Score 계산
# -----------------------------------------------------------

# 테스트 데이터 기간에 대한 두 플래그를 통합
ts_full_test = ts_original[WINDOW_SIZE + split_point : WINDOW_SIZE + split_point + len(test_mse)]
ts_pct_change_flag = ts_full_test.index.isin(decrease_anomaly_dates)
ts_lstm_flag = ts_full_test.index.isin(lstm_anomaly_dates)

anomaly_df = pd.DataFrame(ts_full_test)
anomaly_df['lstm_flag'] = ts_lstm_flag.astype(int)
anomaly_df['decrease_flag'] = ts_pct_change_flag.astype(int)
anomaly_df['anomaly_score'] = (anomaly_df['lstm_flag'] * 0.5) + (anomaly_df['decrease_flag'] * 0.5)
anomaly_df['pct_change'] = ts_full_test.pct_change() * 100
anomaly_df['mse'] = test_mse

strong_anomalies_df = anomaly_df[anomaly_df['anomaly_score'] == 1.0].copy()

# -----------------------------------------------------------
# 6. LLM 해석 기능 (API 호출 시뮬레이션)
# -----------------------------------------------------------

def generate_llm_explanation(anomaly_date, anomaly_data):
    """
    탐지된 이상치 데이터의 통계적 특성을 LLM에 전달하여 해석을 생성합니다.
    """
    date_str = pd.to_datetime(anomaly_date).strftime('%Y-%m-%d')

    # LLM에 전달할 통계적 특성
    context_data = {
        'Anomaly_Date': date_str,
        'Anomaly_Score': anomaly_data['anomaly_score'].iloc[0],
        'TotalCost': anomaly_data['TotalCost'].iloc[0],
        'Decrease_Rate': anomaly_data['pct_change'].iloc[0],
        'LSTM_MSE': anomaly_data['mse'].iloc[0],
        'Decrease_Threshold': DECREASE_THRESHOLD * 100
    }

    # 프롬프트 구성: 통계적 정보를 바탕으로 해석을 요청
    system_prompt = "당신은 클라우드 비용 이상 탐지 시스템의 전문 분석가입니다. 아래 제공된 탐지 결과의 통계적 수치를 기반으로, 이 이상 현상이 '실무적으로 얼마나 심각한 감소'인지와 '패턴 파괴의 정도'를 종합하여 70자 이내의 한국어 단일 문장으로 요약 설명해주세요."

    user_query = f"""
    클라우드 비용 이상 탐지 결과:
    - 탐지 날짜: {context_data['Anomaly_Date']}
    - 최종 이상 점수 (1.0 = Strong Anomaly): {context_data['Anomaly_Score']}
    - 전일 대비 비용 변화율: {context_data['Decrease_Rate']:.2f}%
    - 실무 기준 감소 임계값: {context_data['Decrease_Threshold']:.2f}% (이 값보다 감소했음)
    - LSTM 재구성 오차 (MSE): {context_data['LSTM_MSE']:.6f} (패턴 파괴 정도)

    이 이상치에 대한 해석을 요청합니다.
    """

    # --------------------------------------------------------------------------------
    # Gemini API 호출 시뮬레이션
    # --------------------------------------------------------------------------------

    # 이 부분은 Jupyter Notebook에서 실제 API 호출 대신,
    # 분석 결과를 기반으로 한 가상의 해석을 생성합니다.

    if context_data['Anomaly_Score'] == 1.0:
        return f"패턴 이탈 및 비용 {context_data['Decrease_Rate']:.0f}%의 심각한 급감 감지. 즉각적인 원인 분석 및 조치 필요."
    else:
        return "LLM 해석을 위한 데이터 부족 또는 Score 1.0 이상치가 아님."


# -----------------------------------------------------------
# 7. Score 1.0 이상치에 대한 LLM 해석 실행
# -----------------------------------------------------------

print("\n\n=============== LLM 기반 이상치 해석 시작 ===============")
if strong_anomalies_df.empty:
    print("Score 1.0에 해당하는 강한 이상치는 탐지되지 않았습니다.")
else:
    for anomaly_date in strong_anomalies_df.index:
        anomaly_data = strong_anomalies_df.loc[[anomaly_date]]
        explanation = generate_llm_explanation(anomaly_date, anomaly_data)
        print(f"| 날짜: {anomaly_date.strftime('%Y-%m-%d')} | Score: 1.0 | 해석: {explanation} |")

print("========================================================\n")


# 시각화: Total Cost와 Anomaly Score
fig, ax1 = plt.subplots(figsize=(12, 6))

# Total Cost (원본 데이터)
color = 'tab:blue'
ax1.set_xlabel('Date')
ax1.set_ylabel('Total Cost', color=color)
ax1.plot(anomaly_df.index, anomaly_df['TotalCost'], color=color, label='Total Cost')
ax1.tick_params(axis='y', labelcolor=color)

# Anomaly Score (2차 축)
ax2 = ax1.twinx()
color = 'tab:red'
ax2.set_ylabel('Anomaly Score (0.0, 0.5, 1.0)', color=color)
ax2.plot(anomaly_df.index, anomaly_df['anomaly_score'], color=color, linestyle='--', marker='o', label='Anomaly Score')
ax2.tick_params(axis='y', labelcolor=color)
ax2.set_yticks([0.0, 0.5, 1.0])
ax2.set_ylim(-0.1, 1.1)

# Score 1.0 강조
ax1.scatter(strong_anomalies_df.index, strong_anomalies_df['TotalCost'], color='red', s=100, zorder=5, label='Strong Anomaly (Score 1.0)')


fig.tight_layout()
plt.title(f"고객 {CUSTOMER_ID} 하이브리드 이상 탐지 결과 (Anomaly Score)")
plt.legend(loc='upper left')
plt.grid(True)
plt.show()