# 🚀 MCP Hybrid System Pipeline Test

이 노트북은 `debate_ver2` 시스템의 전체 파이프라인을 단계별로 테스트할 수 있도록 구성되었습니다.

## 📋 테스트 단계
1. **Stage 0**: 데이터 수집 및 전처리
2. **Stage 1**: 에이전트 사전 훈련
3. **Stage 2**: 상호 학습 (Mutual Learning)
4. **Stage 3**: 토론 및 합의 (Debate & Consensus)
5. **평가**: 최종 성능 평가

## 🎯 테스트할 티커
- 기본값: **TSLA** (테슬라)
- 다른 티커로 변경 가능


In [1]:
# 필요한 라이브러리 import
import sys
import os
import pandas as pd
import numpy as np
import torch
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

# 프로젝트 경로 추가
sys.path.append('/home/ubuntu/Projects/ml-ai/capstone/demos/debate_ver2')

# 설정
TICKER = "TSLA"  # 테스트할 티커 (변경 가능)
PRE_EPOCHS = 20  # 사전 훈련 에포크 수
MUTUAL_ROUNDS = 3  # 상호 학습 라운드 수
DEBATE_ROUNDS = 2  # 토론 라운드 수

print(f"🎯 테스트 설정:")
print(f"   - 티커: {TICKER}")
print(f"   - 사전 훈련 에포크: {PRE_EPOCHS}")
print(f"   - 상호 학습 라운드: {MUTUAL_ROUNDS}")
print(f"   - 토론 라운드: {DEBATE_ROUNDS}")
print("=" * 50)


🎯 테스트 설정:
   - 티커: TSLA
   - 사전 훈련 에포크: 20
   - 상호 학습 라운드: 3
   - 토론 라운드: 2


In [2]:
from run import run_mcp_pipeline

run_mcp_pipeline("RZLV")


🚀 [MCP Hybrid System Orchestration Start]
Ticker: RZLV
⚠️  [technical] CSV 없음 → build_dataset() 실행


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


✅ RZLV raw data saved to CSV (482 samples)
   technical Agent: 10개 피처 사용 - ['Open', 'High', 'Low', 'Close', 'Volume', 'returns', 'sma_5', 'sma_20', 'rsi', 'volume_z']
✅ RZLV technical dataset saved to CSV (475 samples, 10 features)
   fundamental Agent: 16개 피처 사용 - ['Open', 'High', 'Low', 'Close', 'Volume', 'returns', 'sma_5', 'sma_20', 'rsi', 'volume_z', 'USD_KRW', 'NASDAQ', 'VIX', 'priceEarningsRatio', 'forwardPE', 'priceToBook']
✅ RZLV fundamental dataset saved to CSV (475 samples, 16 features)
   sentimental Agent: 8개 피처 사용 - ['returns', 'sentiment_mean', 'sentiment_vol', 'Close', 'Volume', 'Open', 'High', 'Low']
✅ RZLV sentimental dataset saved to CSV (475 samples, 8 features)
✅ RZLV base dataset saved to CSV (475 samples)
✅ [technical] 데이터 생성 완료: X=(475, 7, 10), y=(475, 1)
⚠️  [fundamental] CSV 없음 → build_dataset() 실행


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


✅ RZLV raw data saved to CSV (482 samples)
   technical Agent: 10개 피처 사용 - ['Open', 'High', 'Low', 'Close', 'Volume', 'returns', 'sma_5', 'sma_20', 'rsi', 'volume_z']
✅ RZLV technical dataset saved to CSV (475 samples, 10 features)
   fundamental Agent: 16개 피처 사용 - ['Open', 'High', 'Low', 'Close', 'Volume', 'returns', 'sma_5', 'sma_20', 'rsi', 'volume_z', 'USD_KRW', 'NASDAQ', 'VIX', 'priceEarningsRatio', 'forwardPE', 'priceToBook']
✅ RZLV fundamental dataset saved to CSV (475 samples, 16 features)
   sentimental Agent: 8개 피처 사용 - ['returns', 'sentiment_mean', 'sentiment_vol', 'Close', 'Volume', 'Open', 'High', 'Low']


[*********************100%***********************]  1 of 1 completed

✅ RZLV sentimental dataset saved to CSV (475 samples, 8 features)
✅ RZLV base dataset saved to CSV (475 samples)
✅ [fundamental] 데이터 생성 완료: X=(475, 7, 10), y=(475, 1)
⚠️  [sentimental] CSV 없음 → build_dataset() 실행



[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


✅ RZLV raw data saved to CSV (482 samples)
   technical Agent: 10개 피처 사용 - ['Open', 'High', 'Low', 'Close', 'Volume', 'returns', 'sma_5', 'sma_20', 'rsi', 'volume_z']
✅ RZLV technical dataset saved to CSV (475 samples, 10 features)
   fundamental Agent: 16개 피처 사용 - ['Open', 'High', 'Low', 'Close', 'Volume', 'returns', 'sma_5', 'sma_20', 'rsi', 'volume_z', 'USD_KRW', 'NASDAQ', 'VIX', 'priceEarningsRatio', 'forwardPE', 'priceToBook']
✅ RZLV fundamental dataset saved to CSV (475 samples, 16 features)
   sentimental Agent: 8개 피처 사용 - ['returns', 'sentiment_mean', 'sentiment_vol', 'Close', 'Volume', 'Open', 'High', 'Low']
✅ RZLV sentimental dataset saved to CSV (475 samples, 8 features)
✅ RZLV base dataset saved to CSV (475 samples)
✅ [sentimental] 데이터 생성 완료: X=(475, 7, 10), y=(475, 1)

🧠 Stage 1: Pretraining Agents
[13:38:16] 🧠 Pretraining TechnicalAgent
  Epoch 005 | Loss: 0.003926
  Epoch 010 | Loss: 0.003357
  Epoch 015 | Loss: 0.002998
  Epoch 020 | Loss: 0.002810
✅ TechnicalAgent pret

RuntimeError: input.size(-1) must be equal to input_size. Expected 16, got 10

## 📊 Stage 0: 데이터 수집 및 전처리

이 단계에서는 주식 데이터를 수집하고 각 에이전트별로 필요한 피처를 생성합니다.


In [None]:
# Stage 0: 데이터 수집 및 전처리
from core.preprocessing import build_dataset, load_csv_dataset
from runners.single_ticker_builder import build_single_ticker

print("🔄 Stage 0: 데이터 수집 및 전처리 시작...")
print(f"티커: {TICKER}")

try:
    # CSV에서 데이터 로드 시도
    print("📁 기존 CSV 파일에서 데이터 로드 시도...")
    X, y, scaler_X, scaler_y, feature_cols = load_csv_dataset(TICKER, "base")
    print(f"✅ CSV에서 데이터 로드 완료: {X.shape}")
    print(f"   - 피처 수: {X.shape[2]}")
    print(f"   - 시퀀스 길이: {X.shape[1]}")
    print(f"   - 샘플 수: {X.shape[0]}")
    
except FileNotFoundError:
    # CSV 파일이 없으면 새로 생성
    print("📁 CSV 파일이 없어서 새로 생성합니다...")
    X, y, scaler_X, scaler_y = build_dataset(TICKER)
    print(f"✅ 데이터 생성 및 로드 완료: {X.shape}")
    print(f"   - 피처 수: {X.shape[2]}")
    print(f"   - 시퀀스 길이: {X.shape[1]}")
    print(f"   - 샘플 수: {X.shape[0]}")

# PyTorch 텐서로 변환
X_t, y_t = torch.tensor(X, dtype=torch.float32), torch.tensor(y, dtype=torch.float32)
print(f"🔢 PyTorch 텐서 변환 완료: X_t{X_t.shape}, y_t{y_t.shape}")

# 데이터 통계
print(f"\n📊 데이터 통계:")
print(f"   - X 범위: [{X_t.min():.4f}, {X_t.max():.4f}]")
print(f"   - y 범위: [{y_t.min():.4f}, {y_t.max():.4f}]")
print(f"   - X 평균: {X_t.mean():.4f}")
print(f"   - y 평균: {y_t.mean():.4f}")

print("\n✅ Stage 0 완료!")


[*********************100%***********************]  1 of 1 completed

🔄 Stage 0: 데이터 수집 및 전처리 시작...
티커: TSLA
📁 기존 CSV 파일에서 데이터 로드 시도...
📁 CSV 파일이 없어서 새로 생성합니다...



[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


✅ TSLA raw data saved to CSV (483 samples)
   technical Agent: 10개 피처 사용 - ['Open', 'High', 'Low', 'Close', 'Volume', 'returns', 'sma_5', 'sma_20', 'rsi', 'volume_z']
✅ TSLA technical dataset saved to CSV (476 samples, 10 features)
   fundamental Agent: 16개 피처 사용 - ['Open', 'High', 'Low', 'Close', 'Volume', 'returns', 'sma_5', 'sma_20', 'rsi', 'volume_z', 'USD_KRW', 'NASDAQ', 'VIX', 'priceEarningsRatio', 'forwardPE', 'priceToBook']
✅ TSLA fundamental dataset saved to CSV (476 samples, 16 features)
   sentimental Agent: 8개 피처 사용 - ['returns', 'sentiment_mean', 'sentiment_vol', 'Close', 'Volume', 'Open', 'High', 'Low']
✅ TSLA sentimental dataset saved to CSV (476 samples, 8 features)
✅ TSLA base dataset saved to CSV (476 samples)
✅ 데이터 생성 및 로드 완료: (476, 7, 10)
   - 피처 수: 10
   - 시퀀스 길이: 7
   - 샘플 수: 476
🔢 PyTorch 텐서 변환 완료: X_ttorch.Size([476, 7, 10]), y_ttorch.Size([476, 1])

📊 데이터 통계:
   - X 범위: [0.0000, 1.0000]
   - y 범위: [0.0000, 1.0000]
   - X 평균: 0.3761
   - y 평균: 0.3868

✅ Stage 0 

## 🧠 Stage 1: 에이전트 사전 훈련

각 에이전트(Technical, Fundamental, Sentimental)를 개별적으로 사전 훈련합니다.


In [3]:
# Stage 1: 에이전트 사전 훈련
from agents.technical_agent import TechnicalAgent
from agents.fundamental_agent import FundamentalAgent
from agents.sentimental_agent import SentimentalAgent
from core.training import pretrain_all_agents

print("🧠 Stage 1: 에이전트 사전 훈련 시작...")

# 에이전트 초기화
print("🤖 에이전트 초기화...")
agents = {
    "technical": TechnicalAgent("TechnicalAgent"),
    "fundamental": FundamentalAgent("FundamentalAgent"),
    "sentimental": SentimentalAgent("SentimentalAgent"),
}

print(f"✅ {len(agents)}개 에이전트 초기화 완료:")
for name, agent in agents.items():
    print(f"   - {name}: {agent.agent_id}")

# 각 에이전트별 데이터셋 준비
print("\n📊 각 에이전트별 데이터셋 준비...")
datasets = {}

# 각 에이전트가 기대하는 피처 수 확인
for agent_name, agent in agents.items():
    try:
        # 각 에이전트별 데이터셋 로드 시도
        X_agent, y_agent, _, _, _ = load_csv_dataset(TICKER, agent_name)
        X_agent_t = torch.tensor(X_agent, dtype=torch.float32)
        y_agent_t = torch.tensor(y_agent, dtype=torch.float32)
        datasets[agent_name] = (X_agent_t, y_agent_t)
        print(f"✅ {agent_name}: {X_agent_t.shape} (피처 수: {X_agent_t.shape[2]})")
    except FileNotFoundError:
        # 에이전트별 데이터가 없으면 기본 데이터 사용
        datasets[agent_name] = (X_t, y_t)
        print(f"⚠️ {agent_name}: 기본 데이터 사용 {X_t.shape} (피처 수: {X_t.shape[2]})")

# 사전 훈련 실행
print(f"\n🚀 사전 훈련 시작 (에포크: {PRE_EPOCHS})...")
pretrain_all_agents(agents, datasets, epochs=PRE_EPOCHS)

print("\n✅ Stage 1 완료!")
print("💾 훈련된 모델들이 models/ 디렉토리에 저장되었습니다.")


🧠 Stage 1: 에이전트 사전 훈련 시작...
🤖 에이전트 초기화...


✅ 3개 에이전트 초기화 완료:
   - technical: TechnicalAgent
   - fundamental: FundamentalAgent
   - sentimental: SentimentalAgent

📊 각 에이전트별 데이터셋 준비...
✅ technical: torch.Size([476, 7, 10]) (피처 수: 10)
✅ fundamental: torch.Size([476, 7, 16]) (피처 수: 16)
✅ sentimental: torch.Size([476, 7, 8]) (피처 수: 8)

🚀 사전 훈련 시작 (에포크: 20)...
[13:20:34] 🧠 Pretraining TechnicalAgent
  Epoch 005 | Loss: 0.004981
  Epoch 010 | Loss: 0.003547
  Epoch 015 | Loss: 0.002881
  Epoch 020 | Loss: 0.002816
✅ TechnicalAgent pretraining finished.

💾 TechnicalAgent 모델 저장됨: models/technical_agent.pt
[13:20:36] 🧠 Pretraining FundamentalAgent
  Epoch 005 | Loss: 0.004119
  Epoch 010 | Loss: 0.003590
  Epoch 015 | Loss: 0.002755
  Epoch 020 | Loss: 0.002807
✅ FundamentalAgent pretraining finished.

💾 FundamentalAgent 모델 저장됨: models/fundamental_agent.pt
[13:20:37] 🧠 Pretraining SentimentalAgent
  Epoch 005 | Loss: 0.017978
  Epoch 010 | Loss: 0.010186
  Epoch 015 | Loss: 0.005927
  Epoch 020 | Loss: 0.004743
✅ SentimentalAgent pretra

## 🔁 Stage 2: 상호 학습 (Mutual Learning)

에이전트들이 서로의 지식을 공유하여 성능을 향상시킵니다.


In [4]:
# Stage 2: 상호 학습
from core.debate_engine import mutual_learning, print_agent_input_shapes

print("🔁 Stage 2: 상호 학습 시작...")

# 상호 학습 전 성능 측정
print("📊 상호 학습 전 성능 측정...")
pre_mutual_performance = {}
for agent_name, agent in agents.items():
    with torch.no_grad():
        X_agent, y_agent = datasets[agent_name]
        predictions = agent.forward(X_agent)
        mse = torch.mean((predictions - y_agent) ** 2).item()
        pre_mutual_performance[agent_name] = mse
        print(f"   - {agent_name}: MSE = {mse:.6f}")

# 상호 학습 실행
print(f"\n🚀 상호 학습 시작 (라운드: {MUTUAL_ROUNDS})...")
print_agent_input_shapes(agents, X_t, y_t)  # <- shape 확인용 디버깅 출력
mutual_learning(agents, X_t, y_t, rounds=MUTUAL_ROUNDS)

# 상호 학습 후 성능 측정
print("\n📊 상호 학습 후 성능 측정...")
post_mutual_performance = {}
for agent_name, agent in agents.items():
    with torch.no_grad():
        X_agent, y_agent = datasets[agent_name]
        predictions = agent.forward(X_agent)
        mse = torch.mean((predictions - y_agent) ** 2).item()
        post_mutual_performance[agent_name] = mse
        improvement = ((pre_mutual_performance[agent_name] - mse) / pre_mutual_performance[agent_name]) * 100
        print(f"   - {agent_name}: MSE = {mse:.6f} (개선: {improvement:+.2f}%)")

print("\n✅ Stage 2 완료!")


🔁 Stage 2: 상호 학습 시작...
📊 상호 학습 전 성능 측정...
   - technical: MSE = 0.002538
   - fundamental: MSE = 0.002556


   - sentimental: MSE = 0.004498

🚀 상호 학습 시작 (라운드: 3)...
🔍 Agent별 입력 데이터 shape 확인:
  📥 X shape: torch.Size([476, 7, 10]) / y shape: torch.Size([476, 1])
  - TechnicalAgent: ✅ 출력 shape = torch.Size([476, 1])
  - FundamentalAgent: ❌ forward 실패 → input.size(-1) must be equal to input_size. Expected 16, got 10
  - SentimentalAgent: ❌ forward 실패 → mat1 and mat2 shapes cannot be multiplied (3332x10 and 8x64)
[13:20:48] 🔁 Stage 2: Mutual Learning Start


RuntimeError: input.size(-1) must be equal to input_size. Expected 16, got 10

## 💬 Stage 3: 토론 및 합의 (Debate & Consensus)

에이전트들이 토론을 통해 최종 예측을 도출합니다.


In [None]:
# Stage 3: 토론 및 합의
from core.orchestrator import run_debate_rounds

print("💬 Stage 3: 토론 및 합의 시작...")

# 토론 실행
print(f"🚀 토론 시작 (라운드: {DEBATE_ROUNDS})...")
debate_results = run_debate_rounds(agents, TICKER, max_rounds=DEBATE_ROUNDS)

print("\n📊 토론 결과:")
if debate_results:
    for round_num, round_result in enumerate(debate_results, 1):
        print(f"\n🔄 라운드 {round_num}:")
        if 'predictions' in round_result:
            for agent_name, prediction in round_result['predictions'].items():
                print(f"   - {agent_name}: {prediction:.4f}")
        if 'consensus' in round_result:
            print(f"   - 합의: {round_result['consensus']:.4f}")
        if 'confidence' in round_result:
            print(f"   - 신뢰도: {round_result['confidence']:.4f}")
else:
    print("   ⚠️ 토론 결과를 가져올 수 없습니다.")

print("\n✅ Stage 3 완료!")


## 📊 최종 평가 및 시각화

전체 파이프라인의 성능을 평가하고 결과를 시각화합니다.


In [None]:
# 최종 평가
from core.evaluation import evaluate_agents, evaluate_consensus

print("📊 최종 평가 시작...")

# 개별 에이전트 평가
print("\n🤖 개별 에이전트 평가:")
evaluate_agents(agents, X_t, y_t)

# 합의 평가
print("\n🤝 합의 평가:")
evaluate_consensus(agents)

print("\n✅ 최종 평가 완료!")


In [None]:
# 성능 개선 시각화
print("📈 성능 개선 시각화...")

# 상호 학습 전후 성능 비교
if 'pre_mutual_performance' in locals() and 'post_mutual_performance' in locals():
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))
    
    # MSE 비교
    agents_list = list(pre_mutual_performance.keys())
    pre_mse = [pre_mutual_performance[agent] for agent in agents_list]
    post_mse = [post_mutual_performance[agent] for agent in agents_list]
    
    x = np.arange(len(agents_list))
    width = 0.35
    
    ax1.bar(x - width/2, pre_mse, width, label='상호 학습 전', alpha=0.8)
    ax1.bar(x + width/2, post_mse, width, label='상호 학습 후', alpha=0.8)
    ax1.set_xlabel('에이전트')
    ax1.set_ylabel('MSE')
    ax1.set_title('상호 학습 전후 MSE 비교')
    ax1.set_xticks(x)
    ax1.set_xticklabels(agents_list)
    ax1.legend()
    ax1.grid(True, alpha=0.3)
    
    # 개선율 계산
    improvements = [((pre - post) / pre) * 100 for pre, post in zip(pre_mse, post_mse)]
    colors = ['green' if imp > 0 else 'red' for imp in improvements]
    
    ax2.bar(agents_list, improvements, color=colors, alpha=0.7)
    ax2.set_xlabel('에이전트')
    ax2.set_ylabel('개선율 (%)')
    ax2.set_title('상호 학습 성능 개선율')
    ax2.grid(True, alpha=0.3)
    ax2.axhline(y=0, color='black', linestyle='-', alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    # 개선율 출력
    print("\n📊 상호 학습 성능 개선율:")
    for agent, improvement in zip(agents_list, improvements):
        print(f"   - {agent}: {improvement:+.2f}%")
else:
    print("⚠️ 상호 학습 성능 데이터가 없습니다.")


In [None]:
# 예측 결과 시각화
print("📊 예측 결과 시각화...")

# 최근 데이터로 예측 수행
recent_data = X_t[-10:]  # 최근 10개 샘플
recent_targets = y_t[-10:]

predictions = {}
for agent_name, agent in agents.items():
    with torch.no_grad():
        pred = agent.forward(recent_data)
        predictions[agent_name] = pred.numpy()

# 시각화
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(15, 10))

# 실제 vs 예측 비교
time_steps = range(len(recent_targets))
ax1.plot(time_steps, recent_targets.numpy(), 'o-', label='실제값', linewidth=2, markersize=6)
for agent_name, pred in predictions.items():
    ax1.plot(time_steps, pred, 's-', label=f'{agent_name} 예측', alpha=0.7, markersize=4)

ax1.set_xlabel('시간 단계')
ax1.set_ylabel('정규화된 가격')
ax1.set_title(f'{TICKER} 최근 예측 결과 비교')
ax1.legend()
ax1.grid(True, alpha=0.3)

# 예측 오차 분석
errors = {}
for agent_name, pred in predictions.items():
    error = np.abs(pred - recent_targets.numpy())
    errors[agent_name] = error
    ax2.plot(time_steps, error, 'o-', label=f'{agent_name} 오차', alpha=0.7, markersize=4)

ax2.set_xlabel('시간 단계')
ax2.set_ylabel('절대 오차')
ax2.set_title('예측 오차 분석')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# 오차 통계
print("\n📊 예측 오차 통계:")
for agent_name, error in errors.items():
    mae = np.mean(error)
    rmse = np.sqrt(np.mean(error**2))
    print(f"   - {agent_name}: MAE={mae:.4f}, RMSE={rmse:.4f}")

print("\n🎉 전체 파이프라인 테스트 완료!")


## 🔧 문제 해결 및 디버깅

만약 오류가 발생한다면, 다음 셀들을 사용하여 문제를 진단하고 해결할 수 있습니다.


In [None]:
# 데이터 차원 문제 진단
print("🔍 데이터 차원 문제 진단...")

# 각 에이전트가 기대하는 입력 차원 확인
for agent_name, agent in agents.items():
    print(f"\n🤖 {agent_name} Agent:")
    print(f"   - 모델 타입: {type(agent).__name__}")
    
    # 모델 구조 확인
    if hasattr(agent, 'lstm'):
        print(f"   - LSTM 입력 크기: {agent.lstm.input_size}")
    if hasattr(agent, 'tcn'):
        print(f"   - TCN 입력 크기: {agent.tcn.input_size}")
    if hasattr(agent, 'transformer'):
        print(f"   - Transformer 입력 크기: {agent.transformer.input_size}")
    
    # 실제 데이터 차원
    X_agent, y_agent = datasets[agent_name]
    print(f"   - 실제 데이터 차원: {X_agent.shape}")
    print(f"   - 피처 수: {X_agent.shape[2]}")

print("\n💡 해결 방법:")
print("   - 각 에이전트별로 적절한 데이터셋을 사용해야 합니다.")
print("   - Technical Agent: 10개 피처")
print("   - Fundamental Agent: 16개 피처") 
print("   - Sentimental Agent: 8개 피처")


In [None]:
# 개별 단계 테스트
print("🧪 개별 단계 테스트...")

# Stage 0만 테스트
print("\n📊 Stage 0 테스트 (데이터 수집):")
try:
    from core.preprocessing import build_dataset
    X_test, y_test, scaler_X_test, scaler_y_test = build_dataset("AAPL")  # 다른 티커로 테스트
    print(f"✅ Stage 0 성공: {X_test.shape}")
except Exception as e:
    print(f"❌ Stage 0 실패: {e}")

# Stage 1만 테스트 (단일 에이전트)
print("\n🧠 Stage 1 테스트 (단일 에이전트 훈련):")
try:
    from agents.technical_agent import TechnicalAgent
    from core.training import pretrain_agent
    
    test_agent = TechnicalAgent("TestAgent")
    X_small = X_t[:10]  # 작은 데이터셋으로 테스트
    y_small = y_t[:10]
    
    pretrain_agent(test_agent, X_small, y_small, epochs=2)
    print("✅ Stage 1 성공")
except Exception as e:
    print(f"❌ Stage 1 실패: {e}")

print("\n💡 각 단계를 개별적으로 테스트하여 문제를 격리할 수 있습니다.")
