# 1. การเตรียมข้อมูล (Data Preparation)
## ขั้นตอนการดาวน์โหลดและประมวลผลข้อมูล Cryptocurrency สำหรับ RL Agent

### เป้าหมาย:
- ดาวน์โหลดข้อมูลราคา crypto จาก Yahoo Finance
- เพิ่ม Technical Indicators
- Normalize ข้อมูล
- บันทึกข้อมูลสำหรับใช้ในขั้นตอนต่อไป

## Cell 1: Import Libraries และ Setup

In [None]:
import sys
import warnings
warnings.filterwarnings('ignore')

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime
import os
import yfinance as yf
import torch
import pickle

# สร้างโฟลเดอร์สำหรับเก็บข้อมูล
DATA_DIR = "data"
PROCESSED_DIR = "processed_data"
for dir_name in [DATA_DIR, PROCESSED_DIR]:
    if not os.path.exists(dir_name):
        os.makedirs(dir_name)
print("📁 Setup directories completed")

## Cell 2: ดาวน์โหลดข้อมูล Cryptocurrency

In [None]:
SYMBOLS = ['BTC-USD', 'ETH-USD', 'BNB-USD', 'SOL-USD', 'ADA-USD']
START_DATE = '2022-01-01'
END_DATE = datetime.today().strftime('%Y-%m-%d')

def download_crypto_data(symbols, start, end):
    all_df = []
    for symbol in symbols:
        print(f"Downloading {symbol} ...")
        df = yf.download(symbol, start=start, end=end)
        if not df.empty:
            df['tic'] = symbol
            df['timestamp'] = df.index
            all_df.append(df)
    df = pd.concat(all_df)
    df = df.reset_index(drop=True)
    return df

raw_data = download_crypto_data(SYMBOLS, START_DATE, END_DATE)
raw_data.to_csv(os.path.join(DATA_DIR, 'crypto_data.csv'), index=False)
print(f"✅ Downloaded {len(raw_data)} rows of data")

## Cell 3: เพิ่ม Technical Indicators

In [None]:
def add_technical_indicators(df):
    df = df.copy()
    df['sma_20'] = df.groupby('tic')['Close'].transform(lambda x: x.rolling(window=20).mean())
    df['ema_20'] = df.groupby('tic')['Close'].transform(lambda x: x.ewm(span=20, adjust=False).mean())
    return df

processed_data = add_technical_indicators(raw_data)
processed_data.to_csv(os.path.join(PROCESSED_DIR, 'processed_crypto_data.csv'), index=False)
print(f"✅ Processed data shape: {processed_data.shape}")

## Cell 4: Data Visualization

In [None]:
plt.figure(figsize=(12, 6))
for symbol in SYMBOLS:
    symbol_data = processed_data[processed_data['tic'] == symbol]
    plt.plot(pd.to_datetime(symbol_data['timestamp']), symbol_data['Close'], label=symbol)
plt.title('Crypto Close Prices')
plt.legend()
plt.show()