In [None]:
import requests
import pandas as pd
import numpy as np

# ======================================================
# 1. Fonction pour récupérer l'historique Bitcoin (prix + volume)
# ======================================================

def get_btc_history(days=365):
    """
    Récupère les prix et volumes BTC/EUR sur X jours (données daily).
    Retourne un DataFrame brut : timestamp, price, volume, date.
    """
    url = "https://api.coingecko.com/api/v3/coins/bitcoin/market_chart"
    params = {"vs_currency": "eur", "days": days}

    r = requests.get(url, params=params)
    data = r.json()

    prices = data["prices"]          # [timestamp_ms, price]
    volumes = data["total_volumes"]  # [timestamp_ms, volume]

    df_price = pd.DataFrame(prices, columns=["timestamp", "price"])
    df_vol = pd.DataFrame(volumes, columns=["timestamp", "volume"])

    df = df_price.copy()
    df["volume"] = df_vol["volume"]
    df["time"] = pd.to_datetime(df["timestamp"], unit="ms")
    df["date"] = df["time"].dt.date

    return df[["date", "price", "volume"]]


# ======================================================
# 2. Calcul des 10 features pour le machine learning
# ======================================================

def add_features(df):
    df = df.copy()

    # Variation 1 jour (%)
    df["return_1d"] = df["price"].pct_change() * 100

    # Variation 3 jours (%)
    df["return_3d"] = df["price"].pct_change(3) * 100

    # Variation 7 jours (%)
    df["return_7d"] = df["price"].pct_change(7) * 100

    # Moyenne mobile 7 jours
    df["MA7"] = df["price"].rolling(window=7).mean()

    # Moyenne mobile 30 jours
    df["MA30"] = df["price"].rolling(window=30).mean()

    # Différence entre MA7 et MA30
    df["MA_diff"] = df["MA7"] - df["MA30"]

    # Volatilité 7 jours (écart-type des rendements)
    df["vol_7d"] = df["return_1d"].rolling(window=7).std()

    # Moyenne mobile du volume (7 jours)
    df["vol_MA7"] = df["volume"].rolling(window=7).mean()

    # Plus haut & plus bas 30 jours
    df["highest_30"] = df["price"].rolling(30).max()
    df["lowest_30"] = df["price"].rolling(30).min()

    # Position dans le canal (0 = bas, 1 = haut)
    df["pos_channel_30"] = (
        (df["price"] - df["lowest_30"]) /
        (df["highest_30"] - df["lowest_30"])
    )

    # Nettoyage des débuts (où il manque des valeurs)
    df = df.dropna().reset_index(drop=True)

    return df


# ======================================================
# 3. Construction du dataset final
# ======================================================

def build_dataset(days=365):
    df_raw = get_btc_history(days)
    df_feat = add_features(df_raw)
    return df_feat

df = build_dataset(365)