In [39]:
import pandas as pd
import requests
from datetime import datetime, timedelta
import time
import zipfile
from io import BytesIO
import warnings
from ipywidgets import FloatProgress, HTML, VBox, IntSlider, Button, HBox, Label, Output
from ipywidgets import Dropdown, DatePicker
from IPython.display import display, clear_output

# Widget pour s√©lectionner le symbole
symbol_dropdown = Dropdown(
    options=['BTCUSDT', 'ETHUSDT'],
    value='BTCUSDT',
    description='Symbole:',
    style={'description_width': 'initial'},
    layout={'width': '200px'}
)
duree_slider = IntSlider(
    value=365,
    min=1,
    max=730,
    step=1,
    description='Dur√©e (jours):',
    style={'description_width': 'initial'},
    layout={'width': '200px'}
)

# Widget pour s√©lectionner l'intervalle
from ipywidgets import Dropdown
interval_dropdown = Dropdown(
    options=['1m', '5m', '15m', '30m', '1h', '2h', '4h', '6h', '8h', '12h', '1d', '3d', '1w', '1M'],
    value='1h',
    description='Intervalle:',
    style={'description_width': 'initial'},
    layout={'width': '200px'}
)

# Widget pour s√©lectionner la date de fin
end_date_picker = DatePicker(
    description='Date de fin:',
    value=datetime.now().date(),
    style={'description_width': 'initial'},
    layout={'width': '200px'}
)

# Widget pour s√©lectionner la p√©riode de la moyenne mobile
ma_period_slider = IntSlider(
    value=24,
    min=2,
    max=200,
    step=1,
    description='MA P√©riode:',
    style={'description_width': 'initial'},
    layout={'width': '200px'}
)

# Widget pour s√©lectionner le nombre de pics FFT
top_freq_slider = IntSlider(
    value=200,
    min=1,
    max=500,
    step=1,
    description='FFT Pics:',
    style={'description_width': 'initial'},
    layout={'width': '200px'}
)

# Bouton pour lancer le t√©l√©chargement
download_button = Button(
    description='T√©l√©charger',
    button_style='primary',
    tooltip='Cliquez pour lancer le t√©l√©chargement des donn√©es Binance Vision'
)

# Bouton pour lancer la visualisation
visualize_button = Button(
    description='Visualiser',
    button_style='success',
    tooltip='Cliquez pour afficher les graphiques d\'analyse (n√©cessite des donn√©es t√©l√©charg√©es)',
    disabled=True  # D√©sactiv√© par d√©faut
)

# Zone de sortie pour les messages
output_area = Output()

# Variables globales (seront mises √† jour par les widgets)
DUREE_JOURS = duree_slider.value
INTERVAL = interval_dropdown.value
SYMBOL = symbol_dropdown.value
END_DATE = end_date_picker.value.strftime('%Y-%m-%d') if end_date_picker.value else datetime.now().strftime('%Y-%m-%d')
MA_PERIOD = ma_period_slider.value
TOP_FREQUENCIES = top_freq_slider.value

# Initialiser les variables globales pour √©viter les erreurs
btc_data = []
df_btc = pd.DataFrame()

# Fonction callback pour le bouton de t√©l√©chargement
def on_download_click(b):
    global DUREE_JOURS, INTERVAL, btc_data, df_btc
    
    # D√©sactiver le bouton et changer son texte pendant le t√©l√©chargement
    original_button_text = download_button.description
    download_button.description = '‚è≥ T√©l√©chargement...'
    download_button.disabled = True
    
    try:
        with output_area:
            clear_output(wait=True)
            print("üì• T√©l√©chargement des donn√©es en cours...")
            print(f"Symbole: {symbol_dropdown.value}, Dur√©e: {duree_slider.value} jours")
            print()
            
            # Mettre √† jour les variables globales
            DUREE_JOURS = duree_slider.value
            INTERVAL = interval_dropdown.value
            SYMBOL = symbol_dropdown.value
            END_DATE = end_date_picker.value.strftime('%Y-%m-%d') if end_date_picker.value else datetime.now().strftime('%Y-%m-%d')
            
            # Lancer le t√©l√©chargement
            btc_data = download_binance_vision_data(SYMBOL, INTERVAL, DUREE_JOURS)
            
            # Cr√©er le DataFrame
            df_btc = create_dataframe(btc_data, SYMBOL)
            
            if len(df_btc) > 0:
                print("‚úÖ T√©l√©chargement termin√© avec succ√®s!")
                print(f"Donn√©es r√©cup√©r√©es: {len(df_btc)} p√©riodes")
                print(f"P√©riode: {df_btc.index.min()} √† {df_btc.index.max()}")
                # Activer le bouton de visualisation
                visualize_button.disabled = False
                print("\nüîÑ G√©n√©ration automatique de la visualisation...")
                print()
                
                # Lancer automatiquement la visualisation
                clear_output(wait=True)
                create_visualization()
            else:
                print("\n‚ùå √âchec du t√©l√©chargement - Aucune donn√©e r√©cup√©r√©e")
                visualize_button.disabled = True
    finally:
        # R√©activer le bouton et remettre le texte original
        download_button.description = original_button_text
        download_button.disabled = False

# Fonction callback pour le bouton de visualisation
def on_visualize_click(b):
    global df_btc
    
    # D√©sactiver le bouton et changer son texte pendant le calcul
    original_button_text = visualize_button.description
    visualize_button.description = '‚è≥ Calcul en cours...'
    visualize_button.disabled = True
    
    try:
        with output_area:
            clear_output(wait=True)
            print("üîÑ G√©n√©ration des visualisations en cours...")
            print(f"Analyse de {len(df_btc)} p√©riodes de {symbol_dropdown.value}")
            print()
            
            # Ex√©cuter la visualisation
            create_visualization()
            
            print("‚úÖ Visualisation termin√©e !")
    finally:
        # R√©activer le bouton et remettre le texte original
        visualize_button.description = original_button_text
        visualize_button.disabled = False

# Fonction pour cr√©er les visualisations
def create_visualization():
    global MA_PERIOD, TOP_FREQUENCIES  # Acc√©der aux variables globales
    
    import plotly.graph_objects as go
    from plotly.subplots import make_subplots
    import numpy as np
    import pywt  # PyWavelets pour l'analyse par ondelettes

    # Param√®tres configurables
    # MA_PERIOD et TOP_FREQUENCIES sont maintenant d√©finis globalement par les widgets

    if len(df_btc) > 0:
        print("üìä Calcul des moyennes mobiles...")
        # Calculer la moyenne mobile sur les MA_PERIOD derni√®res p√©riodes
        df_btc[f'ma_{MA_PERIOD}'] = df_btc['close'].rolling(window=MA_PERIOD).mean()
        # D√©calage vers la gauche pour aligner (la fin des donn√©es n'est pas importante)
        decalage = MA_PERIOD // 2
        df_btc[f'ma_{MA_PERIOD}_shifted'] = df_btc[f'ma_{MA_PERIOD}'].shift(-decalage)

        # Calculer la diff√©rence entre close et la MA d√©cal√©e
        df_btc['diff_close_ma'] = df_btc['close'] - df_btc[f'ma_{MA_PERIOD}_shifted']

        # S√©rie de diff√©rences (sans NaN)
        diff_series = df_btc['diff_close_ma'].dropna()
        difference_values = diff_series.values

        # --- Cr√©ation de quatre subplots empil√©s (prix+volume, diff temporelle, ondelettes, spectre) ---
        # Le premier subplot aura un axe Y secondaire pour le volume
        fig = make_subplots(
            rows=4,
            cols=1,
            shared_xaxes=False,  # On va g√©rer manuellement la synchronisation
            vertical_spacing=0.08,  # Augment√© pour √©viter le d√©bordement des labels X
            specs=[[{"secondary_y": True}],   # Axe Y secondaire pour le volume
                   [{"secondary_y": False}], 
                   [{"secondary_y": False}],  # Ondelettes
                   [{"secondary_y": False}]],
            subplot_titles=('Prix, Moyenne Mobile & Volume', 'Diff√©rence (Close - MA) + FFT Reconstruction', 'Ondelettes sur Diff√©rence', 'Spectre FFT (P√©riodes)')
        )

        # Prix + MA sur la premi√®re rang√©e (row=1) - axe Y primaire
        fig.add_trace(
            go.Scatter(x=df_btc.index, y=df_btc['close'], mode='lines', name=f"{symbol_dropdown.value} Close", line=dict(color='#00c851', width=1)),
            row=1,
            col=1,
            secondary_y=False,
        )
        fig.add_trace(
            go.Scatter(x=df_btc.index, y=df_btc[f'ma_{MA_PERIOD}_shifted'], mode='lines', name=f"MA {MA_PERIOD} (shifted)", line=dict(color='blue', width=1)),
            row=1,
            col=1,
            secondary_y=False,
        )

        # Volume sur la premi√®re rang√©e (row=1) - axe Y secondaire
        fig.add_trace(
            go.Scatter(x=df_btc.index, y=df_btc['volume'], mode='lines', name='Volume', line=dict(color='green', width=1), opacity=0.3),
            row=1,
            col=1,
            secondary_y=True,
        )

        # Diff√©rence sur la deuxi√®me rang√©e (row=2)
        fig.add_trace(
            go.Scatter(x=df_btc.index, y=df_btc['diff_close_ma'], mode='lines', name='Close - MA (shifted)', line=dict(color='red', width=1)),
            row=2,
            col=1,
        )

        # === ANALYSE PAR ONDELETTES MORLET (alternative √† Daubechies) ===
        print("üåä Analyse par ondelettes en cours...")
        try:
            # Pr√©parer les donn√©es pour l'analyse par ondelettes (utiliser le signal de diff√©rence)
            # Utiliser la diff√©rence Close - MA pour analyser les d√©viations par rapport √† la tendance
            signal = df_btc['diff_close_ma'].dropna().values
            time_index = df_btc['diff_close_ma'].dropna().index
            
            # R√©duire le signal pour √©viter des calculs trop lourds
            max_signal_length = 1024  # Limiter pour performance
            if len(signal) > max_signal_length:
                step = len(signal) // max_signal_length
                signal = signal[::step]
                time_index = time_index[::step]
            
            # Param√®tres pour l'analyse par ondelettes optimis√©s pour basses fr√©quences
            wavelet = 'morl'  # Ondelette de Morlet (alternative √† Daubechies)
            # √âtendre la plage d'√©chelles vers les grandes valeurs pour capturer les basses fr√©quences
            scales = np.geomspace(1, 256, 80)  # Plus d'√©chelles avec extension vers 256
            
            # Calculer la transform√©e en ondelettes continue (CWT)
            coefficients, frequencies = pywt.cwt(signal, scales, wavelet)
            
            # Calculer les pseudo-fr√©quences pour Morlet
            # Pour Morlet, la fr√©quence est approximativement 1/scale
            pseudo_frequencies = 1.0 / scales  # Fr√©quence inversement proportionnelle √† l'√©chelle
            
            # Cr√©er le scalogramme avec normalisation logarithmique pour am√©liorer le contraste des basses fr√©quences
            scalogram = np.abs(coefficients)
            
            # Normalisation logarithmique pour accentuer les faibles amplitudes (basses fr√©quences)
            # Ajouter une petite constante pour √©viter log(0)
            epsilon = np.max(scalogram) * 1e-6
            scalogram_log = np.log10(scalogram + epsilon)
            
            # Afficher toutes les fr√©quences (pas de filtrage)
            scales_filtered = scales
            pseudo_frequencies_filtered = pseudo_frequencies
            scalogram_filtered = scalogram_log
            
            # Ajouter le scalogramme comme heatmap avec colormap optimis√©e pour le contraste
            fig.add_trace(
                go.Heatmap(
                    x=time_index,
                    y=scales_filtered,
                    z=scalogram_filtered,
                    colorscale='Plasma',  # Plasma offre un meilleur contraste pour les faibles valeurs
                    name='Ondelettes Morlet',
                    showscale=True,
                    colorbar=dict(title="Log Amplitude", x=1.02, len=0.2, y=0.4)
                ),
                row=3,
                col=1
            )
            
            #print(f"Analyse ondelettes r√©ussie !")
            #print(f"Wavelet: {wavelet} (Morlet)")
            #print(f"Signal analys√©: Diff√©rence (Close - MA) pour capturer les d√©viations")
            #print(f"Nombre d'√©chelles totales: {len(scales)}")
            #print(f"Nombre d'√©chelles affich√©es: {len(scales_filtered)}")
            #print(f"Points de signal: {len(signal)}")
            #print(f"Plage de fr√©quences affich√©es: {pseudo_frequencies_filtered.min():.6f} - {pseudo_frequencies_filtered.max():.6f}")
            #print(f"√âchelles affich√©es: {scales_filtered.min():.1f} - {scales_filtered.max():.1f}")
            #print(f"Normalisation: Logarithmique (log10) pour am√©liorer contraste")
            
        except Exception as e:
            print(f'Erreur analyse ondelettes: {e}')
            import traceback
            traceback.print_exc()
            # Afficher un message sur le graphique en cas d'erreur
            fig.add_annotation(text=f'Erreur ondelettes: {str(e)[:50]}', xref='paper', yref='paper', x=0.5, y=0.4, showarrow=False, row=3, col=1)

        # Ajout d'une analyse de Fourier (FFT) sur la s√©rie de diff√©rences
        print("üìà Analyse FFT en cours...")
        try:
            N = len(difference_values)
            if N >= 4:
                # Detrend simple: retirer la moyenne
                vals = difference_values - np.mean(difference_values)
                # FFT (real-valued optimis√©e)
                fft_vals = np.fft.rfft(vals)
                fft_freqs = np.fft.rfftfreq(N, d=1.0)  # cycles per sample
                fft_amp = np.abs(fft_vals)

                # Convertir fr√©quence -> p√©riode (en nombre d'√©chantillons). On ignore la fr√©quence 0 (DC) pour la p√©riode.
                nonzero = fft_freqs > 0
                periods = np.full_like(fft_freqs, np.nan, dtype=float)
                periods[nonzero] = 1.0 / fft_freqs[nonzero]

                # Pr√©parer donn√©es pour affichage (exclure DC et utiliser les p√©riodes pour une meilleure visualisation)
                plot_mask = nonzero
                plot_periods = periods[plot_mask]  # Utiliser les p√©riodes (plus intuitif que les fr√©quences)
                plot_amp = fft_amp[plot_mask]

                # Afficher toutes les p√©riodes (pas de filtrage)

                # Tracer le spectre (Amplitude) en fonction de la p√©riode - SUR LA 4√®me RANG√âE
                fig.add_trace(
                    go.Scatter(x=plot_periods, y=plot_amp, mode='lines', name='FFT Amplitude', line=dict(color='purple', width=1)),
                    row=4,
                    col=1,
                )

                #print(f"FFT - Spectre complet affich√©")
                #print(f"Nombre de fr√©quences analys√©es: {len(plot_periods)}")
                #print(f"Plage de p√©riodes: {plot_periods.min():.1f}h - {plot_periods.max():.1f}h")
                #print(f"P√©riodes principales (heures): {', '.join([f'{p:.1f}' for p in sorted(plot_periods[np.argsort(plot_amp)[-5:][::-1]])])}")

                # Reconstruction avec filtre des top fr√©quences dominantes
                try:
                    # Reconstruction compl√®te (sans filtrage)
                    recon_full = np.fft.irfft(fft_vals, n=N)
                    recon_full = recon_full + np.mean(difference_values)
                    
                    # Filtre pour garder seulement les top N pics dominants
                    fft_vals_filtered = np.zeros_like(fft_vals)
                    # Garder la composante DC (fr√©quence 0)
                    fft_vals_filtered[0] = fft_vals[0]
                    
                    # Identifier les top N pics (excluant DC)
                    if len(fft_amp) > 1:
                        k = min(TOP_FREQUENCIES, len(fft_amp) - 1)  # -1 pour exclure DC
                        # Indices des top k amplitudes (excluant DC √† l'index 0)
                        top_idx = np.argsort(fft_amp[1:])[-k:] + 1  # +1 pour compenser l'exclusion de DC
                        # Garder seulement ces fr√©quences
                        fft_vals_filtered[top_idx] = fft_vals[top_idx]
                    
                    # Reconstruction filtr√©e
                    recon_filtered = np.fft.irfft(fft_vals_filtered, n=N)
                    recon_filtered = recon_filtered + np.mean(difference_values)
                    
                    # Mesures d'erreur pour les deux reconstructions
                    mse_full = np.mean((recon_full - difference_values)**2)
                    mse_filtered = np.mean((recon_filtered - difference_values)**2)
                    max_err_full = np.max(np.abs(recon_full - difference_values))
                    max_err_filtered = np.max(np.abs(recon_filtered - difference_values))
                    
                    # Tracer la reconstruction filtr√©e (top N)
                    fig.add_trace(
                        go.Scatter(x=diff_series.index, y=recon_filtered, mode='lines', name=f'Reconstruction top {TOP_FREQUENCIES}', line=dict(color='orange', width=1)),
                        row=2, col=1
                    )
                    
                    #print(f"FFT - Reconstruction compl√®te - MSE: {mse_full:.3e}, Max Error: {max_err_full:.3e}")
                    #print(f"FFT - Reconstruction top {TOP_FREQUENCIES} - MSE: {mse_filtered:.3e}, Max Error: {max_err_filtered:.3e}")
                    
                except Exception as e:
                    print(f"Erreur reconstruction: {e}")

                # Annoter les pics dominants (top N) pour aider l'interpr√©tation - SUR LA 4√®me RANG√âE
                try:
                    k = TOP_FREQUENCIES  # Utiliser exactement TOP_FREQUENCIES pour les annotations
                    top_idx = np.argsort(plot_amp)[-k:][::-1]
                    top_periods = plot_periods[top_idx]  # Utiliser les p√©riodes
                    top_amp = plot_amp[top_idx]
                    # Ajouter des marqueurs (sans labels)
                    fig.add_trace(
                        go.Scatter(x=top_periods, y=top_amp, mode='markers', marker=dict(color='red', size=6), showlegend=False),
                        row=4,
                        col=1
                    )
                except Exception:
                    pass
            else:
                # Trop peu de points pour une FFT fiable - SUR LA 4√®me RANG√âE
                fig.add_annotation(text='N trop petit pour FFT', xref='paper', yref='paper', x=0.5, y=0.05, showarrow=False, row=4, col=1)
        except Exception as e:
            print('Erreur FFT:', e)

        # Ajouter une ligne horizontale fine et pointill√©e (y=0) sur la rang√©e des diff√©rences (row=2)
        try:
            fig.add_hline(y=0, line=dict(color='gray', dash='dot', width=1), row=2, col=1)
        except Exception:
            try:
                fig.add_shape(
                    type='line',
                    x0=df_btc.index.min(), x1=df_btc.index.max(),
                    y0=0, y1=0,
                    xref='x', yref='y',
                    line=dict(color='gray', dash='dot', width=1),
                    row=2, col=1,
                )
            except Exception:
                pass

        # Layout improvements
        fig.update_layout(
            height=1600,  # Augment√© pour 4 graphiques
            showlegend=False,
            legend=dict(orientation='h', yanchor='bottom', y=1.02, xanchor='right', x=1),
            hovermode='x unified',
            # title_text=f"{symbol_dropdown.value} ({DUREE_JOURS}d @ {INTERVAL}) - Close, MA {MA_PERIOD}, Volume, Diff, Ondelettes & FFT", 
            margin=dict(l=60, r=60, t=80, b=120),
        )

        # Axis labels: row 1 = Price (primaire) + Volume (secondaire), row 2 = Diff, row 3 = Ondelettes, row 4 = FFT
        fig.update_yaxes(title_text='Price', row=1, col=1, secondary_y=False)
        fig.update_yaxes(title_text='Volume', row=1, col=1, secondary_y=True)
        fig.update_yaxes(title_text='Diff', row=2, col=1)
        fig.update_yaxes(title_text='P√©riode (heures)', row=3, col=1, type='log')  # √âchelle logarithmique pour les p√©riodes
        fig.update_yaxes(title_text='Amplitude', row=4, col=1)

        # Configure X-axis appearance for datetime subplot
        date_xargs = dict(type='date', tickformat="%Y-%m-%d\n%H:%M", tickangle=-45, tickfont=dict(size=10), nticks=8, ticks='outside', showgrid=False, showticklabels=True, title_standoff=20)
        try:
            x0 = df_btc.index.min()
            x1 = df_btc.index.max()
            
            # Synchroniser les axes X des trois premiers graphiques (row 1, 2 et 3)
            # Les trois auront la m√™me plage et seront li√©s pour le zoom/pan
            fig.update_xaxes(range=[x0, x1], title_text='', matches='x3', **date_xargs, row=1, col=1)
            fig.update_xaxes(range=[x0, x1], title_text='', matches='x3', **date_xargs, row=2, col=1)
            fig.update_xaxes(range=[x0, x1], title_text='', **date_xargs, row=3, col=1)
            
        except Exception:
            fig.update_xaxes(title_text='Time', **date_xargs, row=3, col=1)

        # X-axis pour le spectre: p√©riode en heures (plus intuitif que fr√©quence) - SUR LA 4√®me RANG√âE
        try:
            fig.update_xaxes(title_text='P√©riode (heures)', row=4, col=1, type='linear')
        except Exception:
            pass

        # Affichage simple
        print("üìä Affichage du graphique...")
        try:
            fig.show(renderer='vscode')
        except Exception as e:
            print("Erreur: impossible d'afficher la figure avec le renderer 'vscode'.")
            print("D√©tail: ", str(e))

# Connecter les callbacks aux boutons
download_button.on_click(on_download_click)
visualize_button.on_click(on_visualize_click)

# Fonction pour mettre √† jour l'affichage de la configuration
def update_config_display():
    with output_area:
        clear_output(wait=False)
        #print("Configuration actuelle:")
        #print(f"- Symbole: {symbol_dropdown.value}")
        #print(f"- Dur√©e d'analyse: {duree_slider.value} jours")
        #print(f"- Intervalle: {interval_dropdown.value}")
        #print(f"- Date de fin: {end_date_picker.value.strftime('%Y-%m-%d') if end_date_picker.value else 'Non d√©finie'}")
        #print("\nCliquez sur 'T√©l√©charger les donn√©es' pour commencer.")

# Callback pour mettre √† jour l'affichage quand les sliders changent
def on_slider_change(change):
    #update_config_display()
    # Mettre √† jour les variables globales en temps r√©el
    global DUREE_JOURS, INTERVAL, SYMBOL, END_DATE, MA_PERIOD, TOP_FREQUENCIES
    DUREE_JOURS = duree_slider.value
    INTERVAL = interval_dropdown.value
    SYMBOL = symbol_dropdown.value
    END_DATE = end_date_picker.value.strftime('%Y-%m-%d') if end_date_picker.value else datetime.now().strftime('%Y-%m-%d')
    MA_PERIOD = ma_period_slider.value
    TOP_FREQUENCIES = top_freq_slider.value
    
    # Si les donn√©es sont d√©j√† charg√©es, mettre √† jour automatiquement la visualisation
    #if len(df_btc) > 0 and (change.owner == ma_period_slider or change.owner == top_freq_slider):
    #    with output_area:
    #        clear_output(wait=True)
    #        print(f"=== MISE √Ä JOUR DE LA VISUALISATION ===")
    #        print(f"Nouvelle p√©riode MA: {MA_PERIOD}, FFT Pics: {TOP_FREQUENCIES}")
    #        print()
    #        create_visualization()

duree_slider.observe(on_slider_change, names='value')
interval_dropdown.observe(on_slider_change, names='value')
symbol_dropdown.observe(on_slider_change, names='value')
end_date_picker.observe(on_slider_change, names='value')
ma_period_slider.observe(on_slider_change, names='value')
top_freq_slider.observe(on_slider_change, names='value')

# Cr√©er des labels s√©par√©s pour un meilleur alignement
symbol_label = Label(value='Symbole:', layout={'width': '120px'})
duree_label = Label(value='Dur√©e (jours):', layout={'width': '120px'})
interval_label = Label(value='Intervalle:', layout={'width': '120px'})
end_date_label = Label(value='Date de fin:', layout={'width': '120px'})
ma_period_label = Label(value='MA P√©riode:', layout={'width': '120px'})
top_freq_label = Label(value='FFT Pics:', layout={'width': '120px'})

# Supprimer les descriptions des widgets pour √©viter la duplication
symbol_dropdown.description = ''
duree_slider.description = ''
interval_dropdown.description = ''
end_date_picker.description = ''
ma_period_slider.description = ''
top_freq_slider.description = ''

# Cr√©er une seule "card" pour tous les contr√¥les
main_card = VBox([
    # Premi√®re ligne: Symbole
    HBox([symbol_label, symbol_dropdown], layout={'justify_content': 'flex-start'}),
    # Deuxi√®me ligne: Dur√©e
    HBox([duree_label, duree_slider], layout={'justify_content': 'flex-start'}),
    # Troisi√®me ligne: Intervalle
    HBox([interval_label, interval_dropdown], layout={'justify_content': 'flex-start'}),
    # Quatri√®me ligne: Date de fin
    HBox([end_date_label, end_date_picker], layout={'justify_content': 'flex-start'}),
    # Cinqui√®me ligne: MA P√©riode
    HBox([ma_period_label, ma_period_slider], layout={'justify_content': 'flex-start'}),
    # Sixi√®me ligne: FFT Pics
    HBox([top_freq_label, top_freq_slider], layout={'justify_content': 'flex-start'}),
    # Septi√®me ligne: Boutons (s√©par√©s par un peu d'espace)
    HBox([download_button, visualize_button], layout={'justify_content': 'flex-start', 'margin': '15px 0px 0px 0px'})
], layout={
    'border': '2px solid #e0e0e0',
    'border_radius': '8px',
    'padding': '15px',
    'margin': '10px 0px',
    'background_color': '#f8f9fa',
    'width': '100%'
})

display(main_card)
display(output_area)

# Affichage initial de la configuration
update_config_display()

warnings.filterwarnings('ignore')

def download_binance_vision_data(symbol=SYMBOL, interval=INTERVAL, days_back=DUREE_JOURS, end_date_str=None):

    # R√©solution de la date de fin
    if end_date_str is None:
        try:
            end_date_str = END_DATE  # variable globale d√©finie dans la cellule de config
        except NameError:
            end_date_str = None

    if end_date_str:
        try:
            end_date = datetime.strptime(end_date_str, '%Y-%m-%d')
        except Exception:
            print(f"Format END_DATE invalide: {end_date_str}. Utilisation de datetime.now().")
            end_date = datetime.now()
    else:
        end_date = datetime.now()

    # Calculer la date de d√©but
    start_date = end_date - timedelta(days=days_back)

    # Construire la liste des dates √† t√©l√©charger
    dates = []
    current_date = start_date
    while current_date <= end_date:
        dates.append(current_date.strftime('%Y-%m-%d'))
        current_date += timedelta(days=1)

    # Cr√©ation des widgets de progression
    progress_bar = FloatProgress(
        value=0,
        min=0,
        max=len(dates),
        bar_style='info',
        style={'bar_color': '#00c851'},
        orientation='horizontal'
    )
    
    # status_label = HTML(value=f"<b>Pr√©paration du t√©l√©chargement de {len(dates)} fichiers...</b>")
    
    # Conteneur pour afficher la barre de progression
    progress_widget = VBox([progress_bar])
    display(progress_widget)

    all_data = []
    success_count = 0
    total_periods = 0

    from concurrent.futures import ThreadPoolExecutor, as_completed

    def fetch_for_date(date_str):
        """T√©l√©charge et retourne un tuple (date_str, df_day or None, error_message or None, periods_count)"""
        url = f"https://data.binance.vision/data/spot/daily/klines/{symbol}/{interval}/{symbol}-{interval}-{date_str}.zip"
        try:
            # Petite trace locale (renvoy√©e pour agr√©gation)
            resp = requests.get(url, timeout=30)
            if resp.status_code == 200:
                with zipfile.ZipFile(BytesIO(resp.content)) as zip_file:
                    csv_filename = f"{symbol}-{interval}-{date_str}.csv"
                    if csv_filename in zip_file.namelist():
                        csv_content = zip_file.read(csv_filename)
                        df_day = pd.read_csv(BytesIO(csv_content), header=None, names=[
                            'timestamp', 'open', 'high', 'low', 'close', 'volume',
                            'close_time', 'quote_asset_volume', 'number_of_trades',
                            'taker_buy_base_asset_volume', 'taker_buy_quote_asset_volume', 'ignore'
                        ])
                        return (date_str, df_day, None, len(df_day))
                    else:
                        return (date_str, None, 'CSV not found in ZIP', 0)
            else:
                return (date_str, None, f'HTTP {resp.status_code}', 0)
        except requests.exceptions.RequestException:
            return (date_str, None, 'Network error', 0)
        except zipfile.BadZipFile:
            return (date_str, None, 'Bad ZIP', 0)
        except Exception as e:
            return (date_str, None, str(e)[:200], 0)

    # Param√®tres de parall√©lisme: limiter le nombre de threads raisonnablement
    max_workers = min(12, max(4, len(dates)))
    completed_count = 0

    with ThreadPoolExecutor(max_workers=max_workers) as exe:
        future_to_date = {exe.submit(fetch_for_date, d): d for d in dates}
        for fut in as_completed(future_to_date):
            date_str = future_to_date[fut]
            try:
                d, df_day, err, periods = fut.result()
                completed_count += 1
                
                # Mise √† jour de la barre de progression
                progress_bar.value = completed_count
                
                if df_day is not None:
                    # --- Normalisation des timestamps: uniformiser en microsecondes (us) ---
                    try:
                        # S'assurer que la colonne 'timestamp' existe et est num√©rique
                        if 'timestamp' not in df_day.columns:
                            # si les colonnes sont index√©es num√©riquement, la premi√®re colonne est le timestamp
                            df_day.rename(columns={0: 'timestamp'}, inplace=True)
                        df_day['timestamp'] = pd.to_numeric(df_day['timestamp'], errors='coerce')
                    except Exception:
                        pass

                    try:
                        # D√©tecter les timestamps inf√©rieurs au seuil (2025-01-01)
                        threshold_dt = datetime(2025, 1, 1)
                        # Seuil en millisecondes correspondant √† 2025-01-01
                        threshold_ms = int(threshold_dt.timestamp() * 1000)

                        # Heuristique: si la majorit√© des timestamps sont < threshold_ms*10, ils sont probablement en ms
                        max_ts = pd.to_numeric(df_day['timestamp'], errors='coerce').max()
                        if pd.notna(max_ts):
                            # Si le maximum observ√© est inf√©rieur √† threshold_ms * 10, on suppose que les valeurs sont en ms
                            if max_ts < threshold_ms * 10:
                                mask_ms = pd.to_numeric(df_day['timestamp'], errors='coerce') < (threshold_ms * 10)
                                if mask_ms.any():
                                    df_day.loc[mask_ms, 'timestamp'] = pd.to_numeric(df_day.loc[mask_ms, 'timestamp'], errors='coerce') * 1000
                    except Exception as e:
                        print(f"‚ö† Erreur lors de la normalisation des timestamps: {e}")

                    all_data.append(df_day)
                    success_count += 1
                    total_periods += periods
                    
            except Exception as e:
                completed_count += 1
                progress_bar.value = completed_count
               
    # Finalisation de la barre de progression
    progress_bar.bar_style = 'success' if success_count > 0 else 'danger'
   
    # Petit d√©lai global pour rester poli si n√©cessaire
    time.sleep(0.1)

    if all_data:
        # Combiner toutes les donn√©es
        combined_df = pd.concat(all_data, ignore_index=True)
        return combined_df.to_dict('records')
    else:
        print("Aucune donn√©e r√©cup√©r√©e via Binance Vision")
        return []

def create_dataframe(data, symbol_name):
    if not data:
        print(f"Aucune donn√©e disponible pour {symbol_name}")
        return pd.DataFrame()
        
    df = pd.DataFrame(data, columns=[
        'timestamp', 'open', 'high', 'low', 'close', 'volume',
        'close_time', 'quote_asset_volume', 'number_of_trades',
        'taker_buy_base_asset_volume', 'taker_buy_quote_asset_volume', 'ignore'
    ])
    
    # Conversion des types
    for col in ['open', 'high', 'low', 'close', 'volume']:
        df[col] = df[col].astype(float)
    
    # Gestion des timestamps - Binance Vision utilise diff√©rents formats
    timestamp_converted = False
    
    try:
        # Essai avec microsecondes (format attendu apr√®s normalisation)
        df['timestamp'] = pd.to_datetime(df['timestamp'], unit='us')
        timestamp_converted = True
        # print("‚úì Timestamps convertis depuis microsecondes")
    except (ValueError, pd.errors.OutOfBoundsDatetime, OverflowError):
        try:
            # Essai avec millisecondes (fallback)
            df['timestamp'] = pd.to_datetime(df['timestamp'], unit='ms')
            timestamp_converted = True
        except (ValueError, pd.errors.OutOfBoundsDatetime, OverflowError):
            try:
                # Essai avec secondes
                df['timestamp'] = pd.to_datetime(df['timestamp'], unit='s')
                timestamp_converted = True
            except (ValueError, pd.errors.OutOfBoundsDatetime, OverflowError):
                try:
                    # Si les valeurs sont trop grandes, diviser par 1000000 (microsecondes vers secondes)
                    df['timestamp'] = pd.to_datetime(df['timestamp'] / 1000000, unit='s')
                    timestamp_converted = True
                except (ValueError, pd.errors.OutOfBoundsDatetime, OverflowError):
                    print("‚úó Impossible de convertir les timestamps")

    if not timestamp_converted:
        print(f"‚úó Erreur: Impossible de traiter les timestamps pour {symbol_name}")
        return pd.DataFrame()
    
    # V√©rifier la plausibilit√© des dates
    min_date = df['timestamp'].min()
    max_date = df['timestamp'].max()
    
    if min_date.year < 2009 or max_date.year > 2030:
        print(f"‚ö† Dates suspectes d√©tect√©es: {min_date} √† {max_date}")
    
    df.set_index('timestamp', inplace=True)
    
    # Supprimer les doublons et trier
    df = df[~df.index.duplicated(keep='first')].sort_index()
    
    return df

VBox(children=(HBox(children=(Label(value='Symbole:', layout=Layout(width='120px')), Dropdown(layout=Layout(wi‚Ä¶

Output()