# üìä Analyse et Visualisation des Donn√©es Crypto Bot

Ce notebook permet d'analyser et visualiser les donn√©es OHLCV collect√©es par le Crypto Bot.

In [2]:
# Configuration initiale
import os
import pandas as pd
import numpy as np
import sqlite3
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime

# Configuration des styles
plt.style.use('seaborn-v0_8-dark')
sns.set_theme(style='whitegrid')
pd.set_option('display.max_columns', None)

print('‚úÖ Configuration termin√©e')
print('-'*45)


# Fonction pour afficher les statistiques et visualisations
def show_stats(df):
    # Statistiques descriptives
    print('Statistiques descriptives:')
    display(df.describe())
    print('-'*45)

    # Visualisation 1: √âvolution des prix
    plt.figure(figsize=(14, 7))

    # Filtrer pour un symbole
    symbol = 'BTCUSDT'
    df_btc = df[df['symbol'] == symbol].sort_values('timestamp')

    plt.plot(df_btc['timestamp'], df_btc['close'], label='Prix', color='blue')
    plt.title(f'√âvolution du prix {symbol}', fontsize=16)
    plt.xlabel('Date', fontsize=12)
    plt.ylabel('Prix (USD)', fontsize=12)
    plt.legend()
    plt.grid(True, alpha=0.3)
    plt.xticks(rotation=45)
    plt.tight_layout()
    plt.show()

    print('-'*45)

    # Visualisation 2: Distribution des variations
    plt.figure(figsize=(14, 7))
    sns.histplot(data=df, x='price_change_pct', hue='symbol', kde=True, bins=50)
    plt.title('Distribution des variations de prix (%)', fontsize=16)
    plt.xlabel('Variation de prix (%)', fontsize=12)
    plt.ylabel('Fr√©quence', fontsize=12)
    plt.grid(True, alpha=0.3)
    plt.show()

    print('-'*45)

    # Visualisation 3: Volume par symbole
    plt.figure(figsize=(14, 7))
    sns.boxplot(data=df, x='symbol', y='volume')
    plt.title('Distribution des volumes par symbole', fontsize=16)
    plt.xlabel('Symbole', fontsize=12)
    plt.ylabel('Volume', fontsize=12)
    plt.yscale('log')
    plt.grid(True, alpha=0.3)
    plt.show()

    print('-'*45)

    # Analyse par timeframe
    timeframe_stats = df.groupby('timeframe').agg({
        'volume': ['mean', 'sum'],
        'price_change_pct': ['mean', 'std'],
        'close': ['mean', 'min', 'max']
    }).reset_index()

    timeframe_stats.columns = ['timeframe', 'volume_mean', 'volume_sum', 
                               'price_change_mean', 'price_change_std', 
                               'close_mean', 'close_min', 'close_max']

    display(timeframe_stats)

    print('-'*45)   

# Connexion √† la base de donn√©es
db_path = 'data/processed/crypto_data.db'

if not os.path.exists(db_path):
    print(f'‚ùå Base de donn√©es introuvable: {db_path}')
else:
    conn = sqlite3.connect(db_path)
    print('‚úÖ Connexion √©tablie')
    
    # Charger les donn√©es
    df = pd.read_sql_query('SELECT * FROM ohlcv', conn)
    print(f'üìä {len(df)} enregistrements charg√©s')
    
    # Convertir les timestamps
    df['timestamp'] = pd.to_datetime(df['timestamp'])

if df.empty:
    print('‚ö†Ô∏è  Aucune donn√©e disponible')
else:
    # Afficher un √©chantillon
    display(df.head(10))
    print('-'*45)
    show_stats(df)

# Fermer la connexion
conn.close()
print('‚úÖ Analyse termin√©e')


‚úÖ Configuration termin√©e
---------------------------------------------
‚úÖ Connexion √©tablie
üìä 0 enregistrements charg√©s
‚ö†Ô∏è  Aucune donn√©e disponible
‚úÖ Analyse termin√©e
