<a href="https://colab.research.google.com/github/Nekhaenko/test/blob/main/Untitled49.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:

import pandas as pd
import numpy as np
import ccxt
import talib
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

class CryptoDatasetCreator:
    def __init__(self, exchange_name='binance'):
        """
        Инициализация создателя датасета

        Args:
            exchange_name: Название биржи (по умолчанию binance)
        """
        self.exchange = getattr(ccxt, exchange_name)()
        self.features = []

    def fetch_ohlcv_data(self, symbol, timeframe='1h', limit=1000):
        """
        Получение OHLCV данных с биржи

        Args:
            symbol: Торговая пара (например, 'BTC/USDT')
            timeframe: Временной интервал ('1m', '5m', '15m', '1h', '4h', '1d')
            limit: Количество свечей

        Returns:
            DataFrame с OHLCV данными
        """
        try:
            ohlcv = self.exchange.fetch_ohlcv(symbol, timeframe, limit=limit)
            df = pd.DataFrame(ohlcv, columns=['timestamp', 'open', 'high', 'low', 'close', 'volume'])
            df['timestamp'] = pd.to_datetime(df['timestamp'], unit='ms')
            df.set_index('timestamp', inplace=True)
            return df
        except Exception as e:
            print(f"Ошибка получения данных: {e}")
            return None

    def add_technical_indicators(self, df):
        """
        Добавление технических индикаторов

        Args:
            df: DataFrame с OHLCV данными

        Returns:
            DataFrame с техническими индикаторами
        """
        # Преобразование в numpy arrays для talib
        high = df['high'].values
        low = df['low'].values
        close = df['close'].values
        volume = df['volume'].values

        # Трендовые индикаторы
        df['sma_20'] = talib.SMA(close, timeperiod=20)
        df['sma_50'] = talib.SMA(close, timeperiod=50)
        df['ema_12'] = talib.EMA(close, timeperiod=12)
        df['ema_26'] = talib.EMA(close, timeperiod=26)

        # MACD
        df['macd'], df['macd_signal'], df['macd_hist'] = talib.MACD(close)

        # RSI
        df['rsi'] = talib.RSI(close, timeperiod=14)

        # Bollinger Bands
        df['bb_upper'], df['bb_middle'], df['bb_lower'] = talib.BBANDS(close, timeperiod=20)
        df['bb_width'] = (df['bb_upper'] - df['bb_lower']) / df['bb_middle']
        df['bb_position'] = (close - df['bb_lower']) / (df['bb_upper'] - df['bb_lower'])

        # Stochastic
        df['stoch_k'], df['stoch_d'] = talib.STOCH(high, low, close)

        # Williams %R
        df['williams_r'] = talib.WILLR(high, low, close)

        # Average True Range
        df['atr'] = talib.ATR(high, low, close, timeperiod=14)

        # Volume indicators
        df['ad'] = talib.AD(high, low, close, volume)
        df['obv'] = talib.OBV(close, volume)

        # Momentum indicators
        df['momentum'] = talib.MOM(close, timeperiod=10)
        df['roc'] = talib.ROC(close, timeperiod=10)

        return df

    def add_price_features(self, df):
        """
        Добавление ценовых признаков

        Args:
            df: DataFrame с данными

        Returns:
            DataFrame с ценовыми признаками
        """
        # Ценовые изменения
        df['price_change'] = df['close'].pct_change()
        df['price_change_2'] = df['close'].pct_change(periods=2)
        df['price_change_5'] = df['close'].pct_change(periods=5)

        # Волатильность
        df['volatility'] = df['price_change'].rolling(window=20).std()

        # High-Low спред
        df['hl_spread'] = (df['high'] - df['low']) / df['close']

        # Close position в High-Low range
        df['close_position'] = (df['close'] - df['low']) / (df['high'] - df['low'])

        # Volume changes
        df['volume_change'] = df['volume'].pct_change()
        df['volume_sma'] = df['volume'].rolling(window=20).mean()
        df['volume_ratio'] = df['volume'] / df['volume_sma']

        return df

    def create_target_labels(self, df, future_periods=5, profit_threshold=0.02, loss_threshold=-0.01):
        """
        Создание целевых меток для обучения

        Args:
            df: DataFrame с данными
            future_periods: Количество периодов в будущее для анализа
            profit_threshold: Порог прибыли для положительного сигнала
            loss_threshold: Порог убытка для отрицательного сигнала

        Returns:
            DataFrame с целевыми метками
        """
        df['future_return'] = df['close'].shift(-future_periods) / df['close'] - 1

        # Создание меток классификации
        def classify_signal(future_return):
            if pd.isna(future_return):
                return 0  # Hold
            elif future_return >= profit_threshold:
                return 1  # Buy signal
            elif future_return <= loss_threshold:
                return -1  # Sell signal
            else:
                return 0  # Hold

        df['target'] = df['future_return'].apply(classify_signal)

        # Дополнительные целевые переменные
        df['max_future_return'] = df['high'].rolling(window=future_periods).max().shift(-future_periods) / df['close'] - 1
        df['min_future_return'] = df['low'].rolling(window=future_periods).min().shift(-future_periods) / df['close'] - 1

        return df

    def add_market_regime_features(self, df):
        """
        Добавление признаков рыночного режима

        Args:
            df: DataFrame с данными

        Returns:
            DataFrame с признаками рыночного режима
        """
        # Определение тренда
        df['trend_20'] = np.where(df['close'] > df['sma_20'], 1, -1)
        df['trend_50'] = np.where(df['close'] > df['sma_50'], 1, -1)

        # Strength of trend
        df['trend_strength'] = abs(df['close'] - df['sma_20']) / df['atr']

        # Market volatility regime
        df['vol_regime'] = pd.qcut(df['volatility'].rank(), q=3, labels=[0, 1, 2])

        # Volume regime
        df['vol_regime_volume'] = pd.qcut(df['volume_ratio'].rank(), q=3, labels=[0, 1, 2])

        return df

    def add_time_features(self, df):
        """
        Добавление временных признаков

        Args:
            df: DataFrame с данными

        Returns:
            DataFrame с временными признаками
        """
        df['hour'] = df.index.hour
        df['day_of_week'] = df.index.dayofweek
        df['month'] = df.index.month

        # Циклические признаки
        df['hour_sin'] = np.sin(2 * np.pi * df['hour'] / 24)
        df['hour_cos'] = np.cos(2 * np.pi * df['hour'] / 24)
        df['day_sin'] = np.sin(2 * np.pi * df['day_of_week'] / 7)
        df['day_cos'] = np.cos(2 * np.pi * df['day_of_week'] / 7)

        return df

    def create_dataset(self, symbol, timeframe='1h', limit=1000,
                      future_periods=5, profit_threshold=0.02, loss_threshold=-0.01):
        """
        Создание полного датасета для обучения модели

        Args:
            symbol: Торговая пара
            timeframe: Временной интервал
            limit: Количество свечей
            future_periods: Периоды для прогноза
            profit_threshold: Порог прибыли
            loss_threshold: Порог убытка

        Returns:
            DataFrame с готовым датасетом
        """
        print(f"Создание датасета для {symbol}...")

        # Получение исходных данных
        df = self.fetch_ohlcv_data(symbol, timeframe, limit)
        if df is None:
            return None

        print("Добавление технических индикаторов...")
        df = self.add_technical_indicators(df)

        print("Добавление ценовых признаков...")
        df = self.add_price_features(df)

        print("Создание целевых меток...")
        df = self.create_target_labels(df, future_periods, profit_threshold, loss_threshold)

        print("Добавление признаков рыночного режима...")
        df = self.add_market_regime_features(df)

        print("Добавление временных признаков...")
        df = self.add_time_features(df)

        # Удаление строк с NaN значениями
        df = df.dropna()

        print(f"Датасет создан. Размер: {df.shape}")
        print(f"Распределение целевых меток:")
        print(df['target'].value_counts().sort_index())

        return df

    def save_dataset(self, df, filename):
        """
        Сохранение датасета в файл

        Args:
            df: DataFrame для сохранения
            filename: Имя файла
        """
        df.to_csv(filename)
        print(f"Датасет сохранен в файл: {filename}")

    def get_feature_names(self, df):
        """
        Получение списка признаков для обучения

        Args:
            df: DataFrame с данными

        Returns:
            List с именами признаков
        """
        exclude_columns = ['open', 'high', 'low', 'close', 'volume',
                          'future_return', 'target', 'max_future_return', 'min_future_return']
        feature_columns = [col for col in df.columns if col not in exclude_columns]
        return feature_columns

# Пример использования
if __name__ == "__main__":
    # Создание экземпляра класса
    dataset_creator = CryptoDatasetCreator()

    # Список торговых пар для анализа
    symbols = ['BTC/USDT', 'ETH/USDT', 'BNB/USDT']

    for symbol in symbols:
        try:
            # Создание датасета
            df = dataset_creator.create_dataset(
                symbol=symbol,
                timeframe='1h',
                limit=2000,
                future_periods=5,
                profit_threshold=0.025,
                loss_threshold=-0.015
            )

            if df is not None:
                # Сохранение датасета
                filename = f"dataset_{symbol.replace('/', '_')}_{datetime.now().strftime('%Y%m%d')}.csv"
                dataset_creator.save_dataset(df, filename)

                # Показать признаки
                features = dataset_creator.get_feature_names(df)
                print(f"\nПризнаки для {symbol}:")
                for i, feature in enumerate(features, 1):
                    print(f"{i:2d}. {feature}")

                print("\n" + "="*50 + "\n")

        except Exception as e:
            print(f"Ошибка при обработке {symbol}: {e}")
            continue

ModuleNotFoundError: No module named 'ccxt'

In [None]:

import pandas as pd
import numpy as np
import ccxt
import talib
from datetime import datetime, timedelta
import warnings
from sklearn.preprocessing import StandardScaler, LabelEncoder
from concurrent.futures import ThreadPoolExecutor, as_completed
import time
import os
warnings.filterwarnings('ignore')

class UniversalCryptoDatasetCreator:
    def __init__(self, exchange_name='binance'):
        """
        Универсальный создатель датасета для множества криптовалют

        Args:
            exchange_name: Название биржи
        """
        self.exchange = getattr(ccxt, exchange_name)()
        self.scaler = StandardScaler()
        self.label_encoder = LabelEncoder()

    def get_top_crypto_pairs(self, base_currency='USDT', min_volume=1000000):
        """
        Получение списка топовых криптовалютных пар

        Args:
            base_currency: Базовая валюта
            min_volume: Минимальный объем торгов за 24ч

        Returns:
            List топовых торговых пар
        """
        try:
            markets = self.exchange.load_markets()
            tickers = self.exchange.fetch_tickers()

            # Фильтрация пар по базовой валюте и объему
            valid_pairs = []
            for symbol in markets:
                if symbol.endswith(f'/{base_currency}') and symbol in tickers:
                    ticker = tickers[symbol]
                    if ticker['quoteVolume'] and ticker['quoteVolume'] > min_volume:
                        valid_pairs.append({
                            'symbol': symbol,
                            'volume': ticker['quoteVolume'],
                            'base': symbol.split('/')[0]
                        })

            # Сортировка по объему
            valid_pairs.sort(key=lambda x: x['volume'], reverse=True)

            print(f"Найдено {len(valid_pairs)} подходящих торговых пар")
            return [pair['symbol'] for pair in valid_pairs[:50]]  # Топ 50

        except Exception as e:
            print(f"Ошибка получения списка пар: {e}")
            # Fallback к популярным парам
            return ['BTC/USDT', 'ETH/USDT', 'BNB/USDT', 'ADA/USDT', 'SOL/USDT',
                   'XRP/USDT', 'DOT/USDT', 'DOGE/USDT', 'AVAX/USDT', 'MATIC/USDT']

    def fetch_ohlcv_with_retry(self, symbol, timeframe='1h', limit=1000, max_retries=3):
        """
        Получение OHLCV данных с повторными попытками
        """
        for attempt in range(max_retries):
            try:
                ohlcv = self.exchange.fetch_ohlcv(symbol, timeframe, limit=limit)
                df = pd.DataFrame(ohlcv, columns=['timestamp', 'open', 'high', 'low', 'close', 'volume'])
                df['timestamp'] = pd.to_datetime(df['timestamp'], unit='ms')
                df.set_index('timestamp', inplace=True)
                df['symbol'] = symbol
                df['base_asset'] = symbol.split('/')[0]
                return df
            except Exception as e:
                print(f"Попытка {attempt + 1} для {symbol}: {e}")
                if attempt < max_retries - 1:
                    time.sleep(2 ** attempt)  # Экспоненциальная задержка
                continue
        return None

    def add_universal_technical_indicators(self, df):
        """
        Добавление технических индикаторов (универсальных для всех активов)
        """
        # Группировка по символам для корректного расчета индикаторов
        def calculate_indicators_for_group(group):
            high = group['high'].values
            low = group['low'].values
            close = group['close'].values
            volume = group['volume'].values

            if len(close) < 50:  # Минимум данных для расчета
                return group

            # Трендовые индикаторы
            group['sma_20'] = talib.SMA(close, timeperiod=20)
            group['sma_50'] = talib.SMA(close, timeperiod=50)
            group['ema_12'] = talib.EMA(close, timeperiod=12)
            group['ema_26'] = talib.EMA(close, timeperiod=26)

            # MACD
            group['macd'], group['macd_signal'], group['macd_hist'] = talib.MACD(close)

            # RSI
            group['rsi'] = talib.RSI(close, timeperiod=14)

            # Bollinger Bands
            group['bb_upper'], group['bb_middle'], group['bb_lower'] = talib.BBANDS(close, timeperiod=20)
            group['bb_width'] = (group['bb_upper'] - group['bb_lower']) / group['bb_middle']
            group['bb_position'] = (close - group['bb_lower']) / (group['bb_upper'] - group['bb_lower'])

            # Stochastic
            group['stoch_k'], group['stoch_d'] = talib.STOCH(high, low, close)

            # Williams %R
            group['williams_r'] = talib.WILLR(high, low, close)

            # ATR (нормализованный)
            group['atr'] = talib.ATR(high, low, close, timeperiod=14)
            group['atr_normalized'] = group['atr'] / close

            # Volume indicators
            group['obv'] = talib.OBV(close, volume)
            group['obv_normalized'] = group['obv'] / group['obv'].rolling(20).mean()

            # Momentum
            group['momentum'] = talib.MOM(close, timeperiod=10)
            group['roc'] = talib.ROC(close, timeperiod=10)

            return group

        return df.groupby('symbol').apply(calculate_indicators_for_group)

    def add_normalized_price_features(self, df):
        """
        Добавление нормализованных ценовых признаков
        """
        def calculate_price_features_for_group(group):
            # Процентные изменения (универсальны для любых цен)
            group['return_1'] = group['close'].pct_change()
            group['return_2'] = group['close'].pct_change(periods=2)
            group['return_5'] = group['close'].pct_change(periods=5)
            group['return_10'] = group['close'].pct_change(periods=10)

            # Волатильность
            group['volatility_20'] = group['return_1'].rolling(window=20).std()
            group['volatility_5'] = group['return_1'].rolling(window=5).std()

            # Нормализованные спреды
            group['hl_spread_norm'] = (group['high'] - group['low']) / group['close']
            group['oc_spread_norm'] = abs(group['open'] - group['close']) / group['close']

            # Позиция закрытия в дневном диапазоне
            group['close_position'] = (group['close'] - group['low']) / (group['high'] - group['low'])

            # Volume features (нормализованные)
            group['volume_sma_20'] = group['volume'].rolling(window=20).mean()
            group['volume_ratio'] = group['volume'] / group['volume_sma_20']
            group['volume_change'] = group['volume'].pct_change()

            # Цена относительно скользящих средних
            group['price_vs_sma20'] = (group['close'] - group['sma_20']) / group['sma_20']
            group['price_vs_sma50'] = (group['close'] - group['sma_50']) / group['sma_50']

            return group

        return df.groupby('symbol').apply(calculate_price_features_for_group)

    def add_cross_asset_features(self, df):
        """
        Добавление признаков, учитывающих корреляции между активами
        """
        # Рыночные индексы (среднее по топ активам)
        market_data = df.groupby(df.index).agg({
            'return_1': 'mean',
            'volatility_20': 'mean',
            'rsi': 'mean',
            'volume_ratio': 'mean'
        }).add_suffix('_market')

        df = df.join(market_data, how='left')

        # Относительная производительность
        df['relative_return'] = df['return_1'] - df['return_1_market']
        df['relative_volatility'] = df['volatility_20'] - df['volatility_20_market']
        df['relative_rsi'] = df['rsi'] - df['rsi_market']

        return df

    def add_asset_categories(self, df):
        """
        Добавление категорий активов для создания универсальных признаков
        """
        # Категоризация активов
        def categorize_asset(base_asset):
            # Можно расширить эти категории
            large_cap = ['BTC', 'ETH', 'BNB', 'ADA', 'XRP', 'SOL', 'DOT']
            defi_tokens = ['UNI', 'SUSHI', 'COMP', 'AAVE', 'CAKE', 'CRV']
            layer1 = ['BTC', 'ETH', 'ADA', 'SOL', 'DOT', 'AVAX', 'NEAR', 'ALGO']
            meme_coins = ['DOGE', 'SHIB', 'PEPE', 'FLOKI']

            if base_asset in large_cap:
                return 'large_cap'
            elif base_asset in defi_tokens:
                return 'defi'
            elif base_asset in layer1:
                return 'layer1'
            elif base_asset in meme_coins:
                return 'meme'
            else:
                return 'other'

        df['asset_category'] = df['base_asset'].apply(categorize_asset)

        # One-hot encoding для категорий
        category_dummies = pd.get_dummies(df['asset_category'], prefix='category')
        df = pd.concat([df, category_dummies], axis=1)

        return df

    def create_universal_targets(self, df, future_periods=5, profit_threshold=0.02, loss_threshold=-0.01):
        """
        Создание универсальных целевых меток
        """
        def create_targets_for_group(group):
            # Будущая доходность
            group['future_return'] = group['close'].shift(-future_periods) / group['close'] - 1

            # Максимальная и минимальная доходность в периоде
            group['max_future_return'] = group['high'].rolling(window=future_periods).max().shift(-future_periods) / group['close'] - 1
            group['min_future_return'] = group['low'].rolling(window=future_periods).min().shift(-future_periods) / group['close'] - 1

            # Классификационные метки
            def classify_signal(future_return):
                if pd.isna(future_return):
                    return 0
                elif future_return >= profit_threshold:
                    return 1  # Buy
                elif future_return <= loss_threshold:
                    return -1  # Sell
                else:
                    return 0  # Hold

            group['target'] = group['future_return'].apply(classify_signal)

            # Дополнительные целевые переменные
            group['profitable'] = (group['future_return'] > 0).astype(int)
            group['high_profit'] = (group['future_return'] > profit_threshold).astype(int)

            return group

        return df.groupby('symbol').apply(create_targets_for_group)

    def fetch_multiple_symbols(self, symbols, timeframe='1h', limit=1000, max_workers=5):
        """
        Параллельное получение данных для множества символов
        """
        all_data = []

        with ThreadPoolExecutor(max_workers=max_workers) as executor:
            # Отправка задач
            future_to_symbol = {
                executor.submit(self.fetch_ohlcv_with_retry, symbol, timeframe, limit): symbol
                for symbol in symbols
            }

            # Получение результатов
            for future in as_completed(future_to_symbol):
                symbol = future_to_symbol[future]
                try:
                    data = future.result()
                    if data is not None and len(data) > 0:
                        all_data.append(data)
                        print(f"✓ Получены данные для {symbol}: {len(data)} записей")
                    else:
                        print(f"✗ Нет данных для {symbol}")
                except Exception as e:
                    print(f"✗ Ошибка для {symbol}: {e}")

        if not all_data:
            print("Не удалось получить данные ни для одного символа")
            return None

        # Объединение всех данных
        combined_df = pd.concat(all_data, ignore_index=False)
        combined_df = combined_df.sort_index()

        print(f"Общий размер датасета: {len(combined_df)} записей для {len(all_data)} активов")
        return combined_df

    def create_universal_dataset(self, symbols=None, timeframe='1h', limit=1000,
                                future_periods=5, profit_threshold=0.02, loss_threshold=-0.01):
        """
        Создание универсального датасета для множества криптовалют
        """
        if symbols is None:
            print("Получение списка топовых криптовалют...")
            symbols = self.get_top_crypto_pairs()

        print(f"Создание датасета для {len(symbols)} активов...")
        print("Активы:", ", ".join([s.split('/')[0] for s in symbols[:10]]) +
              (f" и еще {len(symbols)-10}" if len(symbols) > 10 else ""))

        # 1. Получение данных
        print("\n1. Получение исходных данных...")
        df = self.fetch_multiple_symbols(symbols, timeframe, limit)
        if df is None:
            return None

        # 2. Технические индикаторы
        print("\n2. Расчет технических индикаторов...")
        df = self.add_universal_technical_indicators(df)

        # 3. Ценовые признаки
        print("\n3. Добавление ценовых признаков...")
        df = self.add_normalized_price_features(df)

        # 4. Категории активов
        print("\n4. Категоризация активов...")
        df = self.add_asset_categories(df)

        # 5. Кросс-активные признаки
        print("\n5. Расчет рыночных индикаторов...")
        df = self.add_cross_asset_features(df)

        # 6. Целевые переменные
        print("\n6. Создание целевых меток...")
        df = self.create_universal_targets(df, future_periods, profit_threshold, loss_threshold)

        # 7. Временные признаки
        print("\n7. Добавление временных признаков...")
        df = self.add_time_features(df)

        # 8. Очистка данных
        print("\n8. Очистка данных...")
        initial_size = len(df)
        df = df.dropna()
        final_size = len(df)
        print(f"Удалено {initial_size - final_size} записей с NaN ({((initial_size - final_size) / initial_size * 100):.1f}%)")

        # Статистика по целевым меткам
        print(f"\nИтоговый размер датасета: {df.shape}")
        print("\nРаспределение целевых меток:")
        target_dist = df['target'].value_counts().sort_index()
        for target, count in target_dist.items():
            label = {-1: 'Sell', 0: 'Hold', 1: 'Buy'}[target]
            print(f"  {label}: {count} ({count/len(df)*100:.1f}%)")

        print(f"\nАктивы в датасете:")
        asset_counts = df['base_asset'].value_counts()
        for asset, count in asset_counts.head(10).items():
            print(f"  {asset}: {count} записей")

        return df

    def add_time_features(self, df):
        """Добавление временных признаков"""
        df['hour'] = df.index.hour
        df['day_of_week'] = df.index.dayofweek
        df['month'] = df.index.month

        # Циклические признаки
        df['hour_sin'] = np.sin(2 * np.pi * df['hour'] / 24)
        df['hour_cos'] = np.cos(2 * np.pi * df['hour'] / 24)
        df['day_sin'] = np.sin(2 * np.pi * df['day_of_week'] / 7)
        df['day_cos'] = np.cos(2 * np.pi * df['day_of_week'] / 7)

        return df

    def save_dataset(self, df, filename=None):
        """Сохранение датасета"""
        if filename is None:
            filename = f"universal_crypto_dataset_{datetime.now().strftime('%Y%m%d_%H%M')}.csv"

        # Создание директории если нужно
        os.makedirs(os.path.dirname(filename) if os.path.dirname(filename) else '.', exist_ok=True)

        df.to_csv(filename)
        print(f"\nДатасет сохранен: {filename}")
        print(f"Размер файла: {os.path.getsize(filename) / 1024 / 1024:.1f} MB")

        # Сохранение метаданных
        meta_filename = filename.replace('.csv', '_metadata.txt')
        with open(meta_filename, 'w') as f:
            f.write(f"Universal Crypto Dataset Metadata\n")
            f.write(f"Created: {datetime.now()}\n")
            f.write(f"Shape: {df.shape}\n")
            f.write(f"Assets: {df['base_asset'].nunique()}\n")
            f.write(f"Date range: {df.index.min()} to {df.index.max()}\n")
            f.write(f"Target distribution:\n")
            for target, count in df['target'].value_counts().sort_index().items():
                f.write(f"  {target}: {count}\n")

        return filename

    def get_feature_columns(self, df):
        """Получение списка признаков для обучения"""
        exclude = ['symbol', 'base_asset', 'asset_category', 'open', 'high', 'low', 'close', 'volume',
                  'future_return', 'target', 'max_future_return', 'min_future_return', 'profitable', 'high_profit']

        feature_cols = [col for col in df.columns if col not in exclude]
        return feature_cols

# Пример использования
if __name__ == "__main__":
    # Создание универсального датасета
    creator = UniversalCryptoDatasetCreator()

    # Можно указать конкретные активы или получить топовые автоматически
    custom_symbols = ['BTC/USDT', 'ETH/USDT', 'BNB/USDT', 'ADA/USDT', 'SOL/USDT',
                      'XRP/USDT', 'DOT/USDT', 'MATIC/USDT', 'AVAX/USDT', 'LINK/USDT']

    try:
        # Создание датасета
        df = creator.create_universal_dataset(
            symbols=custom_symbols,  # Или None для автоматического выбора
            timeframe='1h',
            limit=2000,
            future_periods=6,
            profit_threshold=0.03,
            loss_threshold=-0.02
        )

        if df is not None:
            # Сохранение
            filename = creator.save_dataset(df, 'data/universal_crypto_dataset.csv')

            # Показать признаки
            features = creator.get_feature_columns(df)
            print(f"\nВсего признаков для обучения: {len(features)}")
            print("\nОсновные категории признаков:")

            categories = {
                'Технические индикаторы': [f for f in features if any(x in f for x in ['sma', 'ema', 'rsi', 'macd', 'bb_', 'stoch', 'williams'])],
                'Ценовые признаки': [f for f in features if any(x in f for x in ['return', 'volatility', 'spread', 'price_vs'])],
                'Объемные индикаторы': [f for f in features if 'volume' in f or 'obv' in f],
                'Рыночные индикаторы': [f for f in features if 'market' in f or 'relative' in f],
                'Временные признаки': [f for f in features if any(x in f for x in ['hour', 'day', 'month', 'sin', 'cos'])],
                'Категориальные': [f for f in features if 'category_' in f]
            }

            for category, feats in categories.items():
                if feats:
                    print(f"  {category}: {len(feats)} признаков")

            print(f"\nПример использования для обучения модели:")
            print(f"X = df[{len(features)} признаков]")
            print(f"y = df['target']  # -1: Sell, 0: Hold, 1: Buy")

    except Exception as e:
        print(f"Ошибка создания датасета: {e}")
        import traceback
        traceback.print_exc()

ModuleNotFoundError: No module named 'ccxt'