# 종목별 feature engineering & labeling
## 주의! 2003년부터 있지만 2004년부터 데이터 사용해야함
-> why? 2003년 초반부 데이터는 없는 피쳐가 있기때문에 -> 초기 시계열 데이터가 없어서 MA20, MACD14 등 기술적 지표를 계산할 수 없음! 
- data 분석
- 어떤 task로 어떤모델을 사용할지
- 피쳐엔지니어링 - 새로운 지표추가, 라벨선정, 라벨링


# Data Load

In [1]:
import pandas as pd
import os
import numpy as np
from glob import glob
from tqdm import tqdm
import strategy as stg
import warnings
import utils as U
warnings.filterwarnings('ignore')

In [2]:
# 저장된 데이터 불러오기
crypto_data, excluded_info, summary_info = U.load_cleaned_crypto_data("/workspace/AI모델/projects/coin/data/final/with_strategies")

# 불러온 데이터 확인
print(f"로딩된 종목 수: {len(crypto_data)}")
for symbol, df in list(crypto_data.items())[:3]:
    print(f"{symbol}: {len(df)}행, {df.index[0].date()} ~ {df.index[-1].date()}")

# 상세 정보 출력
U.get_data_info(crypto_data, detailed=True)

# ML 데이터셋 로드
ml_dataset = U.CryptoDataLoader.load_ml_dataset("/workspace/AI모델/projects/coin/data/final")

📂 데이터 로딩 시작: /workspace/AI모델/projects/coin/data/final/with_strategies
📊 발견된 파일 수: 100
✅ 성공적으로 로드된 심볼: 100개
❌ 제외된 심볼: 0개
🔥 로딩 에러: 0개
로딩된 종목 수: 100
1INCH: 1725행, 2020-12-25 ~ 2025-09-14
AAVE: 1809행, 2020-10-02 ~ 2025-09-14
ADA: 2867행, 2017-11-09 ~ 2025-09-14

📊 데이터 정보 요약
총 심볼 수: 100
컬럼 수: 178
전략 시그널 수: 41
데이터 기간: 2015-01-01 ~ 2025-09-14
평균 데이터 포인트: 2258일

📋 심볼별 상세 정보:
  1INCH: 1725행, 2020-12-25 ~ 2025-09-14
  AAVE: 1809행, 2020-10-02 ~ 2025-09-14
  ADA: 2867행, 2017-11-09 ~ 2025-09-14
  ALGO: 2278행, 2019-06-21 ~ 2025-09-14
  ANKR: 2385행, 2019-03-06 ~ 2025-09-14
  API3: 1748행, 2020-12-02 ~ 2025-09-14
  APT21794: 1062행, 2022-10-19 ~ 2025-09-14
  ARB11841: 907행, 2023-03-23 ~ 2025-09-14
  ASTR: 1336행, 2022-01-18 ~ 2025-09-14
  ATOM: 2377행, 2019-03-14 ~ 2025-09-14
  ... 및 90개 더

🎯 전략 시그널 목록:
  이동평균: 4개
  MACD: 6개
  RSI: 8개
  오실레이터: 6개
  가격패턴: 3개
  거래량: 4개
  모멘텀: 2개
  복합: 2개
✅ ML 데이터셋 로드 완료: 220052행, 47개 특성
📊 타겟 분포 - SELL(0): 70207, HOLD(1): 82407, BUY(2): 67438


In [3]:
crypto_data['BTC']

Unnamed: 0_level_0,Open,High,Low,Close,Volume,MA_2,MA_3,MA_4,MA_5,MA_6,...,MFI_Extreme_Signal,Volume_Breakout_Signal,Momentum_Signal,Price_ROC_3_Signal,Volatility_Signal,Composite_Signal_Avg,Buy_Signal_Count,Sell_Signal_Count,Net_Signal_Score,Final_Composite_Signal
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
2015-01-01,320.434998,320.434998,314.002991,314.248993,8036550,,,,,,...,1,1,1,1,1,1.000000,1,1,0,1
2015-01-02,314.079010,315.838989,313.565002,315.032013,7860650,314.640503,,,,,...,1,1,1,1,1,1.000000,0,0,0,1
2015-01-03,314.846008,315.149994,281.082001,281.082001,33054400,298.057007,303.454336,,,,...,1,1,1,1,1,0.970588,1,2,-1,1
2015-01-04,281.145996,287.230011,257.612000,264.195007,55629100,272.638504,286.769674,293.639503,,,...,1,1,1,1,1,1.029412,1,0,1,1
2015-01-05,265.084015,278.341003,265.084015,274.473999,43962800,269.334503,273.250336,283.695755,289.806403,,...,1,1,1,1,1,1.029412,2,1,1,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2025-09-10,111531.250000,114275.250000,110940.078125,113955.359375,56377473784,112742.953125,112519.111979,112181.238281,111789.929688,111600.105469,...,1,1,1,1,0,-33.756420,4,2,2,2
2025-09-11,113961.429688,115522.546875,113453.835938,115507.539062,45685065332,114731.449219,113664.481771,113266.218750,112846.498438,112409.531250,...,1,1,1,1,0,-28.930912,6,1,5,2
2025-09-12,115507.789062,116769.382812,114794.484375,116101.578125,54785725894,115804.558594,115188.158854,114273.755859,113833.290625,113389.011719,...,1,1,1,1,0,-23.359331,1,1,0,1
2025-09-13,116093.562500,116334.632812,115248.273438,115950.507812,34549454947,116026.042969,115853.208333,115378.746094,114609.106250,114186.160156,...,1,1,1,1,0,-17.289831,3,1,2,2


# 피쳐엔지니어링 & 라벨링
- 새로운 기술적 지표 피쳐 추가 
    - SMI (Stochastic Momentum Index): SMI, SMI_Signal, SMI_Oscillator
    - 토캐스틱 개선: Momentum, Crossover, Overbought/Oversold 신호
    - 다이버전스: RSI/MACD와 가격 간 다이버전스
    - 모멘텀 지표: 가격 가속도, 거래량/변동성 모멘텀
    - 트렌드 강도: MA 정렬도, 볼린저 밴드 압축/확장
- 연속적 수익률 피쳐: Daily_Return, Weekly_Return, Monthly_Return이 이미 있음
- 연속적 기술지표: RSI, MACD, ATR, Volatility 등 모두 연속값
- 비율/포지션 피쳐: BB_Position, Price_vs_MA20 등 연속적 관계 정보

# 라벨링 방법 1
-  미래 수익률 기반으로 라벨링

In [9]:
import pandas as pd
import numpy as np
import os
from tqdm import tqdm
import warnings
warnings.filterwarnings('ignore')

def safe_column_check(df, columns):
    """안전한 컬럼 존재 확인"""
    if not isinstance(df, pd.DataFrame):
        return False
    return all(col in df.columns for col in columns)

def calculate_technical_score(df):
    """기술적 신호 강도 점수 계산 - 실제 존재하는 컬럼만 사용"""
    
    try:
        # DataFrame 확인
        if not isinstance(df, pd.DataFrame) or df.empty:
            return pd.Series(0.0, index=range(len(df)) if hasattr(df, '__len__') else range(1))
        
        # 실제 존재하는 컬럼들로만 계산
        technical_score = pd.Series(0.0, index=df.index)
        
        # RSI 기반 점수 (존재하면)
        if 'RSI_14' in df.columns:
            rsi_data = pd.to_numeric(df['RSI_14'], errors='coerce').fillna(50)
            rsi_score = np.where(rsi_data < 30, 1, np.where(rsi_data > 70, -1, 0))
            technical_score += 0.2 * rsi_score
        
        # MACD 기반 점수
        if 'MACD' in df.columns and 'MACD_Signal' in df.columns:
            macd_data = pd.to_numeric(df['MACD'], errors='coerce').fillna(0)
            macd_signal_data = pd.to_numeric(df['MACD_Signal'], errors='coerce').fillna(0)
            macd_score = np.where(macd_data > macd_signal_data, 1, -1)
            technical_score += 0.2 * macd_score
        
        # 이동평균 기반 점수
        if safe_column_check(df, ['MA_7', 'MA_20', 'Close']):
            close_data = pd.to_numeric(df['Close'], errors='coerce').fillna(method='ffill')
            ma7_data = pd.to_numeric(df['MA_7'], errors='coerce').fillna(method='ffill')
            ma20_data = pd.to_numeric(df['MA_20'], errors='coerce').fillna(method='ffill')
            
            ma_score = np.where(close_data > ma7_data, 0.5, -0.5)
            ma_score += np.where(ma7_data > ma20_data, 0.5, -0.5)
            technical_score += 0.2 * ma_score
        
        # 볼린저 밴드 위치
        if 'BB_Position_20' in df.columns:
            bb_position = pd.to_numeric(df['BB_Position_20'], errors='coerce').fillna(0.5)
            bb_score = (bb_position - 0.5) * 2  # -1 to 1로 변환
            technical_score += 0.2 * bb_score
        
        # 스토캐스틱
        if 'Stoch_K_14' in df.columns:
            stoch_data = pd.to_numeric(df['Stoch_K_14'], errors='coerce').fillna(50)
            stoch_score = np.where(stoch_data < 20, 1, np.where(stoch_data > 80, -1, 0))
            technical_score += 0.2 * stoch_score
        
        # 점수를 -1 ~ 1 범위로 클리핑
        technical_score = np.clip(technical_score, -1, 1)
        
        return technical_score
    
    except Exception as e:
        print(f"⚠️ calculate_technical_score 오류: {e}")
        return pd.Series(0.0, index=df.index if isinstance(df, pd.DataFrame) else range(1))

def create_enhanced_features(df):
    """추가적인 고급 기술적 지표 생성"""
    
    try:
        if not isinstance(df, pd.DataFrame) or df.empty:
            return df
        
        # 가격 데이터 확인 및 처리
        if 'Close' not in df.columns:
            return df
            
        close_data = pd.to_numeric(df['Close'], errors='coerce').fillna(method='ffill')
        
        # 1. 가격 모멘텀 지표들
        if len(close_data) > 20:
            df['Price_Momentum_5'] = close_data.pct_change(5)
            df['Price_Momentum_10'] = close_data.pct_change(10)
            df['Price_Momentum_20'] = close_data.pct_change(20)
        
        # 2. 볼륨 지표 (있다면)
        if 'Volume' in df.columns:
            volume_data = pd.to_numeric(df['Volume'], errors='coerce').fillna(0)
            if len(volume_data) > 20:
                df['Volume_MA_20'] = volume_data.rolling(20, min_periods=1).mean()
                df['Volume_Ratio'] = volume_data / df['Volume_MA_20']
        
        # 3. 변동성 지표
        if len(close_data) > 20:
            df['Volatility_20'] = close_data.rolling(20, min_periods=1).std()
            df['Volatility_Ratio'] = df['Volatility_20'] / df['Volatility_20'].rolling(60, min_periods=1).mean()
        
        # 4. RSI 다이버전스 (RSI가 있다면)
        if 'RSI_14' in df.columns and len(close_data) > 20:
            rsi_data = pd.to_numeric(df['RSI_14'], errors='coerce').fillna(50)
            price_momentum = close_data.pct_change(20)
            rsi_momentum = rsi_data.diff(20)
            
            # 다이버전스 신호
            df['RSI_Divergence'] = np.where(
                (price_momentum > 0) & (rsi_momentum < 0), -1,  # 약세 다이버전스
                np.where((price_momentum < 0) & (rsi_momentum > 0), 1, 0)  # 강세 다이버전스
            )
        
        # 5. MACD 개선 신호
        if safe_column_check(df, ['MACD', 'MACD_Signal']):
            macd = pd.to_numeric(df['MACD'], errors='coerce').fillna(0)
            macd_signal = pd.to_numeric(df['MACD_Signal'], errors='coerce').fillna(0)
            df['MACD_Histogram'] = macd - macd_signal
            df['MACD_Cross'] = np.where(
                (macd > macd_signal) & (macd.shift(1) <= macd_signal.shift(1)), 1,
                np.where((macd < macd_signal) & (macd.shift(1) >= macd_signal.shift(1)), -1, 0)
            )
        
        # 6. 지지/저항 레벨 계산
        if len(close_data) > 50:
            df['Support_Level'] = close_data.rolling(50, min_periods=1).min()
            df['Resistance_Level'] = close_data.rolling(50, min_periods=1).max()
            df['Price_Position'] = (close_data - df['Support_Level']) / (df['Resistance_Level'] - df['Support_Level'])
            df['Price_Position'] = df['Price_Position'].fillna(0.5).clip(0, 1)
        
        return df
    
    except Exception as e:
        print(f"⚠️ create_enhanced_features 오류: {e}")
        return df

def calculate_enhanced_technical_score(df):
    """향상된 기술적 점수 계산"""
    
    try:
        # 기본 기술적 점수
        base_score = calculate_technical_score(df)
        
        # 추가 점수 요소들
        enhanced_score = base_score.copy()
        
        # RSI 다이버전스 신호 추가
        if 'RSI_Divergence' in df.columns:
            divergence_data = pd.to_numeric(df['RSI_Divergence'], errors='coerce').fillna(0)
            enhanced_score += 0.1 * divergence_data
        
        # MACD 크로스오버 신호 추가
        if 'MACD_Cross' in df.columns:
            cross_data = pd.to_numeric(df['MACD_Cross'], errors='coerce').fillna(0)
            enhanced_score += 0.1 * cross_data
        
        # 가격 포지션 신호 추가
        if 'Price_Position' in df.columns:
            position_data = pd.to_numeric(df['Price_Position'], errors='coerce').fillna(0.5)
            position_score = (position_data - 0.5) * 2  # -1 to 1 범위로 변환
            enhanced_score += 0.1 * position_score
        
        # 볼륨 신호 추가
        if 'Volume_Ratio' in df.columns:
            volume_ratio = pd.to_numeric(df['Volume_Ratio'], errors='coerce').fillna(1)
            volume_score = np.where(volume_ratio > 1.5, 0.2, np.where(volume_ratio < 0.5, -0.2, 0))
            enhanced_score += volume_score
        
        # 변동성 신호 추가
        if 'Volatility_Ratio' in df.columns:
            vol_ratio = pd.to_numeric(df['Volatility_Ratio'], errors='coerce').fillna(1)
            vol_score = np.where(vol_ratio > 2, -0.1, np.where(vol_ratio < 0.5, 0.1, 0))
            enhanced_score += vol_score
        
        # 최종 점수 클리핑
        enhanced_score = np.clip(enhanced_score, -1, 1)
        
        return enhanced_score
    
    except Exception as e:
        print(f"⚠️ calculate_enhanced_technical_score 오류: {e}")
        return calculate_technical_score(df)

def create_composite_score(df):
    """복합 점수 생성 - 올바른 미래 수익률 계산"""
    
    try:
        if not isinstance(df, pd.DataFrame) or df.empty:
            return pd.Series(0.0, index=range(1)), {}
        
        # 미래 수익률 직접 계산
        available_returns = {}
        
        if 'Close' in df.columns:
            close_data = pd.to_numeric(df['Close'], errors='coerce')
            
            # 각 기간별 미래 수익률 계산
            periods = {
                'future_1d': 1,
                'future_3d': 3, 
                'future_7d': 7,
                'future_14d': 14,
                'future_30d': 30,
                'future_90d': 90,
                'future_180d': 180,
                'future_365d': 365
            }
            
            for key, days in periods.items():
                if len(close_data) > days:
                    future_close = close_data.shift(-days)
                    future_return = (future_close / close_data) - 1
                    if not future_return.isna().all():
                        available_returns[key] = future_return
        
        # 가중치 설정
        weights = {
            'future_1d': 0.35,
            'future_3d': 0.25, 
            'future_7d': 0.20,
            'future_14d': 0.10,
            'future_30d': 0.05,
            'future_90d': 0.03,
            'future_180d': 0.02,
            'future_365d': 0.0
        }
        
        # 실제 존재하는 컬럼들의 가중치 정규화
        total_weight = sum(weights.get(key, 0) for key in available_returns.keys())
        if total_weight > 0:
            normalized_weights = {key: weights.get(key, 0)/total_weight for key in available_returns.keys()}
        else:
            normalized_weights = {}
        
        # 수익률 기반 점수 계산
        return_score = pd.Series(0.0, index=df.index)
        
        for key, future_return in available_returns.items():
            if key in normalized_weights and normalized_weights[key] > 0:
                clean_return = future_return.fillna(0)
                return_score += normalized_weights[key] * clean_return
        
        # 최종 복합 점수
        composite_score = np.clip(return_score, -0.25, 0.25) * 10
        
        return composite_score, available_returns
    
    except Exception as e:
        print(f"⚠️ create_composite_score 오류: {e}")
        return pd.Series(0.0, index=df.index if isinstance(df, pd.DataFrame) else range(1)), {}

def score_to_label(composite_score):
    """점수를 3단계 라벨로 변환 (강매도, 홀드, 강매수)"""
    
    try:
        # 유효한 점수만 추출 (NaN 제외)
        valid_scores = composite_score.dropna()
        
        if len(valid_scores) == 0:
            return pd.Series([1] * len(composite_score), index=composite_score.index)
        
        # 백분위수 기준으로 라벨 생성
        labels = pd.Series(1, index=composite_score.index)  # 기본값: 홀드
        
        # 3분할 방식 (더 균형잡힌 분포)
        buy_threshold = np.percentile(valid_scores, 55)   # 상위 45%
        sell_threshold = np.percentile(valid_scores, 45)  # 하위 45%
        
        labels[composite_score >= buy_threshold] = 2  # 강매수
        labels[composite_score <= sell_threshold] = 0  # 강매도
        
        return labels
    
    except Exception as e:
        print(f"⚠️ score_to_label 오류: {e}")
        return pd.Series([1] * len(composite_score), index=composite_score.index)

def debug_data_structure(data, symbol="Unknown"):
    """데이터 구조 디버깅"""
    print(f"🔍 {symbol} 데이터 분석:")
    print(f"   타입: {type(data)}")
    
    if isinstance(data, pd.DataFrame):
        print(f"   DataFrame 크기: {data.shape}")
        print(f"   컬럼들: {list(data.columns)[:10]}...")  # 처음 10개만
        return True
    elif isinstance(data, pd.Series):
        print(f"   Series 길이: {len(data)}")
        print(f"   인덱스 타입: {type(data.index)}")
        return False
    elif isinstance(data, dict):
        print(f"   Dictionary 키들: {list(data.keys())[:10]}...")
        return False
    else:
        print(f"   지원되지 않는 타입")
        return False

def enhance_crypto_data_with_labels(crypto_data, test_symbols=None, save_path="enhanced_crypto_data", debug_mode=False):
    """암호화폐 데이터에 기술적 지표와 라벨 추가 - 완전히 개선된 버전"""
    
    from tqdm import tqdm
    
    # 테스트 심볼 설정
    if test_symbols is None:
        symbols_to_process = list(crypto_data.keys())
    else:
        symbols_to_process = test_symbols
    
    # 저장 경로 생성
    os.makedirs(save_path, exist_ok=True)
    
    enhanced_cryptos = {}
    failed_symbols = []
    
    print(f"처리할 암호화폐 수: {len(symbols_to_process)}")
    print("="*50)
    
    for symbol in tqdm(symbols_to_process, desc="데이터 처리 및 라벨링"):
        try:
            # 데이터 가져오기 및 타입 확인
            raw_data = crypto_data[symbol]
            
            if debug_mode:
                is_dataframe = debug_data_structure(raw_data, symbol)
                if not is_dataframe:
                    failed_symbols.append(f"{symbol}: 잘못된 데이터 타입")
                    continue
            
            # DataFrame이 아닌 경우 건너뛰기
            if not isinstance(raw_data, pd.DataFrame):
                failed_symbols.append(f"{symbol}: DataFrame이 아님 - {type(raw_data)}")
                continue
            
            # 빈 DataFrame 확인
            if raw_data.empty:
                failed_symbols.append(f"{symbol}: 빈 DataFrame")
                continue
            
            # 데이터 복사
            df = raw_data.copy()
            
            # 최소 필수 컬럼 확인
            essential_columns = ['Close']
            missing_essential = [col for col in essential_columns if col not in df.columns]
            
            if missing_essential:
                failed_symbols.append(f"{symbol}: 필수 컬럼 누락 - {missing_essential}")
                continue
            
            # 데이터 길이 확인
            if len(df) < 30:  # 최소 30일 데이터로 완화
                failed_symbols.append(f"{symbol}: 데이터 부족 ({len(df)}일)")
                continue
            
            # 1. 고급 기술적 지표 추가
            df = create_enhanced_features(df)
            
            # 2. 기본 기술적 점수 계산
            technical_score = calculate_technical_score(df)
            df['Technical_Score'] = technical_score
            
            # 3. 향상된 기술적 점수 계산
            enhanced_technical_score = calculate_enhanced_technical_score(df)
            df['Enhanced_Technical_Score'] = enhanced_technical_score
            
            # 4. 복합 점수 생성
            composite_score, future_returns_dict = create_composite_score(df)
            df['Composite_Score'] = composite_score
            
            # 5. 미래 수익률 저장 (검증용)
            for key, value in future_returns_dict.items():
                column_name = f'Future_{key.replace("future_", "")}'
                df[column_name] = value
            
            # 6. 라벨 생성 (복합 점수가 유효한 경우에만)
            valid_composite = composite_score.dropna()
            if len(valid_composite) > 0:
                labels = score_to_label(composite_score)
                df['Label'] = labels
                
                # 7. 라벨 이름 추가
                label_names = {0: 'Strong_Sell', 1: 'Hold', 2: 'Strong_Buy'}
                df['Label_Name'] = df['Label'].map(label_names)
                
                # 8. 라벨 분포 확인
                label_dist = df['Label'].value_counts().sort_index()
                if debug_mode:
                    print(f"   라벨 분포: {dict(label_dist)}")
            else:
                df['Label'] = 1  # 모두 홀드로 설정
                df['Label_Name'] = 'Hold'
                if debug_mode:
                    print(f"   복합 점수 없음 - 모두 Hold로 설정")
            
            # 9. 결과 저장
            enhanced_cryptos[symbol] = df
            
            # 10. CSV 저장 (옵션)
            try:
                output_file = f"{save_path}/{symbol}_enhanced.csv"
                df.to_csv(output_file, index=True)
            except Exception as e:
                print(f"⚠️ {symbol}: CSV 저장 실패 - {e}")
            
        except Exception as e:
            failed_symbols.append(f"{symbol}: 처리 중 오류 - {str(e)[:100]}")
            if debug_mode:
                print(f"❌ {symbol}: 상세 오류 - {e}")
            continue
    
    # 결과 요약
    success_count = len(enhanced_cryptos)
    total_count = len(symbols_to_process)
    failure_count = total_count - success_count
    
    print(f"\n{'='*50}")
    print(f"처리 완료!")
    print(f"✅ 성공: {success_count}개")
    print(f"❌ 실패: {failure_count}개")
    print(f"📁 저장 경로: {save_path}")
    
    if failed_symbols and debug_mode:
        print(f"\n실패한 심볼들:")
        for failed in failed_symbols[:10]:  # 처음 10개만 출력
            print(f"  - {failed}")
        if len(failed_symbols) > 10:
            print(f"  ... 및 {len(failed_symbols) - 10}개 더")
    
    return enhanced_cryptos

# 사용 예시 및 테스트
if __name__ == "__main__":
    # 사용 예시
    # enhanced_data = enhance_crypto_data_with_labels(crypto_data, test_symbols=['BTC', 'ETH'], debug_mode=True)
    
    # 전체 데이터 처리
    # enhanced_data = enhance_crypto_data_with_labels(crypto_data, debug_mode=False)
    pass

# 모든종목 저장

In [10]:
test_symbols = list(crypto_data.keys())
test_symbols[:1]

['1INCH']

In [11]:
# n개 종목 테스트
# test_symbols = list(stocks.keys())[:5] + list(stocks.keys())[-3:]
test_symbols = list(crypto_data.keys())

# save path
save_path_1 = "/workspace/AI모델/projects/coin/data/labeling/00" 

# run
enhanced_stocks = enhance_crypto_data_with_labels(
    crypto_data=crypto_data,
    test_symbols=test_symbols,  # None이면 전체 종목
    save_path=save_path_1,  # 저장 경로
    debug_mode=True
)

처리할 암호화폐 수: 100


데이터 처리 및 라벨링:   0%|          | 0/100 [00:00<?, ?it/s]

🔍 1INCH 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1725, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 776, 1: 173, 2: 776}


데이터 처리 및 라벨링:   1%|          | 1/100 [00:00<00:49,  1.98it/s]

🔍 AAVE 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1809, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 814, 1: 181, 2: 814}


데이터 처리 및 라벨링:   2%|▏         | 2/100 [00:01<00:50,  1.94it/s]

🔍 ADA 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:   3%|▎         | 3/100 [00:01<01:01,  1.57it/s]

🔍 ALGO 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2278, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1025, 1: 228, 2: 1025}


데이터 처리 및 라벨링:   4%|▍         | 4/100 [00:02<01:01,  1.57it/s]

🔍 ANKR 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2385, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1073, 1: 239, 2: 1073}


데이터 처리 및 라벨링:   5%|▌         | 5/100 [00:03<01:01,  1.54it/s]

🔍 API3 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1748, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 787, 1: 174, 2: 787}


데이터 처리 및 라벨링:   6%|▌         | 6/100 [00:03<00:57,  1.62it/s]

🔍 APT21794 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1062, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 478, 1: 106, 2: 478}


데이터 처리 및 라벨링:   7%|▋         | 7/100 [00:03<00:48,  1.93it/s]

🔍 ARB11841 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (907, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 408, 1: 91, 2: 408}


데이터 처리 및 라벨링:   8%|▊         | 8/100 [00:04<00:40,  2.27it/s]

🔍 ASTR 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1336, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 601, 1: 134, 2: 601}


데이터 처리 및 라벨링:   9%|▉         | 9/100 [00:04<00:38,  2.37it/s]

🔍 ATOM 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2377, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1070, 1: 237, 2: 1070}


데이터 처리 및 라벨링:  10%|█         | 10/100 [00:05<00:45,  1.99it/s]

🔍 AVAX 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1821, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 820, 1: 182, 2: 819}


데이터 처리 및 라벨링:  11%|█         | 11/100 [00:05<00:45,  1.96it/s]

🔍 AXS 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1776, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 799, 1: 178, 2: 799}


데이터 처리 및 라벨링:  12%|█▏        | 12/100 [00:06<00:45,  1.95it/s]

🔍 BAL 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1909, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 859, 1: 191, 2: 859}


데이터 처리 및 라벨링:  13%|█▎        | 13/100 [00:06<00:44,  1.97it/s]

🔍 BAND 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2189, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 985, 1: 219, 2: 985}


데이터 처리 및 라벨링:  14%|█▍        | 14/100 [00:07<00:46,  1.85it/s]

🔍 BAT 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  15%|█▌        | 15/100 [00:08<00:53,  1.60it/s]

🔍 BCH 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  16%|█▌        | 16/100 [00:09<00:57,  1.47it/s]

🔍 BNB 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  17%|█▋        | 17/100 [00:09<00:59,  1.40it/s]

🔍 BNT 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  18%|█▊        | 18/100 [00:10<01:00,  1.35it/s]

🔍 BSV 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2502, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1126, 1: 250, 2: 1126}


데이터 처리 및 라벨링:  19%|█▉        | 19/100 [00:11<00:58,  1.38it/s]

🔍 BTC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (3910, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1760, 1: 390, 2: 1760}


데이터 처리 및 라벨링:  20%|██        | 20/100 [00:12<01:06,  1.21it/s]

🔍 CAKE 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1812, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 815, 1: 182, 2: 815}


데이터 처리 및 라벨링:  21%|██        | 21/100 [00:12<00:57,  1.36it/s]

🔍 CFG 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1523, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 685, 1: 153, 2: 685}


데이터 처리 및 라벨링:  22%|██▏       | 22/100 [00:13<00:50,  1.55it/s]

🔍 CHZ 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2268, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1021, 1: 226, 2: 1021}


데이터 처리 및 라벨링:  23%|██▎       | 23/100 [00:14<00:49,  1.55it/s]

🔍 CKB 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2127, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 957, 1: 213, 2: 957}


데이터 처리 및 라벨링:  24%|██▍       | 24/100 [00:14<00:47,  1.59it/s]

🔍 COTI 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2295, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1033, 1: 229, 2: 1033}


데이터 처리 및 라벨링:  25%|██▌       | 25/100 [00:15<00:47,  1.58it/s]

🔍 CRO 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2467, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1110, 1: 247, 2: 1110}


데이터 처리 및 라벨링:  26%|██▌       | 26/100 [00:15<00:48,  1.54it/s]

🔍 CRV 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1858, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 836, 1: 186, 2: 836}


데이터 처리 및 라벨링:  27%|██▋       | 27/100 [00:16<00:44,  1.64it/s]

🔍 CVC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  28%|██▊       | 28/100 [00:17<00:47,  1.51it/s]

🔍 CVX 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1581, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 712, 1: 157, 2: 712}


데이터 처리 및 라벨링:  29%|██▉       | 29/100 [00:17<00:42,  1.67it/s]

🔍 DAI 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2124, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 956, 1: 212, 2: 956}


데이터 처리 및 라벨링:  30%|███       | 30/100 [00:18<00:42,  1.66it/s]

🔍 DASH 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  31%|███       | 31/100 [00:19<00:45,  1.51it/s]

🔍 DOGE 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  32%|███▏      | 32/100 [00:19<00:47,  1.43it/s]

🔍 DOT 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1852, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 833, 1: 186, 2: 833}


데이터 처리 및 라벨링:  33%|███▎      | 33/100 [00:20<00:43,  1.55it/s]

🔍 DYDX 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1426, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 642, 1: 142, 2: 642}


데이터 처리 및 라벨링:  34%|███▍      | 34/100 [00:20<00:37,  1.74it/s]

🔍 EGLD 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1837, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 827, 1: 183, 2: 827}


데이터 처리 및 라벨링:  35%|███▌      | 35/100 [00:21<00:36,  1.80it/s]

🔍 ENJ 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  36%|███▌      | 36/100 [00:22<00:40,  1.59it/s]

🔍 ETC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  37%|███▋      | 37/100 [00:22<00:42,  1.48it/s]

🔍 ETH 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  38%|███▊      | 38/100 [00:23<00:43,  1.41it/s]

🔍 FET 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2389, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1075, 1: 239, 2: 1075}


데이터 처리 및 라벨링:  39%|███▉      | 39/100 [00:24<00:42,  1.44it/s]

🔍 FIL 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2833, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1275, 1: 283, 2: 1275}


데이터 처리 및 라벨링:  40%|████      | 40/100 [00:25<00:43,  1.39it/s]

🔍 FLOW 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1692, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 761, 1: 170, 2: 761}


데이터 처리 및 라벨링:  41%|████      | 41/100 [00:25<00:38,  1.54it/s]

🔍 FTM 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2268, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1021, 1: 226, 2: 1021}


데이터 처리 및 라벨링:  42%|████▏     | 42/100 [00:26<00:37,  1.54it/s]

🔍 FXS 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1592, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 716, 1: 160, 2: 716}


데이터 처리 및 라벨링:  43%|████▎     | 43/100 [00:26<00:33,  1.69it/s]

🔍 GNO 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  44%|████▍     | 44/100 [00:27<00:36,  1.53it/s]

🔍 GRT6719 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1732, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 779, 1: 174, 2: 779}


데이터 처리 및 라벨링:  45%|████▌     | 45/100 [00:28<00:33,  1.66it/s]

🔍 HBAR 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2190, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 986, 1: 218, 2: 986}


데이터 처리 및 라벨링:  46%|████▌     | 46/100 [00:28<00:32,  1.68it/s]

🔍 ICP 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1589, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 715, 1: 159, 2: 715}


데이터 처리 및 라벨링:  47%|████▋     | 47/100 [00:29<00:29,  1.81it/s]

🔍 IMX10603 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1409, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 634, 1: 141, 2: 634}


데이터 처리 및 라벨링:  48%|████▊     | 48/100 [00:29<00:26,  1.96it/s]

🔍 INJ 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1790, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 806, 1: 178, 2: 806}


데이터 처리 및 라벨링:  49%|████▉     | 49/100 [00:29<00:25,  1.97it/s]

🔍 IOTA 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (716, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 322, 1: 72, 2: 322}


데이터 처리 및 라벨링:  50%|█████     | 50/100 [00:30<00:20,  2.39it/s]

🔍 KCS 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  51%|█████     | 51/100 [00:31<00:26,  1.87it/s]

🔍 KEEP 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1951, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 878, 1: 195, 2: 878}


데이터 처리 및 라벨링:  52%|█████▏    | 52/100 [00:31<00:25,  1.86it/s]

🔍 KNC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1510, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 680, 1: 150, 2: 680}


데이터 처리 및 라벨링:  53%|█████▎    | 53/100 [00:31<00:23,  1.97it/s]

🔍 LEO 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2309, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1039, 1: 231, 2: 1039}


데이터 처리 및 라벨링:  54%|█████▍    | 54/100 [00:32<00:25,  1.82it/s]

🔍 LPT 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2462, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1108, 1: 246, 2: 1108}


데이터 처리 및 라벨링:  55%|█████▌    | 55/100 [00:33<00:26,  1.69it/s]

🔍 LRC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  56%|█████▌    | 56/100 [00:34<00:28,  1.55it/s]

🔍 LTC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (3910, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1760, 1: 390, 2: 1760}


데이터 처리 및 라벨링:  57%|█████▋    | 57/100 [00:35<00:33,  1.30it/s]

🔍 MANA 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  58%|█████▊    | 58/100 [00:35<00:32,  1.30it/s]

🔍 MNT27075 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (788, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 355, 1: 78, 2: 355}


데이터 처리 및 라벨링:  59%|█████▉    | 59/100 [00:36<00:25,  1.63it/s]

🔍 NEAR 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1797, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 809, 1: 179, 2: 809}


데이터 처리 및 라벨링:  60%|██████    | 60/100 [00:36<00:23,  1.72it/s]

🔍 NEO 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  61%|██████    | 61/100 [00:37<00:25,  1.55it/s]

🔍 NMR 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  62%|██████▏   | 62/100 [00:38<00:26,  1.46it/s]

🔍 OKB 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2330, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1049, 1: 232, 2: 1049}


데이터 처리 및 라벨링:  63%|██████▎   | 63/100 [00:38<00:24,  1.49it/s]

🔍 OP 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1281, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 577, 1: 127, 2: 577}


데이터 처리 및 라벨링:  64%|██████▍   | 64/100 [00:39<00:20,  1.72it/s]

🔍 QNT 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2593, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1167, 1: 259, 2: 1167}


데이터 처리 및 라벨링:  65%|██████▌   | 65/100 [00:39<00:21,  1.60it/s]

🔍 QTUM 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  66%|██████▌   | 66/100 [00:40<00:22,  1.48it/s]

🔍 REQ 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  67%|██████▋   | 67/100 [00:41<00:23,  1.41it/s]

🔍 RLC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  68%|██████▊   | 68/100 [00:42<00:23,  1.37it/s]

🔍 RNDR 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1502, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 676, 1: 150, 2: 676}


데이터 처리 및 라벨링:  69%|██████▉   | 69/100 [00:42<00:19,  1.56it/s]

🔍 RSR 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2306, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1038, 1: 230, 2: 1038}


데이터 처리 및 라벨링:  70%|███████   | 70/100 [00:43<00:19,  1.55it/s]

🔍 RUNE 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2246, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1011, 1: 224, 2: 1011}


데이터 처리 및 라벨링:  71%|███████   | 71/100 [00:44<00:18,  1.55it/s]

🔍 SAND 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1858, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 836, 1: 186, 2: 836}


데이터 처리 및 라벨링:  72%|███████▏  | 72/100 [00:44<00:17,  1.64it/s]

🔍 SHIB 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1830, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 839, 1: 167, 2: 824}


데이터 처리 및 라벨링:  73%|███████▎  | 73/100 [00:45<00:15,  1.75it/s]

🔍 SNX 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2742, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1234, 1: 274, 2: 1234}


데이터 처리 및 라벨링:  74%|███████▍  | 74/100 [00:45<00:16,  1.58it/s]

🔍 SOL 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1984, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 893, 1: 198, 2: 893}


데이터 처리 및 라벨링:  75%|███████▌  | 75/100 [00:46<00:15,  1.64it/s]

🔍 SPELL 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1490, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 671, 1: 148, 2: 671}


데이터 처리 및 라벨링:  76%|███████▌  | 76/100 [00:46<00:13,  1.79it/s]

🔍 STORJ 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  77%|███████▋  | 77/100 [00:47<00:14,  1.59it/s]

🔍 STX4847 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2148, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 967, 1: 214, 2: 967}


데이터 처리 및 라벨링:  78%|███████▊  | 78/100 [00:48<00:13,  1.62it/s]

🔍 SUI20947 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (866, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 390, 1: 86, 2: 390}


데이터 처리 및 라벨링:  79%|███████▉  | 79/100 [00:48<00:10,  1.97it/s]

🔍 SUSHI 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1844, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 830, 1: 184, 2: 830}


데이터 처리 및 라벨링:  80%|████████  | 80/100 [00:49<00:10,  1.96it/s]

🔍 THETA 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2798, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1259, 1: 280, 2: 1259}


데이터 처리 및 라벨링:  81%|████████  | 81/100 [00:49<00:11,  1.71it/s]

🔍 TON11419 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1480, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 666, 1: 148, 2: 666}


데이터 처리 및 라벨링:  82%|████████▏ | 82/100 [00:50<00:09,  1.88it/s]

🔍 TORN 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1679, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 756, 1: 167, 2: 756}


데이터 처리 및 라벨링:  83%|████████▎ | 83/100 [00:50<00:08,  1.95it/s]

🔍 TRAC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2790, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1256, 1: 278, 2: 1256}


데이터 처리 및 라벨링:  84%|████████▍ | 84/100 [00:51<00:09,  1.70it/s]

🔍 TRX 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  85%|████████▌ | 85/100 [00:52<00:09,  1.54it/s]

🔍 UMA 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1939, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 873, 1: 193, 2: 873}


데이터 처리 및 라벨링:  86%|████████▌ | 86/100 [00:52<00:08,  1.58it/s]

🔍 UNI7083 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1823, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 820, 1: 183, 2: 820}


데이터 처리 및 라벨링:  87%|████████▋ | 87/100 [00:53<00:07,  1.66it/s]

🔍 USDC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2534, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1140, 1: 254, 2: 1140}


데이터 처리 및 라벨링:  88%|████████▊ | 88/100 [00:54<00:07,  1.57it/s]

🔍 USDT 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  89%|████████▉ | 89/100 [00:54<00:07,  1.46it/s]

🔍 VET 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2600, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1170, 1: 260, 2: 1170}


데이터 처리 및 라벨링:  90%|█████████ | 90/100 [00:55<00:06,  1.44it/s]

🔍 WAVES 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  91%|█████████ | 91/100 [00:56<00:06,  1.38it/s]

🔍 XLM 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  92%|█████████▏| 92/100 [00:57<00:05,  1.34it/s]

🔍 XMR 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  93%|█████████▎| 93/100 [00:57<00:05,  1.31it/s]

🔍 XRP 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  94%|█████████▍| 94/100 [00:58<00:04,  1.30it/s]

🔍 XTZ 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  95%|█████████▌| 95/100 [00:59<00:03,  1.28it/s]

🔍 XYO 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2673, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1203, 1: 267, 2: 1203}


데이터 처리 및 라벨링:  96%|█████████▌| 96/100 [01:00<00:03,  1.29it/s]

🔍 YFI 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1883, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 847, 1: 189, 2: 847}


데이터 처리 및 라벨링:  97%|█████████▋| 97/100 [01:00<00:02,  1.43it/s]

🔍 ZEC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  98%|█████████▊| 98/100 [01:01<00:01,  1.38it/s]

🔍 ZIL 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2790, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1256, 1: 278, 2: 1256}


데이터 처리 및 라벨링:  99%|█████████▉| 99/100 [01:02<00:00,  1.36it/s]

🔍 ZRX 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링: 100%|██████████| 100/100 [01:03<00:00,  1.58it/s]


처리 완료!
✅ 성공: 100개
❌ 실패: 0개
📁 저장 경로: /workspace/AI모델/projects/coin/data/labeling/00





# 메이저종목만 다운

In [14]:
### 메이저 리스트
major_coins = [
    'BTC-USD', 'ETH-USD', 'USDT-USD', 'BNB-USD', 'SOL-USD', 
    'USDC-USD', 'XRP-USD', 'DOGE-USD', 'TON11419-USD', 'ADA-USD',
    'SHIB-USD', 'AVAX-USD', 'TRX-USD', 'DOT-USD', 'BCH-USD',
    'NEAR-USD', 'MATIC-USD', 'ICP-USD', 'UNI7083-USD', 'LTC-USD'
]

# 각 문자열에서 '-USD'를 제거하고 test_symbols 리스트에 저장
test_symbols = [coin.replace('-USD', '') for coin in major_coins]

# 결과 확인
print(test_symbols)

['BTC', 'ETH', 'USDT', 'BNB', 'SOL', 'USDC', 'XRP', 'DOGE', 'TON11419', 'ADA', 'SHIB', 'AVAX', 'TRX', 'DOT', 'BCH', 'NEAR', 'MATIC', 'ICP', 'UNI7083', 'LTC']


In [15]:
# n개 종목 테스트
# test_symbols = list(stocks.keys())[:5] + list(stocks.keys())[-3:]

# save path
save_path_1 = "/workspace/AI모델/projects/coin/data/labeling/m_00" 

# run
enhanced_stocks = enhance_crypto_data_with_labels(
    crypto_data=crypto_data,
    test_symbols=test_symbols,  # None이면 전체 종목
    save_path=save_path_1,  # 저장 경로
    debug_mode=True
)

처리할 암호화폐 수: 20


데이터 처리 및 라벨링:   0%|          | 0/20 [00:00<?, ?it/s]

🔍 BTC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (3910, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1760, 1: 390, 2: 1760}


데이터 처리 및 라벨링:   5%|▌         | 1/20 [00:01<00:20,  1.06s/it]

🔍 ETH 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  10%|█         | 2/20 [00:01<00:16,  1.09it/s]

🔍 USDT 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  15%|█▌        | 3/20 [00:02<00:14,  1.14it/s]

🔍 BNB 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  20%|██        | 4/20 [00:03<00:13,  1.18it/s]

🔍 SOL 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1984, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 893, 1: 198, 2: 893}


데이터 처리 및 라벨링:  25%|██▌       | 5/20 [00:04<00:11,  1.34it/s]

🔍 USDC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2534, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1140, 1: 254, 2: 1140}


데이터 처리 및 라벨링:  30%|███       | 6/20 [00:04<00:10,  1.35it/s]

🔍 XRP 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  35%|███▌      | 7/20 [00:05<00:09,  1.31it/s]

🔍 DOGE 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  40%|████      | 8/20 [00:06<00:09,  1.28it/s]

🔍 TON11419 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1480, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 666, 1: 148, 2: 666}


데이터 처리 및 라벨링:  45%|████▌     | 9/20 [00:06<00:07,  1.49it/s]

🔍 ADA 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  50%|█████     | 10/20 [00:07<00:07,  1.40it/s]

🔍 SHIB 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1830, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 839, 1: 167, 2: 824}


데이터 처리 및 라벨링:  55%|█████▌    | 11/20 [00:08<00:05,  1.56it/s]

🔍 AVAX 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1821, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 820, 1: 182, 2: 819}


데이터 처리 및 라벨링:  60%|██████    | 12/20 [00:08<00:04,  1.64it/s]

🔍 TRX 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  65%|██████▌   | 13/20 [00:09<00:04,  1.49it/s]

🔍 DOT 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1852, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 833, 1: 186, 2: 833}


데이터 처리 및 라벨링:  70%|███████   | 14/20 [00:10<00:03,  1.60it/s]

🔍 BCH 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (2867, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1290, 1: 287, 2: 1290}


데이터 처리 및 라벨링:  75%|███████▌  | 15/20 [00:10<00:03,  1.50it/s]

🔍 NEAR 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1797, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 809, 1: 179, 2: 809}


데이터 처리 및 라벨링:  80%|████████  | 16/20 [00:11<00:02,  1.62it/s]

❌ MATIC: 상세 오류 - 'MATIC'
🔍 ICP 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1589, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 715, 1: 159, 2: 715}


데이터 처리 및 라벨링:  90%|█████████ | 18/20 [00:11<00:00,  2.31it/s]

🔍 UNI7083 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (1823, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 820, 1: 183, 2: 820}


데이터 처리 및 라벨링:  95%|█████████▌| 19/20 [00:12<00:00,  2.24it/s]

🔍 LTC 데이터 분석:
   타입: <class 'pandas.core.frame.DataFrame'>
   DataFrame 크기: (3910, 178)
   컬럼들: ['Open', 'High', 'Low', 'Close', 'Volume', 'MA_2', 'MA_3', 'MA_4', 'MA_5', 'MA_6']...
   라벨 분포: {0: 1760, 1: 390, 2: 1760}


데이터 처리 및 라벨링: 100%|██████████| 20/20 [00:13<00:00,  1.51it/s]


처리 완료!
✅ 성공: 19개
❌ 실패: 1개
📁 저장 경로: /workspace/AI모델/projects/coin/data/labeling/m_00

실패한 심볼들:
  - MATIC: 처리 중 오류 - 'MATIC'





# 컨테이너 cpu메모리 비우기

In [8]:
import gc
import torch
import sys


# 2. 전역 변수 정리
globals_to_delete = []
for name, obj in list(globals().items()):
    if hasattr(obj, '__len__') and len(str(obj)) > 1000:
        globals_to_delete.append(name)

for name in globals_to_delete:
    try:
        del globals()[name]
    except:
        pass

# 3. GPU 메모리 완전 정리
if torch.cuda.is_available():
    torch.cuda.empty_cache()
    torch.cuda.synchronize()
    torch.cuda.reset_peak_memory_stats()

# 4. Python 메모리 강제 정리
for i in range(3):
    gc.collect()

# 5. 메모리 사용량 확인
import psutil
memory_percent = psutil.virtual_memory().percent
print(f"메모리 정리 완료 - 사용률: {memory_percent:.1f}%")

# 6. 강제 메모리 해제 (극단적 방법)
import ctypes
ctypes.CDLL("libc.so.6").malloc_trim(0)

메모리 정리 완료 - 사용률: 49.6%


KeyError: '_oh'