## Binance top 200 coins by volume and momentum

In [90]:
coins = 400

## 1- Obtengo la data usando la API de Binance

In [91]:
import requests
import pandas as pd
from datetime import datetime, timedelta

def get_top_volume_coins_list_api(count=200):
    # Obtener la lista de todos los símbolos de trading
    symbols_url = "https://api.binance.com/api/v3/exchangeInfo"
    symbols_response = requests.get(symbols_url)
    symbols_data = symbols_response.json()
    
    # Filtrar solo los pares con USDT
    usdt_symbols = [symbol['symbol'] for symbol in symbols_data['symbols'] if symbol['symbol'].endswith('USDT')]

    # Elimino las stablecoins
    stablecoins = ['USDCUSDT', 'FDUSDUSDT', '1000SATS', '1000SATSBTC', 'WBTC']
    usdt_symbols = [symbol for symbol in usdt_symbols if symbol not in stablecoins]
    
    # Calcular la fecha de inicio (7 días atrás)
    start_time = int((datetime.now() - timedelta(days=7)).timestamp() * 1000)
    
    # Obtener el volumen para cada símbolo
    volumes = []
    for symbol in usdt_symbols:
        klines_url = f"https://api.binance.com/api/v3/klines?symbol={symbol}&interval=1d&startTime={start_time}"
        klines_response = requests.get(klines_url)
        klines_data = klines_response.json()
        
        # Calcular el volumen promedio
        total_volume = sum(float(kline[7]) for kline in klines_data) #7 es quote asset volume
        avg_volume = total_volume / len(klines_data) if klines_data else 0
        volumes.append((symbol[:-4], avg_volume))  # Removemos 'USDT' del símbolo
    
    # Ordenar por volumen descendente y tomar los primeros 'count'
    top_volumes = sorted(volumes, key=lambda x: x[1], reverse=True)[:count]
    
    return top_volumes  # Ahora retornamos la lista completa de tuplas (moneda, volumen)

def get_top_volume_coins_df_api(count=200):
    volumes = get_top_volume_coins_list_api(count)
    df = pd.DataFrame(volumes, columns=['coin', 'average volume last 7 days'])

    # Ordenar el DataFrame antes de formatear los números
    df = df.sort_values('average volume last 7 days', ascending=False)

   # Formatear los números después de ordenar
    df['average volume last 7 days'] = df['average volume last 7 days'].apply(lambda x: f'{x:.2f}')

    return df

In [92]:
api_top_coins_list = get_top_volume_coins_list_api(coins)
#api_top_coins_list

In [93]:
api_top_coins_df = get_top_volume_coins_df_api(coins)
api_top_coins_df

Unnamed: 0,coin,average volume last 7 days
0,BTC,1214427543.54
1,ETH,440531663.85
2,SOL,267763730.68
3,XRP,108705415.35
4,PEPE,101413839.21
...,...,...
379,BCHSV,0.00
378,BCHABC,0.00
377,PAX,0.00
376,VEN,0.00


#### Conclusion
Mejor uso el API directamente, ya que evito que CS50 tenga que instalar un paquete adicional de python. 

Las variables que pasan a la siguiente etapa son: 


api_top_coins_df 

api_top_coins_list

Trabajare con la lista pero primero tengo que eliminar los valores de volumen, que hago a continuacion

In [94]:
# Get the ticker list for coins.
top_coins = [item[0] for item in api_top_coins_list]
top_coins

['BTC',
 'ETH',
 'SOL',
 'XRP',
 'PEPE',
 'BNB',
 'SUI',
 'FET',
 'DOGS',
 'WIF',
 'CKB',
 '1000SATS',
 'DOGE',
 'AAVE',
 'TON',
 'TRX',
 'FTM',
 'AVAX',
 'RUNE',
 'ORDI',
 'NEAR',
 'BOME',
 'PEOPLE',
 'ENA',
 'POL',
 'WLD',
 'LTC',
 'ICP',
 'SEI',
 'NOT',
 'TIA',
 'TAO',
 'FLOKI',
 'ARB',
 'ADA',
 'PENDLE',
 'INJ',
 'RENDER',
 'LUNA',
 'SAGA',
 'EUR',
 'CRV',
 'LINK',
 'BONK',
 'ZRO',
 'SUN',
 'STRK',
 'AR',
 'SHIB',
 'SUPER',
 'IO',
 'EURI',
 'RARE',
 'OP',
 'FIL',
 'UNI',
 'APT',
 'GALA',
 'GMT',
 'COTI',
 'BNX',
 'DOT',
 'ARKM',
 'BCH',
 'QUICK',
 'ENS',
 'JUP',
 'LUNC',
 'STX',
 'APE',
 'OM',
 'ETHFI',
 'MKR',
 'ATOM',
 'ZK',
 'BB',
 'JASMY',
 'TRB',
 'HARD',
 'PIXEL',
 'JTO',
 'AERGO',
 'DYDX',
 'TRU',
 'TKO',
 'RSR',
 'RDNT',
 'ROSE',
 'MANTA',
 'ALT',
 'DAR',
 'AEVO',
 'REZ',
 'SYN',
 'AI',
 'SSV',
 'BEAMX',
 'LOKA',
 'LDO',
 'ARPA',
 'USTC',
 'ASTR',
 'EOS',
 'BANANA',
 'MEME',
 'VIDT',
 'XAI',
 'COMP',
 'CFX',
 'THETA',
 'ETC',
 'HBAR',
 'AUCTION',
 'CAKE',
 'BSW',
 '1INCH',


In [103]:
# Guardo manualmente los datos
top_coins_manual = ['BTC',
 'ETH',
 'SOL',
 'XRP',
 'PEPE',
 'BNB',
 'SUI',
 'FET',
 'DOGS',
 'WIF',
 'CKB',
 '1000SATS',
 'DOGE',
 'AAVE',
 'TON',
 'TRX',
 'FTM',
 'AVAX',
 'RUNE',
 'ORDI',
 'NEAR',
 'BOME',
 'PEOPLE',
 'ENA',
 'POL',
 'WLD',
 'LTC',
 'ICP',
 'SEI',
 'NOT',
 'TIA',
 'TAO',
 'FLOKI',
 'ARB',
 'ADA',
 'PENDLE',
 'INJ',
 'RENDER',
 'LUNA',
 'SAGA',
 'EUR',
 'CRV',
 'LINK',
 'BONK',
 'ZRO',
 'SUN',
 'STRK',
 'AR',
 'SHIB',
 'SUPER',
 'IO',
 'EURI',
 'RARE',
 'OP',
 'FIL',
 'UNI',
 'APT',
 'GALA',
 'GMT',
 'COTI',
 'BNX',
 'DOT',
 'ARKM',
 'BCH',
 'QUICK',
 'ENS',
 'JUP',
 'LUNC',
 'STX',
 'APE',
 'OM',
 'ETHFI',
 'MKR',
 'ATOM',
 'ZK',
 'BB',
 'JASMY',
 'TRB',
 'HARD',
 'PIXEL',
 'JTO',
 'AERGO',
 'DYDX',
 'TRU',
 'TKO',
 'RSR',
 'RDNT',
 'ROSE',
 'MANTA',
 'ALT',
 'DAR',
 'AEVO',
 'REZ',
 'SYN',
 'AI',
 'SSV',
 'BEAMX',
 'LOKA',
 'LDO',
 'ARPA',
 'USTC',
 'ASTR',
 'EOS',
 'BANANA',
 'MEME',
 'VIDT',
 'XAI',
 'COMP',
 'CFX',
 'THETA',
 'ETC',
 'HBAR',
 'AUCTION',
 'CAKE',
 'BSW',
 '1INCH',
 'YGG',
 'TWT',
 'WOO',
 'SLF',
 'STMX',
 'OGN',
 'ELF',
 'VOXEL',
 'SYS',
 'VITE',
 'G',
 'DYM',
 'GRT',
 'VANRY',
 'PYTH',
 'CHESS',
 'RPL',
 'LISTA',
 'ALPACA',
 'LQTY',
 'LPT',
 'FIDA',
 'VIC',
 'ACE',
 'MBOX',
 'NULS',
 'ALGO',
 'IMX',
 'BLUR',
 'BAKE',
 'AKRO',
 'XLM',
 'CVC',
 'VET',
 'POLYX',
 'W',
 'LEVER',
 'FLUX',
 'STG',
 'OMNI',
 'SNX',
 'TNSR',
 'MASK',
 'SAND',
 'ACH',
 'WBTC',
 'KSM',
 'PORTAL',
 'QNT',
 'MINA',
 'MOVR',
 'API3',
 'ZEC',
 'IDEX',
 'HIGH',
 'SUSHI',
 'RAY',
 'PHB',
 'ILV',
 'EGLD',
 'PAXG',
 'MAGIC',
 'STPT',
 'BURGER',
 'BEL',
 'CYBER',
 'C98',
 'HOOK',
 'HOT',
 'USDP',
 'KAVA',
 'METIS',
 'AXS',
 'REI',
 'MATIC',
 'TFUEL',
 'CHZ',
 'CREAM',
 'MTL',
 'CHR',
 'DUSK',
 'GLMR',
 'SKL',
 'STORJ',
 'EDU',
 'NFP',
 'AXL',
 'LTO',
 'BTTC',
 'LIT',
 'GTC',
 'IOTA',
 'ANKR',
 'TLM',
 'GFT',
 'CELO',
 'KLAY',
 'ZIL',
 'DATA',
 'ZEN',
 'NEO',
 'LRC',
 'TUSD',
 'RONIN',
 'FTT',
 'RIF',
 'GMX',
 'ATA',
 'LINA',
 'YFI',
 'ONE',
 'UNFI',
 'KEY',
 'ZRX',
 'ENJ',
 'NKN',
 'MANA',
 'XEC',
 'OSMO',
 'ACA',
 'XVS',
 'NTRN',
 'NMR',
 'SPELL',
 'RAD',
 'MAV',
 'FIS',
 'BICO',
 'ALICE',
 'RVN',
 'BAL',
 'PHA',
 'UFT',
 'AUDIO',
 'BLZ',
 'ARDR',
 'GAS',
 'DODO',
 'IOST',
 'COS',
 'FLOW',
 'ID',
 'PERP',
 'FIO',
 'DASH',
 'KDA',
 'ALPHA',
 'GHST',
 'PDA',
 'REN',
 'JOE',
 'UMA',
 'IOTX',
 'FLM',
 'IRIS',
 'DIA',
 'SFP',
 'IQ',
 'AMB',
 'T',
 'STRAX',
 'CVX',
 'AMP',
 'SXP',
 'FXS',
 'OAX',
 'PYR',
 'ORN',
 'AGLD',
 'NEXO',
 'ONT',
 'WAXP',
 'MBL',
 'XTZ',
 'ARK',
 'SCRT',
 'OXT',
 'BADGER',
 'DENT',
 'ALCX',
 'WBETH',
 'GLM',
 'CTK',
 'LSK',
 'CELR',
 'PORTO',
 'CTSI',
 'HIFI',
 'RLC',
 'SLP',
 'QTUM',
 'ERN',
 'POND',
 'KNC',
 'CTXC',
 'BETA',
 'COMBO',
 'UTK',
 'TROY',
 'QKC',
 'QI',
 'POWR',
 'PUNDIX',
 'MLN',
 'XVG',
 'BAND',
 'BAT',
 'ADX',
 'DCR',
 'MDT',
 'DEGO',
 'XNO',
 'SANTOS',
 'OOKI',
 'WING',
 'GNO',
 'VIB',
 'FORTH',
 'VTHO',
 'WIN',
 'OG',
 'KP3R',
 'SC',
 'HIVE',
 'FARM',
 'PROM',
 'FIRO',
 'CLV',
 'AST',
 'ONG',
 'PIVX',
 'ALPINE',
 'HFT',
 'LAZIO',
 'JST',
 'STEEM',
 'SNT',
 'ATM',
 'GNS',
 'ICX',
 'AVA',
 'WAN',
 'FUN',
 'DGB',
 'PSG',
 'ACM',
 'CITY',
 'ASR',
 'DEXE',
 'BNT',
 'PROS',
 'KMD',
 'BIFI',
 'BAR',
 'REQ',
 'WRX',
 'DF',
 'AEUR',
 'JUV',
 'BCC',
 'VEN',
 'PAX',
 'BCHABC',
 'BCHSV',
 'WAVES',
 'BTT',
 'USDS',
 'XMR',
 'NANO',
 'OMG',
 'MITH',
 'USDSB',
 'GTO',
 'ERD',
 'NPXS',
 'COCOS',
 'TOMO',
 'PERL',
 'MFT',
 'STORM',
 'DOCK',
 'BUSD',
 'BEAM',
 'HC']

## 2- Obtener klines para cada criptomoeda

#### USANDO EL WRAPER

In [95]:
# Obtiene klines con la lista top_coins, el par BTC y el par USDT
# FUNCION QUE USA EL WRAPER
import pandas as pd
from binance.client import Client
from datetime import datetime, timedelta, timezone
import os


client = Client()

not_available_btcpair = []
# FUNCION PARA BTC PAIRS
def get_klines_btcpair_wraper(crypto_list, weeks_back: int):
    """    
    weeks_back: int -> Indica la cantidad de semanas atras a considerar. 0 para esta semana, 1 para la semana anterior, etc.
    """
    today = datetime.now(timezone.utc)  # Asegurarse de trabajar en UTC
    
    # Calcular el lunes de la semana actual
    monday_this_week = today - timedelta(days=today.weekday())

    # Obtener la fecha del lunes de la semana objetivo y convertir a 00:00 en UTC
    target_monday = monday_this_week - timedelta(weeks=weeks_back)
    target_monday_at_midnight = target_monday.replace(hour=0, minute=0, second=0, microsecond=0)

    # Obtener la fecha del domingo de la semana objetivo y convertir a 00:00 en UTC
    target_sunday = target_monday + timedelta(days=6)
    target_sunday_at_midnight = target_sunday.replace(hour=0, minute=0, second=0, microsecond=0)    

    # Retornar como timestamp en UTC en str
    start_timestamp = str(target_monday_at_midnight.timestamp())
    print(f"Start timestamp: {start_timestamp}")

    end_timestamp = str(target_sunday_at_midnight.timestamp())
    print(f"End timestamp: {end_timestamp}")


    dataframes = []

    # Crear la carpeta 'data' si no existe
    if not os.path.exists('data'):
        os.makedirs('data')

    for crypto in crypto_list:
        try:
            print(f"Fetching data for {crypto}BTC...")
            klines = client.get_historical_klines(
                symbol=f"{crypto}BTC", # for BTC pairs
                #symbol=f"{crypto}USDT", # for USDT pairs
                interval=Client.KLINE_INTERVAL_1DAY,
                start_str=start_timestamp,
                end_str=end_timestamp,
            )
            print (klines)

            # Crear el DataFrame
            df = pd.DataFrame(klines, columns=['timestamp', 'open', 'high', 'low', 'close', 'volume', 'close_time', 'quote_asset_volume', 'number_of_trades', 'taker_buy_base_asset_volume', 'taker_buy_quote_asset_volume', 'ignore'])
            
            # Convertir el timestamp a datetime
            df['timestamp'] = pd.to_datetime(df['timestamp'], unit='ms')
            
            # Establecer el timestamp como índice
            df.set_index('timestamp', inplace=True)
            
            # Convertir las columnas necesarias a float
            for col in ['open', 'high', 'low', 'close', 'volume']:
                df[col] = df[col].astype(float)
            
            # Guardar el DataFrame como CSV
            filename = f"data/{crypto}BTC.csv"
            df.to_csv(filename)
            
            dataframes.append(df)
            print(f"Datos de {crypto} guardados en {filename}")

        except Exception as e:
            print(f"Error al obtener datos para {crypto}BTC.")
            print(e)
            not_available_btcpair.append(crypto)
            continue

    return dataframes

#ejemplo de uso
#dataframes = get_klines_btcpair_wraper(top_coins, 1)

#### USANDO LA API PELADA

In [96]:
# Obtiene klines con la lista top_coins, el par BTC y el par USDT
# FUNCION QUE USA EL WRAPER
import pandas as pd
from binance.client import Client
from datetime import datetime, timedelta, timezone
import os


client = Client()

not_available_btcpair = []
# FUNCION PARA BTC PAIRS
def get_klines_btcpair(crypto_list, weeks_back: int):
    """    
    weeks_back: int -> Indica la cantidad de semanas atras a considerar. 0 para esta semana, 1 para la semana anterior, etc.
    """
    today = datetime.now(timezone.utc)  # Asegurarse de trabajar en UTC
    
    # Calcular el lunes de la semana actual
    monday_this_week = today - timedelta(days=today.weekday())

    # Obtener la fecha del lunes de la semana objetivo y convertir a 00:00 en UTC
    target_monday = monday_this_week - timedelta(weeks=weeks_back)
    target_monday_at_midnight = target_monday.replace(hour=0, minute=0, second=0, microsecond=0)

    # Obtener la fecha del domingo de la semana objetivo y convertir a 00:00 en UTC
    target_sunday = target_monday + timedelta(days=6)
    target_sunday_at_midnight = target_sunday.replace(hour=0, minute=0, second=0, microsecond=0)    

    # Retornar como timestamp en UTC en str
    start_timestamp = str(int(target_monday_at_midnight.timestamp()))
    print(f"Start timestamp: {start_timestamp}")

    end_timestamp = str(int(target_sunday_at_midnight.timestamp()))
    print(f"End timestamp: {end_timestamp}")


    dataframes = []

    # Crear la carpeta 'data' si no existe
    if not os.path.exists('data'):
        os.makedirs('data')

    for crypto in crypto_list:
        
        print(f"Fetching data for {crypto}BTC...")
        symbol=f"{crypto}BTC" # for BTC pairs
        start_str=start_timestamp+'000'
        #print(start_str)
        end_str=end_timestamp+'000'

        klines_url = f"https://api.binance.com/api/v3/klines?symbol={symbol}&interval=1d&startTime={start_str}&endTime={end_str}"
        print(klines_url)
        klines_response = requests.get(klines_url)
        print(klines_response.status_code)

        if klines_response.status_code == 200:
            print('se obtuvo codigo 200')
            klines_data = klines_response.json()
            if len(klines_data) == 0:
                print(f"No data available for {crypto}BTC")
                not_available_btcpair.append(crypto)
                continue
            print (klines_data)

            # Crear el DataFrame
            df = pd.DataFrame(klines_data, columns=['timestamp', 'open', 'high', 'low', 'close', 'volume', 'close_time', 'quote_asset_volume', 'number_of_trades', 'taker_buy_base_asset_volume', 'taker_buy_quote_asset_volume', 'ignore'])
            
            # Convertir el timestamp a datetime
            df['timestamp'] = pd.to_datetime(df['timestamp'], unit='ms')
            
            # Establecer el timestamp como índice
            df.set_index('timestamp', inplace=True)
            
            # Convertir las columnas necesarias a float
            for col in ['open', 'high', 'low', 'close', 'volume']:
                df[col] = df[col].astype(float)
            
            # Eliminar las columnas que no me sirve
            df = df.drop(['close_time', 'quote_asset_volume', 'number_of_trades', 'taker_buy_base_asset_volume', 'taker_buy_quote_asset_volume', 'ignore'], axis=1)

            # Guardar el DataFrame como CSV
            filename = f"data/{crypto}BTC.csv"
            print(filename)
            df.to_csv(filename)
            
            dataframes.append(df)
            print(f"Datos de {crypto} guardados en {filename}")
            print ('-----------------------------------------')
        
        elif klines_response.status_code == 404:
            print(f"Error: {crypto}BTC no está disponible en Binance.")
            print(klines_response.text)
            not_available_btcpair.append(crypto)
            print ('-----------------------------------------')

        elif klines_response.status_code == 400:
            print(f"Error: {crypto}BTC no está disponible en Binance.")
            not_available_btcpair.append(crypto)
            print ('-----------------------------------------')

    return dataframes

#ejemplo de uso
dataframes = get_klines_btcpair(top_coins, 1) #llamo al de la semana pasada

Start timestamp: 1725840000
End timestamp: 1726358400
Fetching data for BTCBTC...
https://api.binance.com/api/v3/klines?symbol=BTCBTC&interval=1d&startTime=1725840000000&endTime=1726358400000
400
Error: BTCBTC no está disponible en Binance.
-----------------------------------------
Fetching data for ETHBTC...
https://api.binance.com/api/v3/klines?symbol=ETHBTC&interval=1d&startTime=1725840000000&endTime=1726358400000
200
se obtuvo codigo 200
[[1725840000000, '0.04187000', '0.04214000', '0.04087000', '0.04136000', '25662.43730000', 1725926399999, '1066.29120331', 170487, '10848.35870000', '451.00854009', '0'], [1725926400000, '0.04137000', '0.04150000', '0.04096000', '0.04144000', '20017.08260000', 1726012799999, '824.89332045', 150993, '9192.16590000', '378.85187567', '0'], [1726012800000, '0.04143000', '0.04144000', '0.04054000', '0.04083000', '30792.17250000', 1726099199999, '1263.27167437', 187350, '14297.87500000', '586.76673132', '0'], [1726099200000, '0.04082000', '0.04094000', '

In [97]:
not_available_btcpair

['BTC',
 'PEPE',
 'DOGS',
 'CKB',
 '1000SATS',
 'NOT',
 'FLOKI',
 'LUNA',
 'EUR',
 'BONK',
 'SUN',
 'SHIB',
 'EURI',
 'QUICK',
 'JUP',
 'LUNC',
 'JASMY',
 'HARD',
 'JTO',
 'AERGO',
 'RSR',
 'SYN',
 'BEAMX',
 'USTC',
 'MEME',
 'BSW',
 'STMX',
 'VOXEL',
 'G',
 'CHESS',
 'RPL',
 'LISTA',
 'ALPACA',
 'AKRO',
 'CVC',
 'LEVER',
 'MASK',
 'RAY',
 'BURGER',
 'HOT',
 'USDP',
 'REI',
 'CREAM',
 'BTTC',
 'GFT',
 'TUSD',
 'FTT',
 'LINA',
 'KEY',
 'XEC',
 'OSMO',
 'SPELL',
 'UFT',
 'IOST',
 'GHST',
 'IQ',
 'AMB',
 'T',
 'CVX',
 'AMP',
 'MBL',
 'ARK',
 'DENT',
 'ALCX',
 'WBETH',
 'PORTO',
 'HIFI',
 'SLP',
 'ERN',
 'BETA',
 'COMBO',
 'TROY',
 'PUNDIX',
 'XVG',
 'DEGO',
 'OOKI',
 'WING',
 'GNO',
 'VTHO',
 'WIN',
 'KP3R',
 'SC',
 'FARM',
 'FIRO',
 'AST',
 'ALPINE',
 'LAZIO',
 'ATM',
 'GNS',
 'FUN',
 'PSG',
 'ACM',
 'CITY',
 'ASR',
 'DEXE',
 'PROS',
 'BIFI',
 'BAR',
 'WRX',
 'DF',
 'AEUR',
 'JUV',
 'BCC',
 'VEN',
 'PAX',
 'BCHABC',
 'BCHSV',
 'WAVES',
 'BTT',
 'USDS',
 'XMR',
 'NANO',
 'OMG',
 'MITH',
 

## 3. Data Processing

In [98]:
# Limpiamos el df con solo las columnas que nos interesan

dataframes[0]

Unnamed: 0_level_0,open,high,low,close,volume
timestamp,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2024-09-09,0.04187,0.04214,0.04087,0.04136,25662.4373
2024-09-10,0.04137,0.0415,0.04096,0.04144,20017.0826
2024-09-11,0.04143,0.04144,0.04054,0.04083,30792.1725
2024-09-12,0.04082,0.04094,0.04019,0.04063,26384.8251
2024-09-13,0.04063,0.04082,0.04024,0.04032,25640.4495
2024-09-14,0.04033,0.04054,0.04003,0.04031,12945.3638
2024-09-15,0.04031,0.04035,0.03893,0.03918,21109.2537


In [99]:
import os
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression

def analyze_crypto_data(data_folder='data'):
    results = []
    
    for filename in os.listdir(data_folder):
        if filename.endswith('.csv'):
            coin = filename.split('.')[0]
            filepath = os.path.join(data_folder, filename)
            
            # Leer el archivo CSV
            df = pd.read_csv(filepath)
            df['timestamp'] = pd.to_datetime(df['timestamp'])
            
            # Calcular el retorno
            first_open = df.iloc[0]['open']
            last_close = df.iloc[-1]['close']
            returns = (last_close - first_open) / first_open * 100
            
            # Preparar datos para la regresión lineal
            X = np.arange(len(df)).reshape(-1, 1)
            y = df['close'].values
            
            # Realizar regresión lineal
            model = LinearRegression()
            model.fit(X, y)
            
            intercept = model.intercept_
            slope = model.coef_[0]
            
            results.append({
                'coin': coin,
                'return': returns,
                'intercept': intercept,
                'slope': slope
            })
            print(f"Análisis para {coin} completado.")
    
    # Crear DataFrame con los resultados
    result_df = pd.DataFrame(results)
    
    # Ordenar por slope de mayor a menor
    result_df = result_df.sort_values('slope', ascending=False)
    
    return result_df

# Ejemplo de uso
df_maestro = analyze_crypto_data()
df_maestro

Análisis para MINABTC completado.
Análisis para HIGHBTC completado.
Análisis para AGLDBTC completado.
Análisis para LSKBTC completado.
Análisis para WLDBTC completado.
Análisis para ANKRBTC completado.
Análisis para VIDTBTC completado.
Análisis para VITEBTC completado.
Análisis para CELRBTC completado.
Análisis para RADBTC completado.
Análisis para GLMBTC completado.
Análisis para CFXBTC completado.
Análisis para FLMBTC completado.
Análisis para AXSBTC completado.
Análisis para BLURBTC completado.
Análisis para WBTCBTC completado.
Análisis para OXTBTC completado.
Análisis para CRVBTC completado.
Análisis para LDOBTC completado.
Análisis para APEBTC completado.
Análisis para BNBBTC completado.
Análisis para COMPBTC completado.
Análisis para NFPBTC completado.
Análisis para RLCBTC completado.
Análisis para LINKBTC completado.
Análisis para HFTBTC completado.
Análisis para RIFBTC completado.
Análisis para YGGBTC completado.
Análisis para CTSIBTC completado.
Análisis para ENJBTC completado

Unnamed: 0,coin,return,intercept,slope
183,TAOBTC,13.606047,0.004884,0.000072
15,WBTCBTC,0.020016,0.998739,0.000054
20,BNBBTC,2.049940,0.009073,0.000045
62,ORDIBTC,-0.133537,0.000524,0.000003
99,INJBTC,6.797430,0.000315,0.000002
...,...,...,...,...
149,BCHBTC,-3.827493,0.005807,-0.000063
74,PAXGBTC,-4.302964,0.043899,-0.000131
146,ETHBTC,-6.424648,0.041579,-0.000332
68,MKRBTC,-7.257204,0.028426,-0.000349


#### Ploteo de grafica

In [100]:
# Ploteo 1, plotea bien el linechart pero no el candlestick

import os
import pandas as pd
import matplotlib.pyplot as plt
import mplfinance as mpf

def plot_crypto_data(df_maestro, data_folder='data', plot_folder='plots'):
    # Crear la carpeta 'plots' si no existe
    if not os.path.exists(plot_folder):
        os.makedirs(plot_folder)

    for _, row in df_maestro.iterrows():
        coin = row['coin']
        slope = row['slope']
        intercept = row['intercept']

        # Leer el archivo CSV correspondiente
        df = pd.read_csv(os.path.join(data_folder, f"{coin}.csv"))
        df['timestamp'] = pd.to_datetime(df['timestamp'])
        df.set_index('timestamp', inplace=True)

        # Calcular la línea de regresión
        x = range(len(df))
        regression_line = [slope * xi + intercept for xi in x]

        # Gráfico de línea
        plt.figure(figsize=(12, 6))
        plt.plot(df.index, df['close'], label='Precio de cierre')
        plt.plot(df.index, regression_line, label='Regresión lineal', color='red')
        plt.title(f"Análisis de {coin} - Gráfico de línea")
        plt.xlabel("Fecha")
        plt.ylabel("Precio")
        plt.legend()
        plt.xticks(rotation=45)
        plt.tight_layout()
        plt.savefig(os.path.join(plot_folder, f"{coin}_line.png"))
        plt.show()

        # Gráfico de velas (candlestick)
        fig, ax = plt.subplots(figsize=(12, 6))
        mpf.plot(df, type='candle', style='yahoo', ax=ax)
        ax.plot(df.index, regression_line, label='Regresión lineal', color='red')
        ax.set_title(f"Análisis de {coin} - Gráfico de velas")
        ax.set_xlabel("Fecha")
        ax.set_ylabel("Precio")
        ax.legend()
        plt.xticks(rotation=45)
        plt.tight_layout()
        plt.savefig(os.path.join(plot_folder, f"{coin}_candlestick.png"))
        plt.show()

# Ejemplo de uso:
#df_maestro = analyze_crypto_data()  # Asumiendo que esta función ya fue definida y ejecutada
#plot_crypto_data(df_maestro)

In [101]:
# Ploteo 2, plotea mal las velas no suma el slope e intercepto

import os
import pandas as pd
import matplotlib.pyplot as plt
import mplfinance as mpf

def plot_crypto_data(df_maestro, data_folder='data', plot_folder='plots'):
    # Crear la carpeta 'plots' si no existe
    if not os.path.exists(plot_folder):
        os.makedirs(plot_folder)

    for _, row in df_maestro.iterrows():
        coin = row['coin']
        slope = row['slope']
        intercept = row['intercept']

        # Leer el archivo CSV correspondiente
        df = pd.read_csv(os.path.join(data_folder, f"{coin}.csv"))
        df['timestamp'] = pd.to_datetime(df['timestamp'])
        df.set_index('timestamp', inplace=True)

        # Calcular la línea de regresión
        x = range(len(df))
        regression_line = [slope * xi + intercept for xi in x]

        # Gráfico de línea
        plt.figure(figsize=(12, 6))
        plt.plot(df.index, df['close'], label='Precio de cierre')
        plt.plot(df.index, regression_line, label='Regresión lineal', color='red')
        plt.title(f"Análisis de {coin} - Gráfico de línea")
        plt.xlabel("Fecha")
        plt.ylabel("Precio")
        plt.legend()
        plt.xticks(rotation=45)
        plt.tight_layout()
        plt.savefig(os.path.join(plot_folder, f"{coin}_line.png"))
        plt.close()

        # Gráfico de velas (candlestick)
        mpf.plot(df, type='candle', style='yahoo', title=f"Análisis de {coin} - Gráfico de velas",
                 ylabel='Precio', ylabel_lower='Volumen',
                 volume=True, figsize=(12, 6),
                 savefig=os.path.join(plot_folder, f"{coin}_candlestick.png"))
        
        # Agregar la línea de regresión al gráfico de velas
        fig, axes = mpf.plot(df, type='candle', style='yahoo', title=f"Análisis de {coin} - Gráfico de velas",
                             ylabel='Precio', ylabel_lower='Volumen',
                             volume=True, figsize=(12, 6),
                             returnfig=True)
        axes[0].plot(df.index, regression_line, color='red', label='Regresión lineal')
        axes[0].legend(['Regresión lineal'])
        plt.savefig(os.path.join(plot_folder, f"{coin}_candlestick_with_regression.png"))
        plt.close()

# Ejemplo de uso:
#df_maestro = analyze_crypto_data()  # Asumiendo que esta función ya fue definida y ejecutada
#plot_crypto_data(df_maestro)