### Análisis de Datos del Mercado de Criptomonedas con Binance API

- En la era digital actual, el mercado de criptomonedas ha emergido como un campo fascinante y dinámico, ofreciendo oportunidades únicas para el análisis de datos y la comprensión de las tendencias del mercado financiero. Nuestro proyecto se centra en explorar este sector vibrante utilizando una de las herramientas más poderosas en el mundo de las criptomonedas: la API de Binance.

- Binance, siendo una de las plataformas de intercambio de criptomonedas más grandes y reconocidas a nivel mundial, proporciona una API rica y robusta, permitiendo a los usuarios acceder a una amplia gama de datos del mercado en tiempo real. Esto incluye, pero no se limita a, datos históricos de precios, detalles de operaciones individuales, volúmenes de trading, y mucho más.

- El objetivo principal de este proyecto es aprovechar estos datos para obtener insights valiosos sobre el comportamiento del mercado de Bitcoin (BTC), la criptomoneda líder en el mercado. Nos centraremos en extraer datos históricos de precios y operaciones de BTC comparados con el USD, analizando las tendencias, volatilidades y posibles patrones de trading.

- Al final de este proyecto, esperamos tener un análisis detallado y multifacético del mercado de Bitcoin, brindando un panorama claro no solo para los entusiastas de las criptomonedas, sino también para aquellos interesados en las finanzas y la tecnología. Este desafío es una excelente oportunidad para sumergirnos en el mundo del análisis de datos financieros y abrir la puerta a futuras investigaciones y proyectos en este apasionante campo.

# Introduccion

En el presente proyecto se prevee analizar las variaciones de bitcoin, Intentando agregar valores foraneos como comentarios en redes o fragmentos de noticias recabados de internet.

La finalidad del mismo es tratar de predecir a corto plazo el valor de la moneda, De esta forma crear un bot de trading de alto flujo y que pueda ser porbado en un entorno de produccion

Los bot de trading siempre se utilizaron con algorimos basicos y ultimamente estan utilizando data Science para mejorar sus modelos, Lo que presenta un mercado en crecimiento y un nicho de mercado importante


# Descripcion

Para esto utilizaremos la API de binance a travez de su cliente en python, La cual nos deja acceso a muchas variables pero en estos momentos solo nos centraremos en el precio. 

Una vez el modelo este en funcionamiento, la misma api de binance permite realizar compras y ventas de BTC en un muy corto periodo de tiempo

In [4]:
# paquetes necesarios
import requests
import pandas as pd
import hmac
import hashlib
import time
from datetime import datetime, timedelta, timezone
import matplotlib.pyplot as plt
from decouple import config
from binance.client import Client
import plotly.graph_objs as go
import statsmodels.api as sm
from pandas.plotting import register_matplotlib_converters
import statsmodels.api as sm
api_key = config('API_KEY')
api_secret = config('API_SECRET')
api_limit = 1000
requestDays = 3365
limit = 1000

## Descargar ultimos precios

In [2]:
# Crear una instancia del cliente de Binance
client = Client(api_key, api_secret)

# Calcular las fechas para el último mes
end_date = datetime.now(timezone.utc)
start_date = end_date - timedelta(days=requestDays)

# Convertir las fechas a milisegundos (que es el formato que la API de Binance espera)
start_date_timestamp = int(start_date.timestamp() * 1000)
end_date_timestamp = int(end_date.timestamp() * 1000)

# Obtener los datos del precio del Bitcoin para el último mes con intervalo de 1 minuto
symbol = 'BTCUSDT'
interval = Client.KLINE_INTERVAL_1MINUTE

In [3]:

# Inicializar una lista para almacenar los datos
all_klines = []

# Hacer llamadas sucesivas para obtener más datos (limitando cada llamada a 500)

while start_date_timestamp < end_date_timestamp:
    klines = client.get_klines(symbol=symbol, interval=interval, startTime=start_date_timestamp, endTime=end_date_timestamp, limit=limit)
    
    # Verificar si hay datos en la respuesta
    if not klines:
        break
    
    all_klines.extend(klines)
    
    # Actualizar el startTime para la siguiente llamada
    start_date_timestamp = int((pd.to_datetime(klines[-1][0], unit='ms') + timedelta(minutes=1)).timestamp() * 1000)

# Comprobar si se recuperaron datos antes de crear el DataFrame
if all_klines:
    # Crear un DataFrame de Pandas con todos los datos
    columns = ['timestamp', 'open', 'high', 'low', 'close', 'volume', 'close_time', 'quote_asset_volume', 'number_of_trades', 'taker_buy_base_asset_volume', 'taker_buy_quote_asset_volume', 'ignore']
    df = pd.DataFrame(all_klines, columns=columns)

    # Convertir el timestamp a formato de fecha y hora legible
    df['timestamp'] = pd.to_datetime(df['timestamp'], unit='ms')

    # Mostrar el DataFrame
    df.info()
else:
    print("No se encontraron datos para el período especificado.")

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3442256 entries, 0 to 3442255
Data columns (total 12 columns):
 #   Column                        Dtype         
---  ------                        -----         
 0   timestamp                     datetime64[ns]
 1   open                          object        
 2   high                          object        
 3   low                           object        
 4   close                         object        
 5   volume                        object        
 6   close_time                    int64         
 7   quote_asset_volume            object        
 8   number_of_trades              int64         
 9   taker_buy_base_asset_volume   object        
 10  taker_buy_quote_asset_volume  object        
 11  ignore                        object        
dtypes: datetime64[ns](1), int64(2), object(9)
memory usage: 315.1+ MB


In [4]:
df.sample(5)

Unnamed: 0,timestamp,open,high,low,close,volume,close_time,quote_asset_volume,number_of_trades,taker_buy_base_asset_volume,taker_buy_quote_asset_volume,ignore
372957,2018-05-05 01:26:00,9749.72,9751.92,9740.09,9741.34,7.939494,1525483619999,77385.51682704,96,5.356268,52219.90382471,0
377888,2018-05-08 11:37:00,9234.99,9239.48,9232.38,9236.77,16.21374,1525779479999,149751.95779818,149,5.768944,53287.96336271,0
1619878,2020-09-20 01:45:00,10971.07,10978.42,10969.35,10971.09,44.290183,1600566359999,486001.77276704,463,34.939845,383401.53815164,0
1640778,2020-10-04 14:05:00,10612.24,10612.25,10608.09,10609.8,24.769676,1601820359999,262797.67356599,279,16.041594,170191.64540433,0
3231165,2023-10-15 00:37:00,26821.89,26821.89,26815.76,26816.98,11.56553,1697330279999,310181.0328059,751,2.68387,71972.6366392,0


In [5]:
## save df to backup.json
df.to_json('backup.json')

In [5]:
## recuperar backup.json to df
df = pd.read_json('backup.json')
df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 3442256 entries, 0 to 3442255
Data columns (total 12 columns):
 #   Column                        Dtype         
---  ------                        -----         
 0   timestamp                     datetime64[ns]
 1   open                          float64       
 2   high                          float64       
 3   low                           float64       
 4   close                         float64       
 5   volume                        float64       
 6   close_time                    datetime64[ns]
 7   quote_asset_volume            float64       
 8   number_of_trades              int64         
 9   taker_buy_base_asset_volume   float64       
 10  taker_buy_quote_asset_volume  float64       
 11  ignore                        int64         
dtypes: datetime64[ns](2), float64(8), int64(2)
memory usage: 341.4 MB


In [6]:
# Filtra el DataFrame para obtener solo los datos del último día
ultimo_dia = df[df['timestamp'].dt.date == df['timestamp'].max().date()]

# Crea la figura de Plotly
fig = go.Figure()

# Añade la línea al gráfico
fig.add_trace(go.Scatter(x=ultimo_dia['timestamp'], y=ultimo_dia['close'], mode='lines+markers', name='Precio de cierre'))

# Configura el diseño del gráfico
fig.update_layout(title='Precio de cierre del último día',
                  xaxis_title='Timestamp',
                  yaxis_title='Precio de cierre')

# Añade la funcionalidad de mostrar información al pasar el cursor
fig.update_layout(hovermode='x unified')

# Muestra el gráfico
fig.show()

In [7]:
# Supongamos que df es tu DataFrame

# Filtra el DataFrame para obtener solo los datos del último mes
ultimo_mes = df[df['timestamp'] >= df['timestamp'].max() - pd.DateOffset(months=1)]

# Crea la figura de Plotly
fig = go.Figure()

# Añade la línea al gráfico
fig.add_trace(go.Scatter(x=ultimo_mes['timestamp'], y=ultimo_mes['close'], mode='lines+markers', name='Precio de cierre'))

# Configura el diseño del gráfico
fig.update_layout(title='Precio de cierre del último mes',
                  xaxis_title='Timestamp',
                  yaxis_title='Precio de cierre')

# Añade la funcionalidad de mostrar información al pasar el cursor
fig.update_layout(hovermode='x unified')

# Muestra el gráfico
fig.show()


In [7]:
### evaluar que variables pueden servir para entrenar un modelo
df.describe()


Unnamed: 0,open,high,low,close,volume,close_time,quote_asset_volume,number_of_trades,taker_buy_base_asset_volume,taker_buy_quote_asset_volume,ignore
count,3442256.0,3442256.0,3442256.0,3442256.0,3442256.0,3442256,3442256.0,3442256.0,3442256.0,3442256.0,3442256.0
mean,21700.0,21712.56,21687.33,21700.01,50.45948,2020-11-28 21:56:59.518045184,1145468.0,1007.969,25.10016,567842.3,0.0
min,2830.0,2830.0,2817.0,2817.0,0.0,2017-08-17 04:00:59.999000,0.0,0.0,0.0,0.0,0.0
25%,8050.0,8055.96,8044.347,8050.0,10.74162,2019-04-10 04:05:44.999000064,121867.3,166.0,4.83549,53919.58,0.0
50%,16660.61,16668.44,16653.4,16660.84,22.76883,2020-11-29 09:15:29.999000064,394252.1,439.0,10.95789,184235.6,0.0
75%,33412.0,33442.43,33380.0,33411.54,50.89697,2022-07-20 22:44:14.999000064,1257816.0,1024.0,25.44404,614632.5,0.0
max,69816.93,69990.0,69486.81,69816.92,5877.775,2024-03-09 14:47:59.999000,145955700.0,107315.0,3537.453,89475510.0,0.0
std,16395.14,16404.55,16385.75,16395.17,94.46485,,2298619.0,1772.935,48.11464,1178646.0,0.0


# Establecer cuales variables son utiles para el modelo

In [8]:
df.columns

Index(['timestamp', 'open', 'high', 'low', 'close', 'volume', 'close_time',
       'quote_asset_volume', 'number_of_trades', 'taker_buy_base_asset_volume',
       'taker_buy_quote_asset_volume', 'ignore'],
      dtype='object')

In [9]:
# Definir el modelo
model_financial = 'close ~ open + high + low + volume + number_of_trades'

# Ajustar el modelo
lm_financial = sm.OLS.from_formula(model_financial, data=df).fit()

# Imprimir el resumen del modelo
lm_financial.summary()

0,1,2,3
Dep. Variable:,close,R-squared:,1.0
Model:,OLS,Adj. R-squared:,1.0
Method:,Least Squares,F-statistic:,1130000000000.0
Date:,"Sat, 09 Mar 2024",Prob (F-statistic):,0.0
Time:,14:16:59,Log-Likelihood:,-13659000.0
No. Observations:,3442256,AIC:,27320000.0
Df Residuals:,3442250,BIC:,27320000.0
Df Model:,5,,
Covariance Type:,nonrobust,,

0,1,2,3,4,5,6
,coef,std err,t,P>|t|,[0.025,0.975]
Intercept,0.0281,0.012,2.313,0.021,0.004,0.052
open,-0.4656,0.000,-1172.672,0.000,-0.466,-0.465
high,0.7336,0.000,2481.410,0.000,0.733,0.734
low,0.7320,0.000,2477.554,0.000,0.731,0.733
volume,0.0008,0.000,4.808,0.000,0.000,0.001
number_of_trades,1.899e-05,8.71e-06,2.181,0.029,1.92e-06,3.6e-05

0,1,2,3
Omnibus:,2625067.386,Durbin-Watson:,1.902
Prob(Omnibus):,0.0,Jarque-Bera (JB):,15215480245.105
Skew:,-1.984,Prob(JB):,0.0
Kurtosis:,328.683,Cond. No.,82900.0
