![QuantConnect Logo](https://cdn.quantconnect.com/web/i/icon.png)
<hr>

#Estudio de Volume y Dollar bars

## Iniciación

In [1]:
# Importar QuantBook
from QuantConnect.Research import QuantBook

# Importar otros módulos necesarios
from QuantConnect import *
from QuantConnect.Algorithm import QCAlgorithm
from QuantConnect.Data.Market import TradeBar, QuoteBar
from datetime import datetime

# Iniciar QuantBook
qb = QuantBook()

In [1]:
# Importar las librerías necesarias
from datetime import datetime

# Iniciar QuantBook
qb = QuantBook()

# Agregar la suscripción al contrato de futuros del S&P 500 E-Mini
future = qb.AddFuture(Futures.Indices.SP500EMini, Resolution.Minute, 
                      dataNormalizationMode=DataNormalizationMode.BackwardsRatio,
                      dataMappingMode=DataMappingMode.LastTradingDay,
                      contractDepthOffset=0)

# Establecer un filtro para el contrato (opcional dependiendo del análisis)
future.SetFilter(0, 182)  # Filtrar contratos con hasta 6 meses hasta la expiración

# Establecer el rango de fechas para la obtención de datos históricos
start_date = datetime(2023, 3, 1)
end_date = datetime(2024, 1, 1)

# Obtener datos históricos para el rango de fechas especificado
# Se utiliza GetFutureHistory para obtener datos históricos del contrato continuo
future_history = qb.GetFutureHistory(future.Symbol, start_date, end_date, 
                                     Resolution.Minute, fillForward=True, 
                                     extendedMarketHours=False)

# Convertir FutureHistory a DataFrame para análisis
future_history_df = future_history.GetAllData()

# Imprimir o analizar el DataFrame
print(future_history_df.head())


In [2]:
import matplotlib.pyplot as plt
import pandas as pd

# Asegurarse de que el índice esté en formato datetime
future_history_df.index = pd.to_datetime(future_history_df.index.get_level_values(2))

# Suponiendo que queremos graficar los datos de todos los contratos juntos sin seleccionar uno específico
# Podemos agrupar por la fecha y calcular el promedio de los precios de cierre para simplificar
# Esto es solo un ejemplo, en la práctica, querrías seleccionar un contrato específico o ajustar el análisis a tus necesidades
daily_close_avg = future_history_df.groupby(future_history_df.index).mean()['close']

# Graficar los precios de cierre promedio diarios
plt.figure(figsize=(15, 8))
plt.plot(daily_close_avg.index, daily_close_avg, label='Precio de Cierre Promedio Diario')

plt.title('Precios de Cierre Promedio Diario del Contrato de Futuros del S&P 500 E-Mini')
plt.xlabel('Fecha')
plt.ylabel('Precio de Cierre Promedio')
plt.legend()
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()


In [3]:
# Asumiendo que 'future_history_df' es el DataFrame que contiene los datos históricos obtenidos

# Imprimir los nombres de las columnas para identificar las columnas de interés
print("Nombres de columnas:", future_history_df.columns)

# Imprimir los niveles de índice para entender la estructura del índice multinivel
print("Niveles de índice:", future_history_df.index.names)

# Identificar y mostrar el primer registro para entender la estructura de los datos
print("Primer registro del DataFrame:", future_history_df.iloc[0])


In [4]:
# Crear un nuevo DataFrame con las columnas de interés: 'close' y 'volume'
# Utilizamos el índice del DataFrame original para el tiempo
working_df = future_history_df[['close', 'volume']].copy()

# Renombrar el índice para reflejar que representa el tiempo de cierre
working_df.index.rename('Close Time', inplace=True)

# Agregar una columna de símbolo
# Nota: Como no tenemos un identificador de símbolo explícito en los datos proporcionados,
# asumiremos un símbolo genérico o necesitamos ajustar esto según cómo se identifique el símbolo en tu contexto específico
working_df['Symbol'] = 'ES'  # Ajustar según sea necesario

# Reordenar las columnas para poner 'Symbol' primero
working_df = working_df[['Symbol', 'close', 'volume']]

# Mostrar las primeras filas del nuevo DataFrame
print(working_df.head())


## Consolidar barras a 30 minutos para compararlas con Volume y Dollar Bars

In [5]:
# Restablecer el índice para dejar 'time' como la única columna de índice
future_history_df.reset_index(inplace=True)

# Convertir la columna 'time' a datetime si aún no lo es
future_history_df['time'] = pd.to_datetime(future_history_df['time'])

# Establecer 'time' como el nuevo índice del DataFrame
future_history_df.set_index('time', inplace=True)

# Ahora aplicar resample para consolidar las barras a 30 minutos
# 'close' tomará el último valor de cada período de 30 minutos y 'volume' la suma de los volúmenes
consolidado_df = future_history_df.resample('30T').agg({
    'close': 'last',
    'volume': 'sum'
})

# Calcular el cambio de precio ("price change")
consolidado_df['price_change'] = consolidado_df['close'].diff()

# Calcular el retorno como el cambio de precio dividido por el precio de cierre de la barra anterior
consolidado_df['return'] = consolidado_df['price_change'] / consolidado_df['close'].shift()

# Verificar el DataFrame con las nuevas columnas añadidas
print(consolidado_df.head())


## Creación de Volume Bars

In [6]:
import pandas as pd

# Inicializar variables
volumen_acumulado = 0
precio_cierre_anterior = None  # Inicializar como None
volume_bars = []

# Iterar sobre el DataFrame
for index, row in working_df.iterrows():
    volumen_acumulado += row['volume']
    
    # Verificar si se alcanza el umbral
    if volumen_acumulado >= 17590:
        if precio_cierre_anterior is not None:
            # Calcular el retorno desde la última barra si no es el primer registro
            retorno = (row['close'] - precio_cierre_anterior) / precio_cierre_anterior
            # Calcular el cambio de precio desde la última barra
            price_change = row['close'] - precio_cierre_anterior
        else:
            # Para el primer registro, establecer retorno y price_change como NaN o 0 según la preferencia
            retorno = None
            price_change = None
        
        # Registrar la barra
        volume_bars.append({
            'Fecha': index,
            'PrecioCierre': row['close'],
            'Volumen': volumen_acumulado,
            'PriceChange': price_change,
            'Retorno': retorno
        })
        
        # Resetear el volumen acumulado y actualizar el precio de cierre anterior
        volumen_acumulado = 0
        precio_cierre_anterior = row['close']

# Crear un nuevo DataFrame con las volume bars
df_volume_bars = pd.DataFrame(volume_bars)

# Mostrar el nuevo DataFrame
print(df_volume_bars.head())


## Creación de Dollar Bars

In [7]:
# Pseudocode to create dollar bars based on the given average value and volume per bar.

# Define the dollar value per bar using the given average value and volume.
average_value = 4427
volume_per_bar = 16500
dollar_value_per_bar = average_value * volume_per_bar

# Initialize the accumulator for the dollar value and the list to store dollar bars.
accumulated_dollar_value = 0
dollar_bars = []

# We will also keep track of the start time of each bar to include in the dollar bars.
start_time = None

# Pseudocode for iterating over the DataFrame and creating dollar bars.
for index, row in future_history_df.iterrows():
    # If we're starting a new bar, save the current time as the start time for the bar.
    if accumulated_dollar_value == 0:
        start_time = index
        
    # Calculate the dollar value for the current row.
    current_dollar_value = row['close'] * row['volume']
    
    # Add the current dollar value to the accumulator.
    accumulated_dollar_value += current_dollar_value
    
    # If the accumulated dollar value reaches the threshold, create a new dollar bar.
    if accumulated_dollar_value >= dollar_value_per_bar:
        # Calculate the return and price change only if there is a previous bar.
        if len(dollar_bars) > 0:
            previous_close = dollar_bars[-1]['close']
            price_change = row['close'] - previous_close
            # Avoid division by zero.
            if previous_close != 0:
                return_pct = price_change / previous_close
            else:
                return_pct = 0
        else:
            # For the first bar, there is no previous close, so set to None or zero.
            price_change = None
            return_pct = None
        
        # Append the new bar to the list of dollar bars.
        dollar_bars.append({
            'start_time': start_time,
            'end_time': index,
            'close': row['close'],
            'volume': accumulated_dollar_value / row['close'],  # Estimate the volume.
            'price_change': price_change,
            'return': return_pct
        })
        
        # Reset the accumulator for the next bar.
        accumulated_dollar_value = 0

# Convert the list of dollar bars to a DataFrame.
dollar_bars_df = pd.DataFrame


In [10]:
dollar_bars_df.

## Análisis descriptivo de cada tipo de barra

In [11]:
# Resumen estadístico descriptivo de los Volume bars
resumen_volume_bars = df_volume_bars.describe()

# Imprimir los resúmenes
print("Resumen estadístico descriptivo de los Volume bars:")
print(resumen_volume_bars)

In [12]:
# Resumen estadístico descriptivo de las barras de 30 minutos
resumen_consolidado_df = consolidado_df.describe()
print("\nResumen estadístico descriptivo de las barras de 30 minutos:")
print(resumen_consolidado_df)

## Visualizaciónes

In [13]:
# Convertir volume_bars a DataFrame si es necesario
if isinstance(volume_bars, list):
    volume_bars_df = pd.DataFrame(volume_bars)
else:
    volume_bars_df = volume_bars  # Asumiendo que volume_bars ya es un DataFrame


In [14]:
import seaborn as sns
import matplotlib.pyplot as plt

# Asegurarte de que volume_bars sea un DataFrame
if isinstance(volume_bars, list):
    volume_bars_df = pd.DataFrame(volume_bars)
else:
    volume_bars_df = volume_bars  # Si ya es un DataFrame, úsalo directamente

# Configurar el estilo de los gráficos
sns.set(style="whitegrid")

# Crear figuras para los boxplots
plt.figure(figsize=(18, 6))

# Boxplot de volumen para volume_bars_df y consolidado_df
plt.subplot(1, 3, 1)
sns.boxplot(data=[volume_bars_df['Volumen'], consolidado_df['volume']], palette="coolwarm")
plt.xticks([0, 1], ['Volume Bars', 'Consolidado'])
plt.title('Boxplot de Volumen')

# Boxplot de retornos para volume_bars_df y consolidado_df
plt.subplot(1, 3, 2)
sns.boxplot(data=[volume_bars_df['Retorno'], consolidado_df['return']], palette="coolwarm")
plt.xticks([0, 1], ['Volume Bars', 'Consolidado'])
plt.title('Boxplot de Retornos')




In [15]:
# Configurar el estilo de los gráficos
sns.set(style="whitegrid")

# Crear figura para las distribuciones de retornos
plt.figure(figsize=(12, 6))

# Graficar la distribución de retornos de volume_bars_df
sns.histplot(volume_bars_df['Retorno'], kde=True, color="blue", label='Retornos de Volume Bars', stat="density", bins=30)

# Graficar la distribución de retornos de consolidado_df
sns.histplot(consolidado_df['return'], kde=True, color="red", label='Retornos de Consolidado', stat="density", bins=30)

# Configurar título y leyenda
plt.title('Distribución de Retornos')
plt.xlabel('Retorno')
plt.ylabel('Densidad')
plt.legend()

plt.tight_layout()
plt.show()



In [16]:
# Configurar el estilo de los gráficos
sns.set(style="whitegrid")

# Crear figura para las distribuciones de retornos
plt.figure(figsize=(12, 6))

# Graficar la distribución de retornos de volume_bars_df
sns.histplot(volume_bars_df['Retorno'], kde=True, color="blue", label='Retornos de Volume Bars', stat="density", bins=30)

# Graficar la distribución de retornos de consolidado_df
sns.histplot(consolidado_df['return'], kde=True, color="red", label='Retornos de Consolidado', stat="density", bins=30)

# Configurar título y leyenda
plt.title('Distribución de Retornos')
plt.xlabel('Retorno')
plt.ylabel('Densidad')
plt.legend()

plt.tight_layout()
plt.show()



In [17]:
import seaborn as sns
import matplotlib.pyplot as plt

# Configurar el estilo de los gráficos
sns.set(style="whitegrid")

# Graficar la distribución de retornos para consolidado_df y volume_bars_df
plt.figure(figsize=(14, 6))
plt.subplot(1, 2, 1)
sns.histplot(consolidado_df['return'].dropna(), kde=True, color="blue", label='Consolidado')
plt.title('Distribución de Retornos de Consolidado')
plt.legend()

plt.subplot(1, 2, 2)
sns.histplot(volume_bars_df['Retorno'].dropna(), kde=True, color="red", label='Volume Bars')
plt.title('Distribución de Retornos de Volume Bars')
plt.legend()

plt.tight_layout()
plt.show()


In [18]:
from statsmodels.graphics.tsaplots import plot_acf
import matplotlib.pyplot as plt

# Configurar el espacio de la figura y los ejes
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 6))

# Autocorrelación para consolidado_df excluyendo el lag 0
plot_acf(consolidado_df['return'].dropna(), lags=range(1, 21), alpha=0.05, ax=ax1)
ax1.set_title('Autocorrelación de Retornos de Consolidado')

# Autocorrelación para volume_bars_df excluyendo el lag 0
plot_acf(volume_bars_df['Retorno'].dropna(), lags=range(1, 21), alpha=0.05, ax=ax2)
ax2.set_title('Autocorrelación de Retornos de Volume Bars')

plt.tight_layout()
plt.show()




In [19]:
# Graficar los retornos para inspeccionar visualmente la heteroscedasticidad
plt.figure(figsize=(14, 6))

plt.subplot(1, 2, 1)
plt.plot(volume_bars_df['Retorno'], marker='o', linestyle='', markersize=2)
plt.title('Retornos de Volume Bars')
plt.xlabel('Tiempo')
plt.ylabel('Retorno')

plt.subplot(1, 2, 2)
plt.plot(consolidado_df['return'], marker='o', linestyle='', markersize=2)
plt.title('Retornos de Consolidado')
plt.xlabel('Tiempo')
plt.ylabel('Retorno')

plt.tight_layout()
plt.show()


# Misc

In [20]:
import pandas as pd
import numpy as np

# Asegurarse de que el índice está en formato datetime si no lo está
working_df.index = pd.to_datetime(working_df.index)

# Calcular el volumen total diario
volumen_total_diario = working_df['volume'].resample('D').sum()

# Dividir el volumen total diario por 50 para obtener el tamaño objetivo de cada "volume bar"
tamaño_volume_bar = volumen_total_diario / 50

# Calcular el promedio global diario de estos tamaños de "volume bars"
promedio_global_diario = tamaño_volume_bar.mean()

# Mostrar el promedio global diario
print(f"La idea es construir aproximadamente 50 barras diarias")
print(f"Promedio global diario de volumen para 50 'volume bars' diarios: {promedio_global_diario}")

