**Título del proyecto**

"Análisis de Alta Frecuencia de Trading: Modelos Predictivos y Estrategias de Optimización"

**Descripción de la idea**

El proyecto se centrará en el análisis y desarrollo de modelos predictivos para el trading de alta frecuencia (HTF). Se explorarán técnicas de machine learning y algoritmos de trading automatizado para predecir movimientos de precios a corto plazo y optimizar estrategias de trading. El objetivo es diseñar y evaluar modelos que puedan identificar oportunidades de trading en milisegundos, basándose en datos históricos y en tiempo real de los mercados financieros.

**Problema o necesidad que busca resolver**

El trading de alta frecuencia representa una fracción significativa del volumen total de operaciones en los mercados financieros y se caracteriza por la ejecución de un gran número de órdenes en muy poco tiempo. Este proyecto busca abordar varios problemas clave:

1. Precisión en la predicción: Mejorar la precisión de los modelos predictivos para identificar patrones de precios y volatilidad en el mercado.
2. Optimización de estrategias de trading: Desarrollar algoritmos que puedan optimizar las estrategias de trading para maximizar las ganancias y minimizar las pérdidas.
3. Reducción de riesgos: Identificar y mitigar riesgos asociados con el HTF, como el riesgo de liquidez y el riesgo de ejecución.
4. Análisis de impacto del mercado: Evaluar cómo las estrategias de HTF afectan la estabilidad y la eficiencia de los mercados financieros.

**Conjunto de datos que planeo utilizar**

Para llevar a cabo este proyecto, se utilizarán diversos conjuntos de datos, incluyendo:

1. Datos de ticks del mercado: Información detallada de cada transacción en el mercado, incluyendo precios, volúmenes y tiempos de ejecución.
2. Datos de ordenes limitadas: Información sobre las órdenes de compra y venta pendientes en el libro de órdenes.
3. Datos históricos de precios: Precios históricos de diferentes activos financieros para entrenar y validar los modelos.
4. Datos de noticias financieras: Noticias y eventos que pueden influir en el comportamiento del mercado.
5. Datos económicos: Indicadores económicos que pueden afectar los mercados financieros.

Estos datos se pueden obtener de varias fuentes, incluyendo proveedores de datos financieros (como Bloomberg, Reuters, o Nasdaq), APIs de mercados financieros, y bases de datos públicas.

Hacer test de normalidad para saber si mis datos son normales o no y así saber si utilizo test paramétricos o no paramétricos

Buscar paper de limpieza de base de datos de finanzas y el testeo inicial de los datos

In [5]:
import pandas as pd
from scipy import stats

In [6]:
file_path = '/Users/juanpablomigani/Desktop/Trabajo final Econometría/Data/ARAL30D=BA Overview.csv'
datos = pd.read_csv(file_path)
datos

Unnamed: 0,Date,Price,Open,High,Low,Change %
0,08/08/2024,48.927,48.150,49.110,48.014,2.51%
1,08/07/2024,47.730,47.800,48.430,47.550,0.06%
2,08/06/2024,47.700,46.602,47.873,46.602,2.55%
3,08/05/2024,46.515,45.050,47.238,44.601,-1.28%
4,08/02/2024,47.120,47.299,47.680,46.521,-2.89%
...,...,...,...,...,...,...
943,09/21/2020,45.300,47.500,47.500,45.010,-4.21%
944,09/18/2020,47.290,46.750,48.500,46.600,0.23%
945,09/17/2020,47.180,47.440,47.440,46.500,-2.76%
946,09/16/2020,48.520,49.810,49.810,47.990,-5.97%


In [7]:
# Convertir la columna 'Price' a tipo numérico si no lo está
datos['Price'] = pd.to_numeric(datos['Price'], errors='coerce')

# Eliminar cualquier valor faltante en la columna 'Price'
precios = datos['Price'].dropna()

# Realizar el test de Kolmogorov-Smirnov comparando los datos de precios con una distribución normal
estadistico_ks, valor_p = stats.kstest(precios, 'norm', args=(precios.mean(), precios.std()))

# Mostrar los resultados
print(f"Estadístico KS: {estadistico_ks}")
print(f"Valor p: {valor_p}")

Estadístico KS: 0.08342045965328437
Valor p: 3.460246208694102e-06


Dado que el valor p es muy pequeño (menor que 0.05), podemos rechazar la hipótesis nula de que los precios siguen una distribución normal. Esto sugiere que los precios del bono no se distribuyen de manera normal.