# An√°lisis del Exponente de Hurst en Econof√≠sica

## Teor√≠a del Exponente de Hurst (H)

### Definici√≥n
El **exponente de Hurst** es una medida estad√≠stica que caracteriza el comportamiento de autocorrelaci√≥n de una serie de tiempo. Fue introducido por Harold Hurst en 1951 para analizar niveles de agua en el r√≠o Nilo.

### M√©todo de C√°lculo: An√°lisis R/S (Range/Standard Deviation)

El an√°lisis R/S se basa en la siguiente metodolog√≠a:

1. **Dividir la serie** en sub-series de tama√±o $L$
2. **Para cada sub-serie**, calcular:
   - **R (Rango)**: $R = \max(Y) - \min(Y)$, donde $Y$ es la serie de incrementos acumulados
   - **S (Desviaci√≥n est√°ndar)**: desviaci√≥n est√°ndar de los retornos
3. **R/S promedio** para cada escala $L$
4. **Regresi√≥n log-log**: $\log(R/S) = H \log(L) + c$

El **exponente de Hurst (H)** es la pendiente de esta regresi√≥n.

### Interpretaci√≥n del Exponente H

$$H = \begin{cases}
H = 0.5 & \text{Caminata Aleatoria (Ruido Blanco)} \\
H > 0.5 & \text{Persistencia (Trending) - Comportamiento tendencial} \\
H < 0.5 & \text{Antipersistencia (Mean-Reverting) - Reversi√≥n a la media}
\end{cases}$$

#### a) **H ‚âà 0.5: Caminata Aleatoria (Random Walk)**
- Cambios independientes del pasado
- **Modelo**: Mercado eficiente (Hip√≥tesis de Mercado Eficiente - EMH)
- **Predicci√≥n**: No hay patrones predecibles
- **Implicaci√≥n**: Imposible obtener ganancias anormales
- **Ejemplo**: Retornos de acciones bajo EMH

#### b) **H > 0.5: Persistencia (Trending Behavior)**
- Movimientos pasados **refuerzan** la direcci√≥n actual
- Si sube hoy, es m√°s probable que siga subiendo ma√±ana
- **Comportamiento**: Tendencias, momentum
- **Predicci√≥n**: Parcialmente predecible
- **Implicaci√≥n**: Estrategias de momentum pueden funcionar
- **Rango t√≠pico**: 0.5 < H < 1.0 (H = 1 es la caminata pura)
- **Ejemplo**: Precios de commodities, tendencias a largo plazo

#### c) **H < 0.5: Antipersistencia (Mean-Reverting)**
- Movimientos pasados se **revierten**
- Si sube, es m√°s probable que baje despu√©s
- **Comportamiento**: Volatilidad, fluctuaciones
- **Predicci√≥n**: Reversi√≥n predecible
- **Implicaci√≥n**: Estrategias de reversal pueden funcionar
- **Ejemplo**: Retornos de bonos, ajustes de mercado

### Significado Financiero

| H | Comportamiento | Riesgo | Oportunidad |
|---|---|---|---|
| 0.5 | Eficiente | Riesgo puro | Ninguna |
| > 0.5 | Trending | Riesgo amplificado | Momentum |
| < 0.5 | Mean-revert | Riesgo reducido | Arbitraje |

### Cr√≠ticas y Limitaciones

1. **Sensibilidad a la ventana**: Var√≠a seg√∫n el per√≠odo analizado
2. **No estacionariedad**: Los datos financieros pueden cambiar propiedades en el tiempo
3. **Efecto de tama√±o**: Diferentes horizontes de tiempo dan diferentes H
4. **Ruido estad√≠stico**: Con datos limitados, H es inestable
5. **Suposiciones**: Assume auto-similitud en diferentes escalas

In [3]:
import numpy as np
import pandas as pd
import datetime as dt
import matplotlib.pyplot as plt

# ============================================================================
# AN√ÅLISIS DEL EXPONENTE DE HURST (H)
# 
# Aplicaci√≥n de econof√≠sica para detectar comportamiento de series de tiempo:
# ¬øSon los mercados financieros "caminatas aleatorias" (eficientes)?
# ¬øO tienen patrones predecibles (trending o mean-reversion)?
# ============================================================================

def hurst(ts):
    """
    Calcula el exponente de Hurst mediante el m√©todo R/S (Range/Standard Deviation).
    
    TEOR√çA:
    -------
    El an√°lisis R/S mide la dependencia de largo plazo en una serie.
    
    Proceso:
    1. Dividir la serie de tiempo en N sub-series de tama√±o L
    2. Para cada sub-serie:
       a) Calcular la media de la sub-serie
       b) Calcular desviaciones acumuladas: Y(i) = sum(x_j - mean)
       c) Rango: R = max(Y) - min(Y)
       d) Desv. est√°ndar: S = std(x_j)
       e) Ratio R/S para esta ventana
    3. Promediar R/S sobre todas las ventanas para cada L
    4. Iterar sobre diferentes tama√±os L (desde peque√±o a grande)
    5. Regresi√≥n log-log: log(R/S) = H * log(L) + c
    
    La pendiente H es el EXPONENTE DE HURST
    
    INTERPRETACI√ìN DE RESULTADOS:
    =============================
    H = 0.5 : Caminata aleatoria (eficiente, independencia estad√≠stica)
    H > 0.5 : Persistencia (trending, momentum, autocorrelaci√≥n positiva)
    H < 0.5 : Antipersistencia (mean-reversion, sobreajuste, autocorrelaci√≥n negativa)
    
    ARGS:
        ts : array-like, serie de tiempo para analizar
        
    RETURNS:
        H : float, exponente de Hurst
    """
    ts = np.array(ts)
    N = len(ts)
    
    # Requiere datos suficientes para estabilidad estad√≠stica
    if N < 50:
        return np.nan

    # Crear rango de tama√±os de ventana (lag)
    # Usamos desde escala peque√±a (2) a escala grande (N/4)
    # Rango logar√≠tmico permite detectar comportamiento multi-escala
    lags = np.arange(2, N // 4)
    if len(lags) < 2: 
        return np.nan
    
    RS_log = []      # log(R/S) para cada escala
    lag_log = []     # log(L) para cada escala

    # Iterar sobre diferentes escalas de tiempo
    for L in lags:
        # Dividir serie en ventanas no superpuestas de tama√±o L
        num_windows = N // L
        sub_series = ts[:num_windows * L].reshape(num_windows, L)

        RS_per_window = []
        
        for window in sub_series:
            # --- Calcular R/S para esta ventana ---
            
            # Media de la ventana
            media_ventana = np.mean(window)
            
            # Desviaciones respecto a la media
            desviaciones = window - media_ventana
            
            # Serie de incrementos acumulados
            # (Camino que resultar√≠a si sumamos desviaciones)
            Y = np.cumsum(desviaciones)
            
            # Rango: diferencia entre m√°ximo y m√≠nimo del camino acumulado
            # Representa cu√°n lejos viaja la serie
            R = np.max(Y) - np.min(Y)
            
            # Desviaci√≥n est√°ndar: mide dispersi√≥n de los retornos
            S = np.std(window)
            
            # Ratio R/S normalizados (solo si S > 0 para evitar divisi√≥n por cero)
            if S > 1e-6:
                RS_per_window.append(R / S)
            
        # Promediar R/S para todos los windows de tama√±o L
        if RS_per_window:
            RS_promedio = np.mean(RS_per_window)
            
            # Transformaci√≥n log para regresi√≥n
            # log(R/S) se plotea vs log(L)
            RS_log.append(np.log(RS_promedio))
            lag_log.append(np.log(L))

    if not RS_log:
        return np.nan

    # REGRESI√ìN LOG-LOG
    # =================
    # Ajustamos l√≠nea: log(R/S) = H * log(L) + constante
    # La pendiente H es el exponente de Hurst
    H, _ = np.polyfit(lag_log, RS_log, 1)
    return H

# ============================================================================
# GENERACI√ìN DE SERIES DE TIEMPO PARA AN√ÅLISIS
# ============================================================================

# Generar datos simulados en lugar de descargarlos
np.random.seed(42)
n_obs = 1260  # ~5 a√±os de datos diarios

# --- 1. RETORNOS CON PERSISTENCIA (Trending) ---
# Agregamos tendencia lineal a retornos aleatorios
# Esto simula un mercado donde hay momentum (H > 0.5)

retornos_base = np.random.randn(n_obs) * 0.02
tendencia = np.linspace(0, 0.01, n_obs)  # Tendencia creciente d√©bil
returns_spy = retornos_base + tendencia

print("Serie 1: Retornos con Trending (persistencia)")
print(f"  - Contiene ruido aleatorio + tendencia")
print(f"  - Esperamos H > 0.5 (persistencia)")

# --- 2. PRECIO CON MOVIMIENTO BROWNIANO TENDENCIAL (GLD - Oro) ---
# Oro a menudo muestra comportamiento de largo plazo m√°s tendencial
# Simulamos con cambios correlacionados

ruido_gld = np.random.randn(n_obs) * 0.01
prices_gld = 100 + np.cumsum(ruido_gld + 0.0005)

print("\nSerie 2: Precios con Movimiento Browniano Tendencial")
print(f"  - Cambios acumulativos (random walk + drift)")
print(f"  - Esperamos H ‚âà 1.0 (caminata aleatoria pura)")

# --- 3. RUIDO BLANCO (Benchmark: H = 0.5) ---
# Cambios completamente independientes
# Esto sirve como BASELINE para mercados eficientes

ruido_blanco = np.random.randn(n_obs)

print("\nSerie 3: Ruido Blanco (Baseline H = 0.5)")
print(f"  - Cambios completamente independientes")
print(f"  - Representa mercado eficiente bajo EMH")
print(f"  - Esperamos H ‚âà 0.5")

# --- 4. CAMINATA ALEATORIA PURA (Benchmark: H = 0.5) ---
# Integral de ruido blanco
# Cambios acumulados sin estructura

caminata_aleatoria = np.cumsum(ruido_blanco)

print("\nSerie 4: Caminata Aleatoria Pura (Benchmark H = 0.5)")
print(f"  - Suma acumulada de cambios independientes")
print(f"  - Proceso de Wiener (Movimiento Browniano)")
print(f"  - Esperamos H ‚âà 0.5")

# ============================================================================
# C√ÅLCULO DE EXPONENTES DE HURST
# ============================================================================

print("\n" + "="*70)
print("CALCULANDO EXPONENTES DE HURST...")
print("="*70)

H_returns_spy = hurst(returns_spy)
H_prices_gld = hurst(prices_gld)
H_ruido_blanco = hurst(ruido_blanco)
H_caminata_aleatoria = hurst(caminata_aleatoria)

# ============================================================================
# AN√ÅLISIS E INTERPRETACI√ìN
# ============================================================================

print("\n" + "="*70)
print("RESULTADOS: AN√ÅLISIS DEL EXPONENTE DE HURST (H)")
print("="*70)

def discutir_H(H, nombre_serie):
    """
    Interpreta el exponente de Hurst en contexto financiero.
    """
    if np.isnan(H):
        print(f"\n‚ùå {nombre_serie}: Insuficientes datos o problemas de c√°lculo.")
        return
    
    print(f"\nüìä {nombre_serie}")
    print(f"   Exponente H = {H:.4f}")
    print("   " + "-"*60)
    
    if H > 0.5:
        desviacion = H - 0.5
        print(f"   ‚úì PERSISTENCIA (Trending Behavior)")
        print(f"   Desviaci√≥n: +{desviacion:.4f} sobre eficiencia")
        print(f"")
        print(f"   TEOR√çA: La serie tiene MEMORIA A LARGO PLAZO")
        print(f"   - Si la serie sube hoy ‚Üí m√°s probable que siga subiendo")
        print(f"   - Si baja hoy ‚Üí m√°s probable que siga bajando")
        print(f"   - Los cambios pasados refuerzan la direcci√≥n actual")
        print(f"")
        print(f"   MERCADOS: Indica INEFICIENCIA")
        print(f"   - Existen patrones predecibles")
        print(f"   - Estrategias de momentum pueden tener ventaja")
        print(f"   - Riesgo: Trends pueden persistir creando burbujas")
        
    elif H < 0.5:
        desviacion = 0.5 - H
        print(f"   ‚úì ANTIPERSISTENCIA (Mean-Reverting)")
        print(f"   Desviaci√≥n: -{desviacion:.4f} bajo eficiencia")
        print(f"")
        print(f"   TEOR√çA: La serie tiende a REVERTIRSE")
        print(f"   - Si la serie sube ‚Üí m√°s probable que baje despu√©s")
        print(f"   - Si baja ‚Üí m√°s probable que suba despu√©s")
        print(f"   - Cambios se cancelan entre s√≠")
        print(f"")
        print(f"   MERCADOS: Indica sobre-reacci√≥n")
        print(f"   - Excesiva volatilidad")
        print(f"   - Estrategias de reversal pueden funcionar")
        print(f"   - Riesgo: Flash crashes por sobreajuste")
        
    else:  # H ‚âà 0.5
        print(f"   ‚úì CAMINATA ALEATORIA (Random Walk / Eficiente)")
        print(f"")
        print(f"   TEOR√çA: La serie es IMPREDECIBLE")
        print(f"   - Cambios son independientes del pasado")
        print(f"   - No hay correlaci√≥n temporal (autocorrelaci√≥n = 0)")
        print(f"")
        print(f"   MERCADOS: Hip√≥tesis de Mercado Eficiente (EMH)")
        print(f"   - No hay patrones explotables")
        print(f"   - Precio refleja toda la informaci√≥n disponible")
        print(f"   - Imposible obtener ganancias anormales de largo plazo")

# Ejecutar an√°lisis
discutir_H(H_returns_spy, 'Retornos de SPY')
discutir_H(H_prices_gld, 'Precio de GLD')
discutir_H(H_ruido_blanco, 'Ruido Blanco (Te√≥rico)')
discutir_H(H_caminata_aleatoria, 'Caminata Aleatoria (Te√≥rico)')

# ============================================================================
# RESUMEN
# ============================================================================

print("\n" + "="*70)
print("CONCLUSIONES Y APLICACIONES")
print("="*70)

print("""
1. BENCHMARKS TE√ìRICOS:
   - Ruido Blanco y Caminata Aleatoria DEBEN tener H ‚âà 0.5
   - Desviaciones = errores de muestreo o no-estacionariedad

2. DATOS REALES:
   - Retornos: T√≠picamente H ‚àà [0.48, 0.55] (cercano a eficiente)
   - Precios: T√≠picamente H > 0.5 (trending)
   - Volatilidad: T√≠picamente H > 0.5 (clustering de volatilidad)

3. IMPLICACIONES PARA ESTRATEGIAS:
   - H > 0.55 ‚Üí Momentum puede funcionar
   - H < 0.45 ‚Üí Mean-reversion puede funcionar
   - H ‚âà 0.5 ‚Üí Seguir √≠ndices pasivos es √≥ptimo

4. LIMITACIONES:
   - H var√≠a con el per√≠odo de an√°lisis
   - Requiere muchos datos para estabilidad
   - Datos no estacionarios pueden dar resultados espurios
   - No es predictor √∫nico, usar en combinaci√≥n con otros
""")

print("="*70)

Serie 1: Retornos con Trending (persistencia)
  - Contiene ruido aleatorio + tendencia
  - Esperamos H > 0.5 (persistencia)

Serie 2: Precios con Movimiento Browniano Tendencial
  - Cambios acumulativos (random walk + drift)
  - Esperamos H ‚âà 1.0 (caminata aleatoria pura)

Serie 3: Ruido Blanco (Baseline H = 0.5)
  - Cambios completamente independientes
  - Representa mercado eficiente bajo EMH
  - Esperamos H ‚âà 0.5

Serie 4: Caminata Aleatoria Pura (Benchmark H = 0.5)
  - Suma acumulada de cambios independientes
  - Proceso de Wiener (Movimiento Browniano)
  - Esperamos H ‚âà 0.5

CALCULANDO EXPONENTES DE HURST...



RESULTADOS: AN√ÅLISIS DEL EXPONENTE DE HURST (H)

üìä Retornos de SPY
   Exponente H = 0.5866
   ------------------------------------------------------------
   ‚úì PERSISTENCIA (Trending Behavior)
   Desviaci√≥n: +0.0866 sobre eficiencia

   TEOR√çA: La serie tiene MEMORIA A LARGO PLAZO
   - Si la serie sube hoy ‚Üí m√°s probable que siga subiendo
   - Si baja hoy ‚Üí m√°s probable que siga bajando
   - Los cambios pasados refuerzan la direcci√≥n actual

   MERCADOS: Indica INEFICIENCIA
   - Existen patrones predecibles
   - Estrategias de momentum pueden tener ventaja
   - Riesgo: Trends pueden persistir creando burbujas

üìä Precio de GLD
   Exponente H = 1.0047
   ------------------------------------------------------------
   ‚úì PERSISTENCIA (Trending Behavior)
   Desviaci√≥n: +0.5047 sobre eficiencia

   TEOR√çA: La serie tiene MEMORIA A LARGO PLAZO
   - Si la serie sube hoy ‚Üí m√°s probable que siga subiendo
   - Si baja hoy ‚Üí m√°s probable que siga bajando
   - Los cambi