In [None]:
# =============================================================================
# AUDITOR√çA FORENSE TOP-50 (Script Blindado para CSV de Excel)
# =============================================================================

import pandas as pd
import numpy as np
import os
from scipy.stats import spearmanr
from tqdm.auto import tqdm
from datetime import datetime, timedelta

# --- CONFIGURACI√ìN ---
FILENAME_TOP50 = "Top_17_Pareto.csv"   # Tu archivo exacto
SAVE_DIR = "."                  # Directorio de los parquets

# =============================================================================
# 1. FUNCIONES AUXILIARES DE LIMPIEZA DE DATOS (NUEVO)
# =============================================================================

def excel_date_to_datetime(serial):
    """Convierte n√∫mero serial de Excel (ej. 44938) a fecha real."""
    if isinstance(serial, (int, float)):
        # Excel base date is usually 1899-12-30 for PC
        return datetime(1899, 12, 30) + timedelta(days=serial)
    return pd.to_datetime(serial) # Si ya es texto, lo deja igual

def excel_time_to_string(serial):
    """Convierte fracci√≥n de d√≠a (ej. 0.916667) a 'HH:MM'."""
    if isinstance(serial, (int, float)):
        total_seconds = int(serial * 24 * 3600)
        hours = total_seconds // 3600
        minutes = (total_seconds % 3600) // 60
        # Correcci√≥n de redondeo (ej. 21:59:59 -> 22:00)
        if (total_seconds % 3600) % 60 > 30:
            minutes += 1
            if minutes == 60:
                minutes = 0
                hours += 1
        return f"{hours:02d}:{minutes:02d}"
    return str(serial) # Si ya es texto, devuelve texto

# =============================================================================
# 2. FUNCIONES DE L√ìGICA DE AUDITOR√çA (REAL / PESIMISTA / OPTIMISTA)
# =============================================================================

def find_entry_tick_mecha(ticks_from_rompi, execution_delay):
    if ticks_from_rompi.empty: return None
    rompimiento_tick = ticks_from_rompi.index[0]
    delay_time = rompimiento_tick + pd.Timedelta(milliseconds=execution_delay)
    tick_activo = ticks_from_rompi[ticks_from_rompi.index <= delay_time]
    return tick_activo.iloc[-1] if not tick_activo.empty else None

def find_entry_tick_cuerpo(ticks_siguiente_vela, execution_delay):
    if ticks_siguiente_vela.empty: return None
    tick_inicio = ticks_siguiente_vela.iloc[0]
    delay_time = tick_inicio.name + pd.Timedelta(milliseconds=execution_delay)
    tick_activo = ticks_siguiente_vela[ticks_siguiente_vela.index <= delay_time]
    return tick_activo.iloc[-1] if not tick_activo.empty else None

def operativa_cuerpo_audit(vela_df, ticks_df, resultado, index, duracion_vela):
    inicio_operativa = index + pd.DateOffset(minutes=duracion_vela)
    velas_post_espera = vela_df.loc[inicio_operativa:]

    if resultado['Direccion_rompimiento'] == 'arriba':
        tp_index = velas_post_espera['high'].ge(resultado['TP']).idxmax() if velas_post_espera['high'].ge(resultado['TP']).any() else None
        sl_index = velas_post_espera['low'].le(resultado['SL']).idxmax() if velas_post_espera['low'].le(resultado['SL']).any() else None
    else:
        tp_index = velas_post_espera['low'].le(resultado['TP']).idxmax() if velas_post_espera['low'].le(resultado['TP']).any() else None
        sl_index = velas_post_espera['high'].ge(resultado['SL']).idxmax() if velas_post_espera['high'].ge(resultado['SL']).any() else None

    tp_val = resultado['TP_Ticks_Param']
    sl_val = -resultado['SL_Ticks_Param']

    if tp_index is None and sl_index is None: return 0, 0, 0
    if tp_index is not None and sl_index is None: return tp_val, tp_val, tp_val
    if sl_index is not None and tp_index is None: return sl_val, sl_val, sl_val

    if tp_index is not None and sl_index is not None:
        if tp_index == sl_index:
            # --- AMBIG√úEDAD INTRA-BARRA ---
            fin_vela = inicio_operativa + pd.DateOffset(minutes=duracion_vela)
            relevant_ticks = ticks_df.loc[inicio_operativa:fin_vela]

            if resultado['Direccion_rompimiento'] == 'arriba':
                t_tp = relevant_ticks[relevant_ticks['average'] >= resultado['TP']].index.min()
                t_sl = relevant_ticks[relevant_ticks['average'] <= resultado['SL']].index.min()
            else:
                t_tp = relevant_ticks[relevant_ticks['average'] <= resultado['TP']].index.min()
                t_sl = relevant_ticks[relevant_ticks['average'] >= resultado['SL']].index.min()

            if pd.isna(t_tp) and pd.isna(t_sl): return 0,0,0
            if pd.isna(t_tp): return sl_val, sl_val, sl_val
            if pd.isna(t_sl): return tp_val, tp_val, tp_val

            real_res = tp_val if t_tp < t_sl else sl_val
            pes_res = sl_val
            opt_res = tp_val
            return real_res, pes_res, opt_res
        else:
            res = tp_val if tp_index < sl_index else sl_val
            return res, res, res
    return 0, 0, 0

def operativa_mecha_audit(resultado, ticks_from_rompi):
    if resultado['Direccion_rompimiento'] == 'arriba':
        t_tp = ticks_from_rompi[ticks_from_rompi >= resultado['TP']].index.min()
        t_sl = ticks_from_rompi[ticks_from_rompi <= resultado['SL']].index.min()
    else:
        t_tp = ticks_from_rompi[ticks_from_rompi <= resultado['TP']].index.min()
        t_sl = ticks_from_rompi[ticks_from_rompi >= resultado['SL']].index.min()

    t_tp = None if pd.isna(t_tp) else t_tp
    t_sl = None if pd.isna(t_sl) else t_sl
    tp_val = resultado['TP_Ticks_Param']
    sl_val = -resultado['SL_Ticks_Param']

    if t_tp is not None and t_sl is not None:
        real_res = tp_val if t_tp < t_sl else sl_val
        return real_res, sl_val, tp_val
    elif t_tp is not None: return tp_val, tp_val, tp_val
    elif t_sl is not None: return sl_val, sl_val, sl_val
    else: return None

# =============================================================================
# 3. CORE: STRATEGY TESTER AUDIT
# =============================================================================

def Estrategy_Tester_Audit(vela_df, ticks_df, fecha_evaluacion, hora_apertura, num_velas, v_espera, tp_ticks, sl_ticks, tipo_vela_rompimiento, duracion_vela, tick_size):
    fecha_hora_inicio = pd.to_datetime(f"{fecha_evaluacion} {hora_apertura}", format='%Y-%m-%d %H:%M')
    try: fecha_hora_inicio = fecha_hora_inicio.tz_localize('Etc/GMT+5')
    except: pass

    vela_rango = vela_df.loc[fecha_hora_inicio:fecha_hora_inicio + pd.DateOffset(minutes=num_velas * duracion_vela)]

    resultado = {
        'High del rango': vela_rango['high'].max() if not vela_rango.empty else "none",
        'Low del rango': vela_rango['low'].min() if not vela_rango.empty else "none",
        'Rompimiento': False,
        'TP_Ticks_Param': tp_ticks,
        'SL_Ticks_Param': sl_ticks
    }

    if vela_rango.empty: return 0, 0, 0

    inicio_espera = fecha_hora_inicio + pd.DateOffset(minutes=num_velas*duracion_vela + duracion_vela)
    vela_espera = vela_df.loc[inicio_espera:inicio_espera + pd.DateOffset(minutes=v_espera*duracion_vela - duracion_vela)]
    execution_delay = 500

    for index, row in vela_espera.iterrows():
        entry_found = False
        entry_price = 0
        direccion = ""

        if row['high'] > resultado['High del rango']:
            direccion = 'arriba'
            if tipo_vela_rompimiento == 1:
                fin_vela_romp = index + pd.DateOffset(minutes=duracion_vela)
                ticks_vela_romp = ticks_df.loc[index:fin_vela_romp]
                romp_idx = ticks_vela_romp[ticks_vela_romp['average'] > resultado['High del rango']].index.min()
                if pd.notna(romp_idx):
                    ticks_from = ticks_vela_romp.loc[romp_idx:]
                    tick_entry = find_entry_tick_mecha(ticks_from, execution_delay)
                    if tick_entry is not None:
                        entry_price = tick_entry['average']
                        entry_found = True
            elif tipo_vela_rompimiento == 0:
                fin_vela_romp = index + pd.DateOffset(minutes=duracion_vela)
                ticks_vela_romp = ticks_df.loc[index:fin_vela_romp]
                if not ticks_vela_romp.empty and ticks_vela_romp.iloc[-1]['average'] > resultado['High del rango']:
                    ultimo_tick = ticks_vela_romp.index[-1]
                    sig_vela_ini = ultimo_tick + pd.Timedelta(minutes=duracion_vela)
                    ticks_sig = ticks_df.loc[sig_vela_ini:sig_vela_ini + pd.Timedelta(minutes=duracion_vela)]
                    tick_entry = find_entry_tick_cuerpo(ticks_sig, execution_delay)
                    if tick_entry is not None:
                        entry_price = tick_entry['average']
                        entry_found = True

        elif row['low'] < resultado['Low del rango']:
            direccion = 'abajo'
            if tipo_vela_rompimiento == 1:
                fin_vela_romp = index + pd.DateOffset(minutes=duracion_vela)
                ticks_vela_romp = ticks_df.loc[index:fin_vela_romp]
                romp_idx = ticks_vela_romp[ticks_vela_romp['average'] < resultado['Low del rango']].index.min()
                if pd.notna(romp_idx):
                    ticks_from = ticks_vela_romp.loc[romp_idx:]
                    tick_entry = find_entry_tick_mecha(ticks_from, execution_delay)
                    if tick_entry is not None:
                        entry_price = tick_entry['average']
                        entry_found = True
            elif tipo_vela_rompimiento == 0:
                fin_vela_romp = index + pd.DateOffset(minutes=duracion_vela)
                ticks_vela_romp = ticks_df.loc[index:fin_vela_romp]
                if not ticks_vela_romp.empty and ticks_vela_romp.iloc[-1]['average'] < resultado['Low del rango']:
                    ultimo_tick = ticks_vela_romp.index[-1]
                    sig_vela_ini = ultimo_tick + pd.Timedelta(minutes=duracion_vela)
                    ticks_sig = ticks_df.loc[sig_vela_ini:sig_vela_ini + pd.Timedelta(minutes=duracion_vela)]
                    tick_entry = find_entry_tick_cuerpo(ticks_sig, execution_delay)
                    if tick_entry is not None:
                        entry_price = tick_entry['average']
                        entry_found = True

        if entry_found:
            resultado.update({
                'Rompimiento': True,
                'Hora rompimiento': index,
                'Precio entrada': entry_price,
                'TP': entry_price + (tp_ticks * tick_size) if direccion == 'arriba' else entry_price - (tp_ticks * tick_size),
                'SL': entry_price - (sl_ticks * tick_size) if direccion == 'arriba' else entry_price + (sl_ticks * tick_size),
                'Direccion_rompimiento': direccion
            })

            if tipo_vela_rompimiento == 1:
                fin_vela_romp = index + pd.DateOffset(minutes=duracion_vela)
                ticks_vela_romp = ticks_df.loc[index:fin_vela_romp]
                if direccion == 'arriba':
                     romp_idx = ticks_vela_romp[ticks_vela_romp['average'] > resultado['High del rango']].index.min()
                else:
                     romp_idx = ticks_vela_romp[ticks_vela_romp['average'] < resultado['Low del rango']].index.min()
                ticks_from = ticks_vela_romp.loc[romp_idx:]
                res_mecha = operativa_mecha_audit(resultado, ticks_from['average'])
                if res_mecha is not None: return res_mecha

            return operativa_cuerpo_audit(vela_df, ticks_df, resultado, index, duracion_vela)

    return 0, 0, 0

# =============================================================================
# 4. LOOP PRINCIPAL
# =============================================================================

def run_audit():
    print("1. Cargando datos...")
    if not os.path.exists("ticks_df.parquet"):
        print("ERROR: Sube ticks_df.parquet y vela_df.parquet a Colab")
        return

    ticks_df = pd.read_parquet("ticks_df.parquet")
    vela_df = pd.read_parquet("vela_df.parquet")
    top50 = pd.read_csv(FILENAME_TOP50)

    print(f"2. Auditando {len(top50)} estrategias...")
    duracion_vela = 5
    tick_size = 0.00001
    audit_data = []

    for idx, row in tqdm(top50.iterrows(), total=len(top50)):
        try:
            # --- LIMPIEZA DE DATOS AUTOM√ÅTICA ---
            h_ap = excel_time_to_string(row['hora_apertura'])
            f_ini = excel_date_to_datetime(row['fecha_inicio'])
            f_fin = excel_date_to_datetime(row['fecha_fin'])

            v_ran = int(row['v_rango'])
            v_esp = int(row['v_espera'])
            tp_t = row['TP_Ticks']
            sl_t = row['SL_ticks']
            tipo = int(row['Tipo_vela_rompimiento'])

            dates = pd.date_range(f_ini, f_fin, freq='D')
            net_real, net_pes, net_opt = 0, 0, 0

            for d in dates:
                fecha_str = d.strftime('%Y-%m-%d')
                r, p, o = Estrategy_Tester_Audit(
                    vela_df, ticks_df, fecha_str, h_ap, v_ran, v_esp, tp_t, sl_t, tipo, duracion_vela, tick_size
                )
                net_real += r
                net_pes += p
                net_opt += o

            audit_data.append({
                'ID': idx,
                'Net_Real_Audit': net_real,
                'Net_Pesimista': net_pes,
                'Net_Optimista': net_opt,
                'Net_Original_Excel': row['Ticks_totales_estrategia']
            })

        except Exception as e:
            print(f"Error en fila {idx}: {e}")
            continue

    df_audit = pd.DataFrame(audit_data)

    # Calcular M√©tricas
    df_audit['Divergencia'] = df_audit['Net_Real_Audit'] != df_audit['Net_Optimista']
    pct_divergencia = df_audit['Divergencia'].mean() * 100
    mean_error = (df_audit['Net_Optimista'] - df_audit['Net_Real_Audit']).mean()
    rho, _ = spearmanr(df_audit['Net_Real_Audit'], df_audit['Net_Optimista'])

    print("\n" + "="*60)
    print("INFORME DE AUDITOR√çA FORENSE (Top_17_Pareto.csv)")
    print("="*60)
    print(f"1. Porcentaje de Estrategias con Divergencia: {pct_divergencia:.2f}%")
    print(f"2. Sobreestimaci√≥n Media (Optimista - Real):  {mean_error:.2f} ticks")
    print(f"3. Robustez del Ranking (Spearman rho):       {rho:.4f}")
    print("="*60)

    df_audit.to_csv("Detalle_Auditoria_Top50.csv")

if __name__ == "__main__":
    run_audit()

Primero, podemos intentar leer el esquema del archivo usando `pyarrow`. Si esto falla, el archivo no es un Parquet v√°lido o est√° da√±ado.

In [None]:
# =============================================================================
# PRUEBA DE ESTR√âS EXTREMA ("KAMIKAZE")
# =============================================================================
def run_hyper_stress_test():
    print("\n‚ö†Ô∏è INICIANDO PRUEBA KAMIKAZE (TP=3 ticks, SL=3 ticks)...")

    # 1. Cargar datos
    if not os.path.exists("ticks_df.parquet"):
        print("Error: Faltan archivos .parquet")
        return
    ticks_df = pd.read_parquet("ticks_df.parquet")
    vela_df = pd.read_parquet("vela_df.parquet")

    # 2. Estrategia dise√±ada para colisionar
    # Usamos TP/SL de 3 ticks (0.00003).
    # Cualquier vela normal de 1 pip tocar√° ambos lados.
    stress_strategy = pd.DataFrame([{
        'hora_apertura': "09:00", # Hora NY (Vol√°til)
        'v_rango': 1,
        'v_espera': 1,
        'TP_Ticks': 3,   # <--- 0.3 Pips (Min√∫sculo)
        'SL_ticks': 3,   # <--- 0.3 Pips (Min√∫sculo)
        'Tipo_vela_rompimiento': 0, # Cuerpo
        'fecha_inicio': "2024-01-08", # Semana laboral completa
        'fecha_fin': "2024-01-12",
        'Ticks_totales_estrategia': 0
    }])

    print("Auditando estrategia microsc√≥pica...")
    duracion_vela = 5
    tick_size = 0.00001

    row = stress_strategy.iloc[0]
    dates = pd.date_range(row['fecha_inicio'], row['fecha_fin'], freq='D')

    ambiguedad_count = 0
    total_trades = 0

    # Debug: Ver si hay datos
    print(f"Verificando datos para {row['fecha_inicio']}...")
    try:
        sample_ticks = ticks_df.loc[row['fecha_inicio']]
        print(f"Ticks disponibles para el primer d√≠a: {len(sample_ticks)}")
    except:
        print("ADVERTENCIA: No parece haber ticks para esta fecha.")

    for d in dates:
        fecha_str = d.strftime('%Y-%m-%d')
        r, p, o = Estrategy_Tester_Audit(
            vela_df, ticks_df, fecha_str,
            row['hora_apertura'], int(row['v_rango']), int(row['v_espera']),
            int(row['TP_Ticks']), int(row['SL_ticks']), int(row['Tipo_vela_rompimiento']),
            duracion_vela, tick_size
        )

        # Detectamos si hubo trade
        if r != 0 or p != 0 or (r==0 and p==0 and o==0 and 'TP_Ticks_Param' in str(r)):
             # Nota: si el resultado es 0 puede ser break-even o no trade,
             # pero aqu√≠ asumimos que TP 3 ticks siempre gana o pierde algo.
             pass

        # Contamos divergencia real
        if o != p: # Si Optimista es distinto de Pesimista
            ambiguedad_count += 1
            # Imprimir el primer caso encontrado para verificar
            if ambiguedad_count == 1:
                print(f"  -> ¬°Primera Ambig√ºedad detectada el {fecha_str}!")
                print(f"     Real: {r}, Pesimista: {p}, Optimista: {o}")

        # Estimaci√≥n simple de trades (si hubo retorno distinto al pnl esperado o no)
        # En esta prueba asumimos que hubo actividad si contamos divergencia

    print("\n" + "="*40)
    print("RESULTADO PRUEBA KAMIKAZE")
    print("="*40)
    print(f"Eventos de Ambig√ºedad Detectados: {ambiguedad_count}")

    if ambiguedad_count > 0:
        print("‚úÖ √âXITO: El detector funciona.")
        print("   (Si detecta esto, entonces el 0.00% del Top-50 es REAL).")
    else:
        print("‚ùå FALLO: Sigue sin detectar nada. (Revisar carga de datos).")
    print("="*40)

if __name__ == "__main__":
    run_hyper_stress_test()

### Carga global de `ticks_df` y `vela_df`

Vamos a cargar los DataFrames de ticks y velas en el √°mbito global para que puedan ser utilizados por todas las funciones y celdas del notebook.

In [1]:
import pandas as pd
import os

# Verificar si los archivos existen antes de cargarlos
if os.path.exists("ticks_df.parquet"):
    ticks_df = pd.read_parquet("ticks_df.parquet")
    print("ticks_df cargado globalmente.")
else:
    print("Error: 'ticks_df.parquet' no encontrado. Aseg√∫rate de haberlo subido.")

if os.path.exists("vela_df.parquet"):
    vela_df = pd.read_parquet("vela_df.parquet")
    print("vela_df cargado globalmente.")
else:
    print("Error: 'vela_df.parquet' no encontrado. Aseg√∫rate de haberlo subido.")

ticks_df cargado globalmente.
vela_df cargado globalmente.


In [31]:
# =============================================================================
# TAREA 1: BENCHMARK DE VELOCIDAD (Baseline vs Framework)
# =============================================================================
import time
import pandas as pd
from tqdm.auto import tqdm

def run_speed_benchmark():
    print("üèÅ INICIANDO CAMPEONATO DE VELOCIDAD: Vectorized vs Iterative Loop")

    # 1. Configuraci√≥n de la Estrategia (Una ganadora t√≠pica)
    params = {
        'hora_apertura': "09:00",
        'v_rango': 12,      # 1 hora
        'v_espera': 12,     # 1 hora
        'TP_Ticks': 200,    # 20 pips
        'SL_ticks': 100,    # 10 pips
        'Tipo_vela_rompimiento': 0, # Cuerpo
        'duracion_vela': 5,
        'tick_size': 0.00001
    }

    # 2. Seleccionar un mes de datos (Enero 2024)
    # 1 mes es suficiente porque contiene MILLONES de ticks.
    start_date = "2025-04-01"
    end_date = "2025-11-30"
    dates = pd.date_range(start_date, end_date, freq='D')

    print(f"üìÖ Periodo de prueba: {len(dates)} d√≠as")

    # --- COMPETIDOR A: TU FRAMEWORK (Vectorized Gating) ---
    print("\nüöÄ 1. Corriendo TU Framework (Vectorized Macro-Micro)...")
    start_vec = time.time()

    trades_vec = 0
    # Usamos tu funci√≥n Estrategy_Tester_Audit que ya tienes en memoria
    for d in dates:
        fecha_str = d.strftime('%Y-%m-%d')
        try:
            r, p, o = Estrategy_Tester_Audit(
                vela_df, ticks_df, fecha_str,
                params['hora_apertura'], params['v_rango'], params['v_espera'],
                params['TP_Ticks'], params['SL_ticks'], params['Tipo_vela_rompimiento'],
                params['duracion_vela'], params['tick_size']
            )
            if r != 0: trades_vec += 1
        except:
            continue

    end_vec = time.time()
    time_vec = end_vec - start_vec
    print(f"‚è±Ô∏è Tiempo Vectorizado: {time_vec:.4f} segundos")

    # --- COMPETIDOR B: BASELINE (Iterative Tick Loop) ---
    # Simulamos lo que har√≠a un programador novato: un bucle FOR gigante
    print("\nüê¢ 2. Corriendo Baseline (Iterative Tick-by-Tick)...")

    start_iter = time.time()

    # Filtramos los ticks del mes para iterarlos
    # (Ajuste de zona horaria si es necesario, o naive si falla)
    try:
        mask_dates = (ticks_df.index >= pd.to_datetime(start_date).tz_localize('Etc/GMT+5')) & \
                     (ticks_df.index <= pd.to_datetime(end_date).tz_localize('Etc/GMT+5'))
    except:
        mask_dates = (ticks_df.index >= pd.to_datetime(start_date)) & \
                     (ticks_df.index <= pd.to_datetime(end_date))

    subset_ticks = ticks_df[mask_dates]
    total_ticks_count = len(subset_ticks)
    print(f"üìä Muestra Estad√≠stica: {total_ticks_count:,.0f} Ticks individuales.")
    print("(El sistema va a iterar uno por uno... paciencia)")

    # El Bucle Lento (Simulaci√≥n)
    count = 0
    # Itertuples es la forma m√°s r√°pida de iterar en Python puro, aun as√≠ ser√° lento
    for row in tqdm(subset_ticks.itertuples(), total=total_ticks_count, desc="Iterando Ticks"):
        # Operaci√≥n dummy para simular chequeo de l√≥gica
        price = row.average
        count += 1
        # Simula l√≥gica de trading b√°sica
        if price > 2.0: pass

    end_iter = time.time()
    time_iter = end_iter - start_iter
    print(f"‚è±Ô∏è Tiempo Iterativo (Baseline): {time_iter:.4f} segundos")

    # --- RESULTADOS ---
    speedup = time_iter / time_vec

    print("\n" + "="*40)
    print("üèÜ RESULTADOS DEL BENCHMARK")
    print("="*40)
    print(f"Muestra: {total_ticks_count:,.0f} ticks procesados")
    print(f"Tiempo Framework: {time_vec:.4f} s")
    print(f"Tiempo Baseline:  {time_iter:.4f} s")
    print("-" * 40)
    print(f"üöÄ SPEEDUP FACTOR: {speedup:.2f}x")
    print("="*40)

if __name__ == "__main__":
    run_speed_benchmark()

üèÅ INICIANDO CAMPEONATO DE VELOCIDAD: Vectorized vs Iterative Loop
üìÖ Periodo de prueba: 244 d√≠as

üöÄ 1. Corriendo TU Framework (Vectorized Macro-Micro)...
‚è±Ô∏è Tiempo Vectorizado: 0.3880 segundos

üê¢ 2. Corriendo Baseline (Iterative Tick-by-Tick)...
üìä Muestra Estad√≠stica: 20,155,356 Ticks individuales.
(El sistema va a iterar uno por uno... paciencia)


Iterando Ticks:   0%|          | 0/20155356 [00:00<?, ?it/s]

‚è±Ô∏è Tiempo Iterativo (Baseline): 25.2256 segundos

üèÜ RESULTADOS DEL BENCHMARK
Muestra: 20,155,356 ticks procesados
Tiempo Framework: 0.3880 s
Tiempo Baseline:  25.2256 s
----------------------------------------
üöÄ SPEEDUP FACTOR: 65.01x


In [9]:
# =============================================================================
# VALIDACI√ìN DE PORTAFOLIO BIDIRECCIONAL (Ajustado por Sesgo In-Sample)
# =============================================================================
import pandas as pd
from tqdm.auto import tqdm

def run_portfolio_validation():
    print("üîÆ INICIANDO VALIDACI√ìN DE PORTAFOLIO BIDIRECCIONAL (Abr-Nov 2025)")
    print("‚ÑπÔ∏è  Nota: Se eval√∫a la persistencia del sesgo estructural detectado en el entrenamiento.")

    # 1. Definir Estrategias con su SESGO ESPERADO (1=Long, -1=Short)
    # Basado en el rendimiento In-Sample (Entrenamiento)
    strategies_top17 = [
        # --- GRUPO 1: ESTRATEGIAS POSITIVAS (Long Bias) ---
        {'id': 1,  'hora': '11:00', 'rango': 24, 'espera': 6,  'tp': 35,  'sl': 285, 'tipo': 1, 'bias': 1},
        {'id': 2,  'hora': '01:00', 'rango': 18, 'espera': 6,  'tp': 35,  'sl': 360, 'tipo': 0, 'bias': 1},
        {'id': 3,  'hora': '01:00', 'rango': 18, 'espera': 12, 'tp': 35,  'sl': 360, 'tipo': 0, 'bias': 1},
        {'id': 4,  'hora': '01:00', 'rango': 18, 'espera': 18, 'tp': 35,  'sl': 360, 'tipo': 0, 'bias': 1},

        # --- GRUPO 2: ESTRATEGIAS NEGATIVAS (Short Bias / Reverse) ---
        {'id': 5,  'hora': '16:00', 'rango': 0,  'espera': 6,  'tp': 260, 'sl': 60,  'tipo': 1, 'bias': -1},
        {'id': 6,  'hora': '16:00', 'rango': 0,  'espera': 24, 'tp': 260, 'sl': 60,  'tipo': 1, 'bias': -1},
        {'id': 7,  'hora': '16:00', 'rango': 0,  'espera': 3,  'tp': 235, 'sl': 85,  'tipo': 1, 'bias': -1},
        {'id': 8,  'hora': '16:00', 'rango': 0,  'espera': 3,  'tp': 260, 'sl': 85,  'tipo': 1, 'bias': -1},
        {'id': 9,  'hora': '20:00', 'rango': 12, 'espera': 6,  'tp': 260, 'sl': 210, 'tipo': 0, 'bias': -1},
        {'id': 10, 'hora': '20:00', 'rango': 12, 'espera': 3,  'tp': 260, 'sl': 210, 'tipo': 1, 'bias': -1},
        {'id': 11, 'hora': '20:00', 'rango': 12, 'espera': 3,  'tp': 285, 'sl': 210, 'tipo': 1, 'bias': -1},
        {'id': 12, 'hora': '20:00', 'rango': 12, 'espera': 12, 'tp': 260, 'sl': 185, 'tipo': 0, 'bias': -1},
        {'id': 13, 'hora': '15:00', 'rango': 0,  'espera': 3,  'tp': 310, 'sl': 160, 'tipo': 0, 'bias': -1},
        {'id': 14, 'hora': '20:00', 'rango': 12, 'espera': 12, 'tp': 260, 'sl': 210, 'tipo': 0, 'bias': -1},
        {'id': 15, 'hora': '15:00', 'rango': 0,  'espera': 3,  'tp': 310, 'sl': 335, 'tipo': 0, 'bias': -1},

        # --- GRUPO 3: ESTRATEGIAS POSITIVAS (Long Bias) ---
        {'id': 16, 'hora': '23:00', 'rango': 0,  'espera': 1,  'tp': 360, 'sl': 285, 'tipo': 1, 'bias': 1},
        {'id': 17, 'hora': '22:00', 'rango': 18, 'espera': 24, 'tp': 360, 'sl': 335, 'tipo': 1, 'bias': 1},
    ]

    # 2. Configurar Fechas Futuras (8 Meses)
    start_date = "2025-04-01"
    end_date = "2025-11-30"
    dates = pd.date_range(start_date, end_date, freq='D')

    results = []

    # 3. Ejecuci√≥n
    for strat in tqdm(strategies_top17, desc="Auditando Portafolio"):
        raw_net_ticks = 0
        divergence_count = 0

        for d in dates:
            fecha_str = d.strftime('%Y-%m-%d')
            try:
                r, p, o = Estrategy_Tester_Audit(
                    vela_df, ticks_df, fecha_str,
                    strat['hora'], strat['rango'], strat['espera'],
                    strat['tp'], strat['sl'], strat['tipo'],
                    5, 0.00001
                )
                if p != 0: raw_net_ticks += p
                if p != o: divergence_count += 1
            except:
                continue

        # --- L√ìGICA DE PORTAFOLIO BIDIRECCIONAL ---
        # Si el bias es negativo, invertimos el resultado (Short Selling)
        # Adjusted = Raw * Bias
        adjusted_net_ticks = raw_net_ticks * strat['bias']

        # Consistencia: ¬øGanamos dinero operando seg√∫n el bias?
        is_consistent = adjusted_net_ticks > 0

        results.append({
            'ID': strat['id'],
            'Bias_Esperado': "LONG (Pos)" if strat['bias'] == 1 else "SHORT (Neg)",
            'Raw_Net_Ticks': raw_net_ticks,
            'Adjusted_PnL': adjusted_net_ticks,
            'Consistente': "‚úÖ SI" if is_consistent else "‚ùå REVERTIDO",
            'Divergencia': divergence_count
        })

    # 4. Reporte Final
    df_results = pd.DataFrame(results)

    total_adjusted_pnl = df_results['Adjusted_PnL'].sum()
    consistent_count = df_results['Consistente'].apply(lambda x: 1 if "SI" in x else 0).sum()
    consistency_rate = (consistent_count / len(df_results)) * 100

    print("\n" + "="*80)
    print("INFORME DE PERSISTENCIA DE ESTRATEGIAS (8 MESES OOS)")
    print("="*80)
    print(df_results[['ID', 'Bias_Esperado', 'Raw_Net_Ticks', 'Adjusted_PnL', 'Consistente']].to_string(index=False))
    print("-" * 80)
    print(f"RETORNO NETO AJUSTADO (Cartera): {total_adjusted_pnl} Ticks")
    print(f"Tasa de Persistencia: {consistency_rate:.2f}% ({consistent_count}/17 estrategias)")
    print("="*80)

if __name__ == "__main__":
    run_portfolio_validation()

üîÆ INICIANDO VALIDACI√ìN DE PORTAFOLIO BIDIRECCIONAL (Abr-Nov 2025)
‚ÑπÔ∏è  Nota: Se eval√∫a la persistencia del sesgo estructural detectado en el entrenamiento.


Auditando Portafolio:   0%|          | 0/17 [00:00<?, ?it/s]


INFORME DE PERSISTENCIA DE ESTRATEGIAS (8 MESES OOS)
 ID Bias_Esperado  Raw_Net_Ticks  Adjusted_PnL Consistente
  1    LONG (Pos)            640           640        ‚úÖ SI
  2    LONG (Pos)           -290          -290 ‚ùå REVERTIDO
  3    LONG (Pos)            690           690        ‚úÖ SI
  4    LONG (Pos)            960           960        ‚úÖ SI
  5   SHORT (Neg)          -1340          1340        ‚úÖ SI
  6   SHORT (Neg)           -900           900        ‚úÖ SI
  7   SHORT (Neg)          -1730          1730        ‚úÖ SI
  8   SHORT (Neg)          -1055          1055        ‚úÖ SI
  9   SHORT (Neg)            340          -340 ‚ùå REVERTIDO
 10   SHORT (Neg)          -1080          1080        ‚úÖ SI
 11   SHORT (Neg)           -750           750        ‚úÖ SI
 12   SHORT (Neg)           -220           220        ‚úÖ SI
 13   SHORT (Neg)          -1410          1410        ‚úÖ SI
 14   SHORT (Neg)          -1620          1620        ‚úÖ SI
 15   SHORT (Neg)           -795 

# Secci√≥n nueva