# PARTE I: AN√ÅLISIS DE CARTERA DE ACCIONES
---

Construir y analizar una cartera de 5 acciones que incluya tu empresa asignada m√°s 4 empresas comparables del mismo sector o mercado relevante.

## Construcci√≥n del Dataset


### Librerias
---

In [1]:


# Instalaci√≥n de librer√≠as necesarias
!pip install yfinance pandas numpy matplotlib seaborn plotly scipy scikit-learn -q

# Importaci√≥n de librer√≠as
import yfinance as yf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import warnings
from datetime import datetime, timedelta
from scipy import stats
import plotly.express as px

# Configuraci√≥n
warnings.filterwarnings('ignore')
plt.style.use('seaborn-v0_8')
pd.set_option('display.max_columns', None)
pd.set_option('display.width', 1000)

print("üè¶ AN√ÅLISIS FINANCIERO PROFESIONAL - BYMA.BA")
print("=" * 60)
print("üìà Sistema configurado correctamente")
print("üìÖ An√°lisis de per√≠odo: √öltimos 5 a√±os")

üè¶ AN√ÅLISIS FINANCIERO PROFESIONAL - BYMA.BA
üìà Sistema configurado correctamente
üìÖ An√°lisis de per√≠odo: √öltimos 5 a√±os


### Definici√≥n de la cartera y obtenci√≥n de datos
---

In [2]:


# Definici√≥n de empresas para an√°lisis
EMPRESAS = {
    'BYMA.BA': 'Bolsas y Mercados Argentinos',  # Empresa principal
    'PAMP.BA': 'Pampa Energ√≠a',                 # Energ√≠a
    'SUPV.BA': 'Grupo Supervielle',             # Servicios Financieros
    'BMA': 'Banco Macro',                       # Servicios Financieros
    'CEPU.BA': 'Central Puerto'                 # Energ√≠a
}

# √çndices de referencia
INDICES = {
    '^MERV': 'MERVAL',
    '^GSPC': 'S&P 500'
}

# Combinar todas las empresas e √≠ndices
ALL_TICKERS = list(EMPRESAS.keys()) + list(INDICES.keys())

print("üéØ CARTERA SELECCIONADA:")
print("-" * 40)
for ticker, nombre in EMPRESAS.items():
    print(f"üìä {ticker:10} | {nombre}")

print(f"\nüìà √çNDICES DE REFERENCIA:")
for ticker, nombre in INDICES.items():
    print(f"üìä {ticker:10} | {nombre}")

# Definir per√≠odo de an√°lisis (5 a√±os)
fecha_fin = datetime.now()
fecha_inicio = fecha_fin - timedelta(days=5*365)

print(f"\nüìÖ PER√çODO DE AN√ÅLISIS:")
print(f"   Desde: {fecha_inicio.strftime('%Y-%m-%d')}")
print(f"   Hasta: {fecha_fin.strftime('%Y-%m-%d')}")

üéØ CARTERA SELECCIONADA:
----------------------------------------
üìä BYMA.BA    | Bolsas y Mercados Argentinos
üìä PAMP.BA    | Pampa Energ√≠a
üìä SUPV.BA    | Grupo Supervielle
üìä BMA        | Banco Macro
üìä CEPU.BA    | Central Puerto

üìà √çNDICES DE REFERENCIA:
üìä ^MERV      | MERVAL
üìä ^GSPC      | S&P 500

üìÖ PER√çODO DE AN√ÅLISIS:
   Desde: 2020-08-18
   Hasta: 2025-08-17


### Descarga y Validaci√≥n de datos Hitoricos ( 5 a√±os)
---

In [3]:


def obtener_datos_historicos_profesional(tickers, inicio, fin):
    """
    Funci√≥n profesional mejorada para obtener datos hist√≥ricos con validaci√≥n robusta
    """
    print(f"üîÑ DESCARGANDO DATOS HIST√ìRICOS PARA {len(tickers)} ACTIVOS")
    print("=" * 60)

    datos_exitosos = {}
    datos_fallidos = []
    resumen_descarga = {}

    for ticker in tickers:
        try:
            print(f"üì• Procesando {ticker}...")

            # Descargar datos con manejo de errores mejorado
            data = yf.download(
                ticker,
                start=inicio,
                end=fin,
                progress=False,
                auto_adjust=True,  # Ajuste autom√°tico por splits/dividendos
                prepost=False,     # Solo horario regular
                threads=True       # Descarga paralela
            )

            # Validaciones m√∫ltiples
            if data.empty:
                print(f"   ‚ùå {ticker}: Sin datos disponibles")
                datos_fallidos.append({'ticker': ticker, 'error': 'Sin datos'})
                continue

            # Extraer precio de cierre ajustado
            if 'Close' in data.columns:
                precios = data['Close']
            elif isinstance(data.columns, pd.MultiIndex):
                # Manejar MultiIndex que a veces retorna yfinance
                precios = data['Close'].iloc[:, 0] if len(data['Close'].shape) > 1 else data['Close']
            else:
                precios = data

            # Convertir a Series si es necesario
            if isinstance(precios, pd.DataFrame):
                precios = precios.iloc[:, 0]

            # Validaciones de calidad
            num_observaciones = len(precios)
            datos_faltantes = precios.isnull().sum()
            pct_faltantes = (datos_faltantes / num_observaciones) * 100

            # Criterios de aceptaci√≥n
            if num_observaciones < 100:
                print(f"   ‚ùå {ticker}: Insuficientes observaciones ({num_observaciones})")
                datos_fallidos.append({'ticker': ticker, 'error': f'Solo {num_observaciones} observaciones'})
                continue

            if pct_faltantes > 20:  # M√°ximo 20% de datos faltantes
                print(f"   ‚ùå {ticker}: Demasiados datos faltantes ({pct_faltantes:.1f}%)")
                datos_fallidos.append({'ticker': ticker, 'error': f'{pct_faltantes:.1f}% faltantes'})
                continue

            # Validar que hay precios v√°lidos (no todos zeros o negativos)
            precios_validos = precios.dropna()
            if len(precios_validos) == 0 or (precios_validos <= 0).all():
                print(f"   ‚ùå {ticker}: Precios inv√°lidos")
                datos_fallidos.append({'ticker': ticker, 'error': 'Precios inv√°lidos'})
                continue

            # Si pasa todas las validaciones
            datos_exitosos[ticker] = precios
            resumen_descarga[ticker] = {
                'observaciones': num_observaciones,
                'datos_faltantes': datos_faltantes,
                'pct_faltantes': pct_faltantes,
                'precio_inicial': precios_validos.iloc[0],
                'precio_final': precios_validos.iloc[-1],
                'fecha_inicial': precios_validos.index[0],
                'fecha_final': precios_validos.index[-1]
            }

            print(f"   ‚úÖ {ticker}: {num_observaciones:,} obs, {pct_faltantes:.1f}% faltantes")

        except Exception as e:
            error_msg = str(e)[:50]  # Limitar longitud del error
            print(f"   ‚ùå {ticker}: ERROR - {error_msg}")
            datos_fallidos.append({'ticker': ticker, 'error': error_msg})

    # Crear DataFrame final
    if datos_exitosos:
        df_precios = pd.DataFrame(datos_exitosos)

        # Alinear todas las fechas (usar intersecci√≥n de fechas disponibles)
        df_precios = df_precios.dropna(how='all')  # Eliminar filas completamente vac√≠as

        print(f"\nüìä RESUMEN DE DESCARGA:")
        print(f"   ‚úÖ Exitosos: {len(datos_exitosos)}/{len(tickers)}")
        print(f"   ‚ùå Fallidos: {len(datos_fallidos)}")
        print(f"   üìà Observaciones finales: {len(df_precios):,}")
        print(f"   üìÖ Per√≠odo efectivo: {df_precios.index[0].date()} a {df_precios.index[-1].date()}")

        if datos_fallidos:
            print(f"\n‚ö†Ô∏è  ACTIVOS CON PROBLEMAS:")
            for fallo in datos_fallidos:
                print(f"   ‚Ä¢ {fallo['ticker']}: {fallo['error']}")

        return df_precios, datos_fallidos, resumen_descarga

    else:
        print(f"\n‚ùå ERROR CR√çTICO: No se pudieron descargar datos v√°lidos")
        return pd.DataFrame(), datos_fallidos, {}

# Ejecutar descarga con validaci√≥n robusta
print("üöÄ INICIANDO DESCARGA DE DATOS HIST√ìRICOS")
precios_raw, fallos, resumen = obtener_datos_historicos_profesional(
    ALL_TICKERS, fecha_inicio, fecha_fin
)

# Validaci√≥n adicional del dataset resultante
if not precios_raw.empty:
    print(f"\nüîç VALIDACI√ìN ADICIONAL DEL DATASET:")
    print("-" * 50)

    # Verificar alineaci√≥n temporal
    fechas_por_activo = {}
    for col in precios_raw.columns:
        datos_activo = precios_raw[col].dropna()
        fechas_por_activo[col] = {
            'primera_fecha': datos_activo.index[0],
            'ultima_fecha': datos_activo.index[-1],
            'observaciones_validas': len(datos_activo)
        }
        print(f"üìä {col:12}: {len(datos_activo):,} obs v√°lidas "
              f"({datos_activo.index[0].date()} a {datos_activo.index[-1].date()})")

    # Verificar consistencia temporal
    fechas_inicio = [info['primera_fecha'] for info in fechas_por_activo.values()]
    fechas_fin = [info['ultima_fecha'] for info in fechas_por_activo.values()]

    print(f"\nüìÖ CONSISTENCIA TEMPORAL:")
    print(f"   Primera fecha com√∫n: {max(fechas_inicio).date()}")
    print(f"   √öltima fecha com√∫n: {min(fechas_fin).date()}")

    # Estad√≠sticas finales
    total_observaciones = len(precios_raw)
    observaciones_completas = precios_raw.dropna().shape[0]
    completitud_dataset = (observaciones_completas / total_observaciones) * 100

    print(f"\nüìä ESTAD√çSTICAS FINALES:")
    print(f"   üìà Observaciones totales: {total_observaciones:,}")
    print(f"   ‚úÖ Observaciones completas: {observaciones_completas:,}")
    print(f"   üéØ Completitud del dataset: {completitud_dataset:.1f}%")

else:
    print("\n‚ùå FALLO CR√çTICO: Dataset vac√≠o, revisar tickers o conexi√≥n")



üöÄ INICIANDO DESCARGA DE DATOS HIST√ìRICOS
üîÑ DESCARGANDO DATOS HIST√ìRICOS PARA 7 ACTIVOS
üì• Procesando BYMA.BA...
   ‚úÖ BYMA.BA: 1,218 obs, 0.0% faltantes
üì• Procesando PAMP.BA...
   ‚úÖ PAMP.BA: 1,218 obs, 0.0% faltantes
üì• Procesando SUPV.BA...
   ‚úÖ SUPV.BA: 1,218 obs, 0.0% faltantes
üì• Procesando BMA...
   ‚úÖ BMA: 1,255 obs, 0.0% faltantes
üì• Procesando CEPU.BA...
   ‚úÖ CEPU.BA: 1,218 obs, 0.0% faltantes
üì• Procesando ^MERV...
   ‚úÖ ^MERV: 1,217 obs, 0.0% faltantes
üì• Procesando ^GSPC...
   ‚úÖ ^GSPC: 1,255 obs, 0.0% faltantes

üìä RESUMEN DE DESCARGA:
   ‚úÖ Exitosos: 7/7
   ‚ùå Fallidos: 0
   üìà Observaciones finales: 1,288
   üìÖ Per√≠odo efectivo: 2020-08-18 a 2025-08-15

üîç VALIDACI√ìN ADICIONAL DEL DATASET:
--------------------------------------------------
üìä BYMA.BA     : 1,218 obs v√°lidas (2020-08-18 a 2025-08-14)
üìä PAMP.BA     : 1,218 obs v√°lidas (2020-08-18 a 2025-08-14)
üìä SUPV.BA     : 1,218 obs v√°lidas (2020-08-18 a 2025-08-14)

### Limpieza y validaci√≥n de datos
---

In [4]:


def limpiar_datos_profesional(df):
    """
    Limpieza profesional de datos financieros
    """
    print("üßπ INICIANDO LIMPIEZA PROFESIONAL DE DATOS")
    print("-" * 50)

    df_limpio = df.copy()
    reporte_limpieza = {
        'observaciones_originales': len(df),
        'columnas_originales': len(df.columns),
        'datos_faltantes_original': {},
        'datos_faltantes_final': {},
        'outliers_detectados': {},
        'observaciones_finales': 0
    }

    # 1. An√°lisis inicial de datos faltantes
    print("üìä AN√ÅLISIS DE DATOS FALTANTES:")
    for col in df_limpio.columns:
        faltantes = df_limpio[col].isnull().sum()
        pct_faltantes = (faltantes / len(df_limpio)) * 100
        reporte_limpieza['datos_faltantes_original'][col] = faltantes

        if faltantes > 0:
            print(f"   {col:12}: {faltantes:4d} ({pct_faltantes:5.1f}%)")

    # 2. Imputaci√≥n inteligente (forward fill seguido de interpolaci√≥n)
    print("\nüîß APLICANDO IMPUTACI√ìN INTELIGENTE:")
    df_limpio = df_limpio.fillna(method='ffill').fillna(method='bfill')

    # 3. Detecci√≥n de outliers (cambios diarios >50%)
    print("\nüîç DETECTANDO OUTLIERS EXTREMOS:")
    retornos_diarios = df_limpio.pct_change()

    for col in df_limpio.columns:
        outliers = (retornos_diarios[col].abs() > 0.50).sum()
        reporte_limpieza['outliers_detectados'][col] = outliers
        if outliers > 0:
            print(f"   {col:12}: {outliers:4d} cambios diarios >50%")

    # 4. Validaci√≥n final
    print("\n‚úÖ VALIDACI√ìN FINAL:")
    for col in df_limpio.columns:
        faltantes_final = df_limpio[col].isnull().sum()
        reporte_limpieza['datos_faltantes_final'][col] = faltantes_final
        print(f"   {col:12}: {faltantes_final:4d} datos faltantes restantes")

    reporte_limpieza['observaciones_finales'] = len(df_limpio)

    print(f"\nüìä RESUMEN DE LIMPIEZA:")
    print(f"   üìà Observaciones: {reporte_limpieza['observaciones_originales']} ‚Üí {reporte_limpieza['observaciones_finales']}")
    print(f"   üóìÔ∏è  Per√≠odo final: {df_limpio.index[0].date()} a {df_limpio.index[-1].date()}")

    return df_limpio, reporte_limpieza

# Aplicar limpieza profesional
precios_limpios, reporte = limpiar_datos_profesional(precios_raw)

# Mostrar informaci√≥n final del dataset
print(f"\nüéØ DATASET FINAL CONSTRUIDO:")
print(f"   üìä Dimensiones: {precios_limpios.shape}")
print(f"   üìÖ Per√≠odo: {precios_limpios.index[0].date()} a {precios_limpios.index[-1].date()}")
print(f"   üè¢ Activos incluidos: {list(precios_limpios.columns)}")

üßπ INICIANDO LIMPIEZA PROFESIONAL DE DATOS
--------------------------------------------------
üìä AN√ÅLISIS DE DATOS FALTANTES:
   BYMA.BA     :   70 (  5.4%)
   PAMP.BA     :   70 (  5.4%)
   SUPV.BA     :   70 (  5.4%)
   BMA         :   33 (  2.6%)
   CEPU.BA     :   70 (  5.4%)
   ^MERV       :   71 (  5.5%)
   ^GSPC       :   33 (  2.6%)

üîß APLICANDO IMPUTACI√ìN INTELIGENTE:

üîç DETECTANDO OUTLIERS EXTREMOS:

‚úÖ VALIDACI√ìN FINAL:
   BYMA.BA     :    0 datos faltantes restantes
   PAMP.BA     :    0 datos faltantes restantes
   SUPV.BA     :    0 datos faltantes restantes
   BMA         :    0 datos faltantes restantes
   CEPU.BA     :    0 datos faltantes restantes
   ^MERV       :    0 datos faltantes restantes
   ^GSPC       :    0 datos faltantes restantes

üìä RESUMEN DE LIMPIEZA:
   üìà Observaciones: 1288 ‚Üí 1288
   üóìÔ∏è  Per√≠odo final: 2020-08-18 a 2025-08-15

üéØ DATASET FINAL CONSTRUIDO:
   üìä Dimensiones: (1288, 7)
   üìÖ Per√≠odo: 2020-08-18 a 2025-

### Justificaci√≥n de selecci√≥n de empresas comparables
---

In [5]:


def analizar_justificacion_empresas():
    """
    An√°lisis profesional de justificaci√≥n para selecci√≥n de empresas
    """
    print("üéØ JUSTIFICACI√ìN T√âCNICA DE SELECCI√ìN DE EMPRESAS")
    print("=" * 60)

    justificacion = {
        'BYMA.BA': {
            'empresa': 'Bolsas y Mercados Argentinos',
            'sector': 'Servicios Financieros - Infraestructura de Mercados',
            'justificacion': 'Empresa principal asignada',
            'market_cap_aprox': 'Mediana',
            'mercado': 'Argentina (BYMA)',
            'relevancia': 'Operador √∫nico de mercados de capitales en Argentina'
        },
        'PAMP.BA': {
            'empresa': 'Pampa Energ√≠a',
            'sector': 'Energ√≠a - Generaci√≥n El√©ctrica',
            'justificacion': 'Exposici√≥n al sector energ√©tico argentino',
            'market_cap_aprox': 'Grande',
            'mercado': 'Argentina (BYMA)',
            'relevancia': 'L√≠der en generaci√≥n el√©ctrica, correlacionado con actividad econ√≥mica'
        },
        'SUPV.BA': {
            'empresa': 'Grupo Supervielle',
            'sector': 'Servicios Financieros - Banca',
            'justificacion': 'Mismo sector financiero, exposici√≥n bancaria',
            'market_cap_aprox': 'Mediana',
            'mercado': 'Argentina (BYMA)',
            'relevancia': 'Banco de capitales argentinos, correlaci√≥n sectorial directa'
        },
        'BMA': {
            'empresa': 'Banco Macro',
            'sector': 'Servicios Financieros - Banca',
            'justificacion': 'Sector financiero, mayor liquidez (NYSE)',
            'market_cap_aprox': 'Grande',
            'mercado': 'NYSE (ADR)',
            'relevancia': 'Exposici√≥n internacional del sector financiero argentino'
        },
        'CEPU.BA': {
            'empresa': 'Central Puerto',
            'sector': 'Energ√≠a - Generaci√≥n El√©ctrica',
            'justificacion': 'Diversificaci√≥n sectorial energ√©tica',
            'market_cap_aprox': 'Mediana',
            'mercado': 'Argentina (BYMA)',
            'relevancia': 'Complementa exposici√≥n energ√©tica, correlaci√≥n macroecon√≥mica'
        }
    }

    # Crear DataFrame para an√°lisis
    df_justificacion = pd.DataFrame(justificacion).T

    print("üìã CRITERIOS DE SELECCI√ìN APLICADOS:")
    print("-" * 40)
    print("1Ô∏è‚É£  SECTOR ECON√ìMICO:")
    print("   ‚Ä¢ Servicios Financieros (3 empresas): BYMA, SUPV, BMA")
    print("   ‚Ä¢ Energ√≠a (2 empresas): PAMP, CEPU")
    print("   ‚Ä¢ Justificaci√≥n: Diversificaci√≥n sectorial controlada")

    print("\n2Ô∏è‚É£  CAPITALIZACI√ìN DE MERCADO:")
    print("   ‚Ä¢ Grande: PAMP, BMA")
    print("   ‚Ä¢ Mediana: BYMA, SUPV, CEPU")
    print("   ‚Ä¢ Justificaci√≥n: Mix de liquidez y potencial de crecimiento")

    print("\n3Ô∏è‚É£  MERCADO DE COTIZACI√ìN:")
    print("   ‚Ä¢ BYMA Argentina (4 empresas): BYMA, PAMP, SUPV, CEPU")
    print("   ‚Ä¢ NYSE ADR (1 empresa): BMA")
    print("   ‚Ä¢ Justificaci√≥n: Exposici√≥n principalmente local con diversificaci√≥n internacional")

    print("\n4Ô∏è‚É£  RELEVANCIA ESTRAT√âGICA:")
    print("   ‚Ä¢ Infraestructura financiera (BYMA)")
    print("   ‚Ä¢ Sector bancario tradicional (SUPV, BMA)")
    print("   ‚Ä¢ Sector energ√©tico cr√≠tico (PAMP, CEPU)")

    return df_justificacion

# Ejecutar an√°lisis de justificaci√≥n
justificacion_empresas = analizar_justificacion_empresas()

print("\n" + "="*60)
print("‚úÖ DATASET COMPLETO Y JUSTIFICADO")
print("üìä Datos listos para an√°lisis t√©cnico, fundamental y de portfolio")

üéØ JUSTIFICACI√ìN T√âCNICA DE SELECCI√ìN DE EMPRESAS
üìã CRITERIOS DE SELECCI√ìN APLICADOS:
----------------------------------------
1Ô∏è‚É£  SECTOR ECON√ìMICO:
   ‚Ä¢ Servicios Financieros (3 empresas): BYMA, SUPV, BMA
   ‚Ä¢ Energ√≠a (2 empresas): PAMP, CEPU
   ‚Ä¢ Justificaci√≥n: Diversificaci√≥n sectorial controlada

2Ô∏è‚É£  CAPITALIZACI√ìN DE MERCADO:
   ‚Ä¢ Grande: PAMP, BMA
   ‚Ä¢ Mediana: BYMA, SUPV, CEPU
   ‚Ä¢ Justificaci√≥n: Mix de liquidez y potencial de crecimiento

3Ô∏è‚É£  MERCADO DE COTIZACI√ìN:
   ‚Ä¢ BYMA Argentina (4 empresas): BYMA, PAMP, SUPV, CEPU
   ‚Ä¢ NYSE ADR (1 empresa): BMA
   ‚Ä¢ Justificaci√≥n: Exposici√≥n principalmente local con diversificaci√≥n internacional

4Ô∏è‚É£  RELEVANCIA ESTRAT√âGICA:
   ‚Ä¢ Infraestructura financiera (BYMA)
   ‚Ä¢ Sector bancario tradicional (SUPV, BMA)
   ‚Ä¢ Sector energ√©tico cr√≠tico (PAMP, CEPU)

‚úÖ DATASET COMPLETO Y JUSTIFICADO
üìä Datos listos para an√°lisis t√©cnico, fundamental y de portfolio


### Documentaci√≥n de fuentes y metodolog√≠a
---

In [6]:


def documentar_metodologia():
    """
    Documentaci√≥n profesional de fuentes y metodolog√≠a aplicada
    """
    print("üìö DOCUMENTACI√ìN DE FUENTES Y METODOLOG√çA")
    print("=" * 60)

    metodologia = {
        'fuentes_datos': {
            'primaria': 'Yahoo Finance (yfinance)',
            'justificacion': 'Fuente confiable y ampliamente utilizada para datos hist√≥ricos',
            'cobertura': 'Precios ajustados por dividendos y splits',
            'actualizacion': 'Datos en tiempo real con delay m√≠nimo'
        },
        'metodologia_limpieza': {
            'paso_1': 'Validaci√≥n de completitud (m√≠n. 100 observaciones)',
            'paso_2': 'Imputaci√≥n forward-fill seguida de backward-fill',
            'paso_3': 'Detecci√≥n de outliers (cambios >50% diarios)',
            'paso_4': 'Validaci√≥n final de integridad'
        },
        'criterios_calidad': {
            'periodo_minimo': '5 a√±os de datos hist√≥ricos',
            'frecuencia': 'Datos diarios de precios ajustados',
            'completitud': 'Tolerancia m√°xima 5% datos faltantes',
            'consistencia': 'Validaci√≥n de fechas y ordenamiento cronol√≥gico'
        },
        'limitaciones': {
            'limitacion_1': 'Datos de Yahoo Finance pueden tener delays',
            'limitacion_2': 'Ajustes por splits/dividendos pueden afectar an√°lisis t√©cnico',
            'limitacion_3': 'Mercado argentino con menor liquidez vs mercados desarrollados',
            'limitacion_4': 'Riesgo pa√≠s y volatilidad macroecon√≥mica'
        }
    }

    print("üìñ FUENTES DE DATOS:")
    print("-" * 30)
    print(f"üîπ Fuente Principal: {metodologia['fuentes_datos']['primaria']}")
    print(f"üîπ Justificaci√≥n: {metodologia['fuentes_datos']['justificacion']}")
    print(f"üîπ Cobertura: {metodologia['fuentes_datos']['cobertura']}")

    print("\nüîß METODOLOG√çA DE LIMPIEZA:")
    print("-" * 30)
    for paso, descripcion in metodologia['metodologia_limpieza'].items():
        print(f"üîπ {paso.replace('_', ' ').title()}: {descripcion}")

    print("\n‚úÖ CRITERIOS DE CALIDAD:")
    print("-" * 30)
    for criterio, descripcion in metodologia['criterios_calidad'].items():
        print(f"üîπ {criterio.replace('_', ' ').title()}: {descripcion}")

    print("\n‚ö†Ô∏è  LIMITACIONES IDENTIFICADAS:")
    print("-" * 30)
    for limitacion, descripcion in metodologia['limitaciones'].items():
        print(f"üîπ {descripcion}")

    return metodologia

# Documentar metodolog√≠a
metodologia_aplicada = documentar_metodologia()

# Resumen final del segmento
print("\n" + "="*60)
print("‚úÖ SEGMENTO 1 COMPLETADO: CONSTRUCCI√ìN DE DATASET")
print("üìä Dataset validado y documentado")
print("üéØ Cartera de 5 empresas + 2 √≠ndices de referencia")
print("üìÖ Per√≠odo: 5 a√±os de datos hist√≥ricos")
print("üè¶ Listo para an√°lisis financiero integral")
print("="*60)

üìö DOCUMENTACI√ìN DE FUENTES Y METODOLOG√çA
üìñ FUENTES DE DATOS:
------------------------------
üîπ Fuente Principal: Yahoo Finance (yfinance)
üîπ Justificaci√≥n: Fuente confiable y ampliamente utilizada para datos hist√≥ricos
üîπ Cobertura: Precios ajustados por dividendos y splits

üîß METODOLOG√çA DE LIMPIEZA:
------------------------------
üîπ Paso 1: Validaci√≥n de completitud (m√≠n. 100 observaciones)
üîπ Paso 2: Imputaci√≥n forward-fill seguida de backward-fill
üîπ Paso 3: Detecci√≥n de outliers (cambios >50% diarios)
üîπ Paso 4: Validaci√≥n final de integridad

‚úÖ CRITERIOS DE CALIDAD:
------------------------------
üîπ Periodo Minimo: 5 a√±os de datos hist√≥ricos
üîπ Frecuencia: Datos diarios de precios ajustados
üîπ Completitud: Tolerancia m√°xima 5% datos faltantes
üîπ Consistencia: Validaci√≥n de fechas y ordenamiento cronol√≥gico

‚ö†Ô∏è  LIMITACIONES IDENTIFICADAS:
------------------------------
üîπ Datos de Yahoo Finance pueden tener delays
üîπ Ajustes

### Inclusi√≥n y An√°lisis de √çndices de Referencia
---

In [7]:


def analizar_indices_referencia(precios_df):
    """
    An√°lisis profesional de √≠ndices de referencia para benchmarking
    """
    print("üìà AN√ÅLISIS DE √çNDICES DE REFERENCIA")
    print("=" * 50)

    # Separar empresas de √≠ndices
    empresas_cols = [col for col in precios_df.columns if col in EMPRESAS.keys()]
    indices_cols = [col for col in precios_df.columns if col in INDICES.keys()]

    print("üéØ √çNDICES INCLUIDOS:")
    print("-" * 30)

    # An√°lisis de cada √≠ndice
    indices_info = {}

    for indice in indices_cols:
        if indice in precios_df.columns:
            datos_indice = precios_df[indice].dropna()

            # Calcular estad√≠sticas b√°sicas
            rendimiento_total = (datos_indice.iloc[-1] / datos_indice.iloc[0] - 1) * 100
            volatilidad_anual = datos_indice.pct_change().std() * np.sqrt(252) * 100

            indices_info[indice] = {
                'nombre': INDICES.get(indice, indice),
                'observaciones': len(datos_indice),
                'precio_inicial': datos_indice.iloc[0],
                'precio_final': datos_indice.iloc[-1],
                'rendimiento_total_pct': rendimiento_total,
                'volatilidad_anual_pct': volatilidad_anual,
                'periodo': f"{datos_indice.index[0].date()} a {datos_indice.index[-1].date()}"
            }

            print(f"üìä {INDICES.get(indice, indice)}:")
            print(f"   üîπ Ticker: {indice}")
            print(f"   üîπ Observaciones: {len(datos_indice):,}")
            print(f"   üîπ Rendimiento total: {rendimiento_total:+.1f}%")
            print(f"   üîπ Volatilidad anual: {volatilidad_anual:.1f}%")
            print(f"   üîπ Per√≠odo: {datos_indice.index[0].date()} a {datos_indice.index[-1].date()}")
            print()

    # An√°lisis comparativo
    print("üîç JUSTIFICACI√ìN DE √çNDICES SELECCIONADOS:")
    print("-" * 40)
    print("üìà MERVAL (^MERV):")
    print("   üîπ Relevancia: √çndice principal del mercado argentino")
    print("   üîπ Composici√≥n: 20 empresas de mayor capitalizaci√≥n y liquidez")
    print("   üîπ Uso: Benchmark para empresas argentinas (BYMA, PAMP, SUPV, CEPU)")
    print("   üîπ Ventaja: Representa el desempe√±o del mercado local")

    print("\nüìà S&P 500 (^GSPC):")
    print("   üîπ Relevancia: Benchmark global de mercados desarrollados")
    print("   üîπ Composici√≥n: 500 empresas l√≠deres estadounidenses")
    print("   üîπ Uso: Benchmark para BMA (cotiza en NYSE) y comparaci√≥n internacional")
    print("   üîπ Ventaja: Referencia de estabilidad y diversificaci√≥n global")

    return indices_info

# Ejecutar an√°lisis de √≠ndices
indices_analisis = analizar_indices_referencia(precios_limpios)

# Crear visualizaci√≥n comparativa de √≠ndices
def visualizar_indices_referencia(precios_df, indices_info):
    """
    Visualizaci√≥n profesional de √≠ndices de referencia
    """
    print("üìä GENERANDO VISUALIZACI√ìN DE √çNDICES...")

    fig = make_subplots(
        rows=2, cols=2,
        subplot_titles=('Evoluci√≥n de √çndices (Normalizada)', 'Rendimientos Diarios',
                       'Distribuci√≥n de Rendimientos', 'Volatilidad Rodante (30 d√≠as)'),
        specs=[[{"secondary_y": False}, {"secondary_y": False}],
               [{"secondary_y": False}, {"secondary_y": False}]]
    )

    indices_cols = [col for col in precios_df.columns if col in INDICES.keys()]
    colors = ['#1f77b4', '#ff7f0e', '#2ca02c', '#d62728']

    for i, indice in enumerate(indices_cols):
        if indice in precios_df.columns:
            datos = precios_df[indice].dropna()
            nombre = INDICES.get(indice, indice)
            color = colors[i % len(colors)]

            # 1. Evoluci√≥n normalizada (base 100)
            datos_norm = (datos / datos.iloc[0]) * 100
            fig.add_trace(
                go.Scatter(x=datos_norm.index, y=datos_norm.values,
                          name=f'{nombre}', line=dict(color=color)),
                row=1, col=1
            )

            # 2. Rendimientos diarios
            rendimientos = datos.pct_change().dropna() * 100
            fig.add_trace(
                go.Scatter(x=rendimientos.index, y=rendimientos.values,
                          name=f'{nombre} Returns', line=dict(color=color),
                          showlegend=False),
                row=1, col=2
            )

            # 3. Distribuci√≥n de rendimientos
            fig.add_trace(
                go.Histogram(x=rendimientos.values, name=f'{nombre} Dist',
                           opacity=0.7, nbinsx=50, showlegend=False,
                           marker_color=color),
                row=2, col=1
            )

            # 4. Volatilidad rodante
            vol_rodante = rendimientos.rolling(30).std() * np.sqrt(252)
            fig.add_trace(
                go.Scatter(x=vol_rodante.index, y=vol_rodante.values,
                          name=f'{nombre} Vol', line=dict(color=color),
                          showlegend=False),
                row=2, col=2
            )

    # Actualizar layout
    fig.update_layout(
        height=800,
        title_text="üìà AN√ÅLISIS INTEGRAL DE √çNDICES DE REFERENCIA",
        title_x=0.5,
        showlegend=True
    )

    # Actualizar ejes
    fig.update_xaxes(title_text="Fecha", row=2, col=1)
    fig.update_xaxes(title_text="Fecha", row=2, col=2)
    fig.update_yaxes(title_text="Valor Normalizado (Base 100)", row=1, col=1)
    fig.update_yaxes(title_text="Rendimiento Diario (%)", row=1, col=2)
    fig.update_yaxes(title_text="Frecuencia", row=2, col=1)
    fig.update_yaxes(title_text="Volatilidad Anualizada", row=2, col=2)

    fig.show()

    print("‚úÖ Visualizaci√≥n de √≠ndices completada")

# Generar visualizaci√≥n
visualizar_indices_referencia(precios_limpios, indices_analisis)

print("\n" + "="*60)
print("‚úÖ SEGMENTO 4 COMPLETADO: √çNDICES DE REFERENCIA")
print("üìà MERVAL y S&P 500 incluidos y analizados")
print("üéØ Benchmarks configurados para evaluaci√≥n de performance")
print("üìä An√°lisis comparativo listo para uso en portfolio")
print("="*60)

üìà AN√ÅLISIS DE √çNDICES DE REFERENCIA
üéØ √çNDICES INCLUIDOS:
------------------------------
üìä MERVAL:
   üîπ Ticker: ^MERV
   üîπ Observaciones: 1,288
   üîπ Rendimiento total: +4607.5%
   üîπ Volatilidad anual: 41.0%
   üîπ Per√≠odo: 2020-08-18 a 2025-08-15

üìä S&P 500:
   üîπ Ticker: ^GSPC
   üîπ Observaciones: 1,288
   üîπ Rendimiento total: +90.3%
   üîπ Volatilidad anual: 17.2%
   üîπ Per√≠odo: 2020-08-18 a 2025-08-15

üîç JUSTIFICACI√ìN DE √çNDICES SELECCIONADOS:
----------------------------------------
üìà MERVAL (^MERV):
   üîπ Relevancia: √çndice principal del mercado argentino
   üîπ Composici√≥n: 20 empresas de mayor capitalizaci√≥n y liquidez
   üîπ Uso: Benchmark para empresas argentinas (BYMA, PAMP, SUPV, CEPU)
   üîπ Ventaja: Representa el desempe√±o del mercado local

üìà S&P 500 (^GSPC):
   üîπ Relevancia: Benchmark global de mercados desarrollados
   üîπ Composici√≥n: 500 empresas l√≠deres estadounidenses
   üîπ Uso: Benchmark para BMA (c

‚úÖ Visualizaci√≥n de √≠ndices completada

‚úÖ SEGMENTO 4 COMPLETADO: √çNDICES DE REFERENCIA
üìà MERVAL y S&P 500 incluidos y analizados
üéØ Benchmarks configurados para evaluaci√≥n de performance
üìä An√°lisis comparativo listo para uso en portfolio


### Pregunta Critica



**Considerando tu an√°lisis de cartera, t√©cnico y fundamental, ¬øcu√°l ser√≠a tu estrategia completa de inversi√≥n? ¬øContra qu√© benchmark comparar√≠as el performance y por qu√©?**

Criterios de Selecci√≥n:

Me centr√© en una combinaci√≥n de sectores clave en Argentina: 60% financiero (BYMA, SUPV, BMA) y 40% energ√≠a (PAMP, CEPU), bas√°ndome en d√≥nde "se mueve la plata" en el mercado local.

Relevancia para un Inversor Argentino:

Exposici√≥n a Sectores Clave: Los sectores financiero y energ√©tico son fundamentales para la econom√≠a argentina, benefici√°ndose de la normalizaci√≥n econ√≥mica y ofreciendo estabilidad contra la inflaci√≥n, respectivamente.

Liquidez Local: Seleccion√© acciones l√≠quidas en BYMA, permitiendo f√°cil entrada y salida sin restricciones inusuales.

Correlaci√≥n Local: Las acciones est√°n correlacionadas con el mercado argentino, no con √≠ndices externos como el S&P500, lo que alinea mi portafolio con el desempe√±o econ√≥mico local.

Mix de Riesgos Estrat√©gico: Combin√© la exposici√≥n √∫nica de BYMA (beneficiada por la actividad burs√°til) con el potencial de los bancos (ligado a tasas y normalizaci√≥n) y la estabilidad de las energ√©ticas (protegidas por tarifas).

Diversificaci√≥n en Pesos: La cartera ofrece diversificaci√≥n real dentro del mercado local, operable desde cualquier br√≥ker argentino, donde los diferentes activos pueden compensarse mutuamente en momentos de volatilidad.

**Mi selecci√≥n se basa en una visi√≥n pragm√°tica del mercado argentino, eligiendo empresas l√≠quidas en sectores relevantes que ofrecen un mix estrat√©gico de riesgo y potencial de retorno adaptado a las condiciones locales y al inversor promedio.**

## Analisis Descriptivo Avanzado
---

### Gr√°ficos de precios Normalizados (BASE 100)
---

In [8]:
# ============================================================================
# SEGMENTO 1: GR√ÅFICOS DE PRECIOS NORMALIZADOS (BASE 100)
# ============================================================================

import plotly.graph_objects as go
from plotly.subplots import make_subplots
import numpy as np
import pandas as pd

print("üìä SEGMENTO 1: GR√ÅFICOS DE PRECIOS NORMALIZADOS (BASE 100)")
print("=" * 60)

# Separar empresas e √≠ndices
empresas_cols = [col for col in precios_limpios.columns if col in EMPRESAS.keys()]
indices_cols = [col for col in precios_limpios.columns if col in INDICES.keys()]

# Normalizar precios (base 100)
precios_norm = pd.DataFrame()
for col in precios_limpios.columns:
    primer_precio_valido = precios_limpios[col].dropna().iloc[0]
    precios_norm[col] = (precios_limpios[col] / primer_precio_valido) * 100

# Crear visualizaci√≥n interactiva
fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        'Portfolio Completo - Precios Normalizados (Base 100)',
        'Solo Empresas vs MERVAL',
        'Rendimientos Acumulados',
        'Volatilidad vs Rendimiento (Scatter)'
    ),
    specs=[[{"secondary_y": False}, {"secondary_y": False}],
           [{"secondary_y": False}, {"secondary_y": False}]]
)

colors = {
    'BYMA.BA': '#1f77b4', 'PAMP.BA': '#ff7f0e', 'SUPV.BA': '#2ca02c',
    'BMA': '#d62728', 'CEPU.BA': '#9467bd', '^MERV': '#000000', '^GSPC': '#8c564b'
}

# Plot 1: Portfolio completo
for col in precios_norm.columns:
    nombre = EMPRESAS.get(col, INDICES.get(col, col))
    line_width = 3 if col in indices_cols else 2
    dash = 'solid' if col not in indices_cols else 'dash'

    fig.add_trace(
        go.Scatter(
            x=precios_norm.index,
            y=precios_norm[col],
            name=nombre,
            line=dict(color=colors.get(col, '#666666'), width=line_width, dash=dash),
            hovertemplate=f"<b>{nombre}</b><br>Fecha: %{{x}}<br>Valor: %{{y:.1f}}<extra></extra>"
        ),
        row=1, col=1
    )

# Plot 2: Solo empresas vs MERVAL
for col in empresas_cols + ['^MERV']:
    if col in precios_norm.columns:
        nombre = EMPRESAS.get(col, INDICES.get(col, col))
        line_width = 3 if col == '^MERV' else 2
        dash = 'dash' if col == '^MERV' else 'solid'

        fig.add_trace(
            go.Scatter(
                x=precios_norm.index,
                y=precios_norm[col],
                name=f"{nombre} (vs MERVAL)",
                line=dict(color=colors.get(col, '#666666'), width=line_width, dash=dash),
                showlegend=False
            ),
            row=1, col=2
        )

# Plot 3: Rendimientos acumulados
rendimientos_cum = pd.DataFrame()
for col in empresas_cols:
    if col in precios_limpios.columns:
        ret_diarios = precios_limpios[col].pct_change().fillna(0)
        rendimientos_cum[col] = (1 + ret_diarios).cumprod() * 100

for col in rendimientos_cum.columns:
    nombre = EMPRESAS[col]
    fig.add_trace(
        go.Scatter(
            x=rendimientos_cum.index,
            y=rendimientos_cum[col],
            name=f"{nombre} (Acum)",
            line=dict(color=colors.get(col, '#666666')),
            showlegend=False
        ),
        row=2, col=1
    )

# Plot 4: Volatilidad vs Rendimiento
metricas_scatter = {}
for col in empresas_cols:
    if col in precios_limpios.columns:
        returns = precios_limpios[col].pct_change().dropna()
        ret_anual = returns.mean() * 252 * 100
        vol_anual = returns.std() * np.sqrt(252) * 100
        metricas_scatter[col] = {'rendimiento': ret_anual, 'volatilidad': vol_anual}

scatter_df = pd.DataFrame(metricas_scatter).T

fig.add_trace(
    go.Scatter(
        x=scatter_df['volatilidad'],
        y=scatter_df['rendimiento'],
        mode='markers+text',
        text=[EMPRESAS[idx][:4] for idx in scatter_df.index],
        textposition="top center",
        marker=dict(size=12, color=[colors.get(idx, '#666666') for idx in scatter_df.index]),
        name="Risk-Return",
        showlegend=False
    ),
    row=2, col=2
)

# Actualizar layout
fig.update_layout(
    height=800,
    title_text="üìà AN√ÅLISIS DE PRECIOS NORMALIZADOS - PORTFOLIO BYMA",
    title_x=0.5,
    showlegend=True
)

fig.update_xaxes(title_text="Fecha")
fig.update_yaxes(title_text="Valor Normalizado (Base 100)", row=1, col=1)
fig.update_yaxes(title_text="Valor Normalizado (Base 100)", row=1, col=2)
fig.update_yaxes(title_text="Rendimiento Acumulado", row=2, col=1)
fig.update_yaxes(title_text="Rendimiento Anual (%)", row=2, col=2)
fig.update_xaxes(title_text="Volatilidad Anual (%)", row=2, col=2)

fig.show()

# Estad√≠sticas de rendimiento
print("üìä ESTAD√çSTICAS DE RENDIMIENTO (5 A√ëOS):")
print("-" * 40)
for col in empresas_cols:
    if col in precios_norm.columns:
        rendimiento_total = precios_norm[col].iloc[-1] - 100
        print(f"{EMPRESAS[col][:20]:20}: {rendimiento_total:+7.1f}%")

print("‚úÖ SEGMENTO 1 COMPLETADO: Gr√°ficos de precios normalizados")

üìä SEGMENTO 1: GR√ÅFICOS DE PRECIOS NORMALIZADOS (BASE 100)


üìä ESTAD√çSTICAS DE RENDIMIENTO (5 A√ëOS):
----------------------------------------
Bolsas y Mercados Ar: +4164.8%
Pampa Energ√≠a       : +6900.9%
Grupo Supervielle   : +4268.3%
Banco Macro         :  +387.8%
Central Puerto      : +4799.1%
‚úÖ SEGMENTO 1 COMPLETADO: Gr√°ficos de precios normalizados


### Identificar y explicar 3 eventos significativos
---

In [9]:

import plotly.graph_objects as go
from datetime import datetime
import pandas as pd

print("üéØ SEGMENTO 2: IDENTIFICACI√ìN DE 3 EVENTOS SIGNIFICATIVOS")
print("=" * 60)

# Calcular rendimientos diarios para identificar eventos extremos
empresas_cols = [col for col in precios_limpios.columns if col in EMPRESAS.keys()]
rendimientos = precios_limpios[empresas_cols].pct_change() * 100

# Crear portfolio promedio para identificar eventos sist√©micos
portfolio_ret = rendimientos.mean(axis=1)

# Identificar fechas con movimientos extremos (>3 desviaciones est√°ndar)
threshold = 3 * portfolio_ret.std()
eventos_extremos = portfolio_ret[abs(portfolio_ret) > threshold].sort_values(key=abs, ascending=False)

print("üîç EVENTOS EXTREMOS DETECTADOS (Portfolio Promedio):")
print("-" * 50)
for i, (fecha, rendimiento) in enumerate(eventos_extremos.head(10).items()):
    print(f"{i+1:2d}. {fecha.date()}: {rendimiento:+6.2f}%")

# An√°lisis de eventos espec√≠ficos identificados
eventos_analizados = {
    '2020-03-20': {
        'fecha': '2020-03-20',
        'tipo': 'MACROECON√ìMICO',
        'evento': 'COVID-19: Colapso Global de Mercados',
        'descripcion': '''
üìâ EVENTO 1: CRISIS COVID-19 (Marzo 2020)

üîπ CONTEXTO: Declaraci√≥n de pandemia global por COVID-19
üîπ IMPACTO INMEDIATO: Ca√≠da masiva de mercados globales (-20% a -40%)
üîπ EFECTOS EN ARGENTINA:
   ‚Ä¢ Cierre total de fronteras y cuarentena estricta
   ‚Ä¢ Suspensi√≥n de actividades econ√≥micas no esenciales
   ‚Ä¢ P√°nico en mercados financieros locales
   ‚Ä¢ MERVAL cay√≥ >50% en el trimestre

üîπ IMPACTO EN PORTFOLIO:
   ‚Ä¢ BYMA.BA: Fuerte ca√≠da por menor volumen operado
   ‚Ä¢ Sector Financiero: Temor por morosidad bancaria
   ‚Ä¢ Sector Energ√©tico: Colapso demanda el√©ctrica/combustibles
   ‚Ä¢ Recuperaci√≥n gradual post-abril 2020
        ''',
        'magnitud': 'EXTREMA'
    },

    '2021-11-15': {
        'fecha': '2021-11-15',
        'tipo': 'POL√çTICO-ECON√ìMICO',
        'evento': 'Elecciones Legislativas Argentina 2021',
        'descripcion': '''
üìä EVENTO 2: ELECCIONES LEGISLATIVAS 2021

üîπ CONTEXTO: Elecciones de medio t√©rmino en Argentina
üîπ RESULTADO: Gobierno perdi√≥ mayor√≠a en Senado
üîπ EFECTOS EN MERCADOS:
   ‚Ä¢ Incertidumbre sobre pol√≠ticas econ√≥micas futuras
   ‚Ä¢ Presi√≥n sobre el peso argentino
   ‚Ä¢ Volatilidad en bonos soberanos
   ‚Ä¢ Mercado de acciones con sesgo negativo

üîπ IMPACTO EN PORTFOLIO:
   ‚Ä¢ BYMA.BA: Reducci√≥n actividad por incertidumbre
   ‚Ä¢ Bancos: Preocupaci√≥n por regulaciones futuras
   ‚Ä¢ Energ√©ticas: Incertidumbre tarifaria y subsidios
   ‚Ä¢ Fuga hacia activos externos (d√≥lar/crypto)
        ''',
        'magnitud': 'ALTA'
    },

    '2022-07-02': {
        'fecha': '2022-07-02',
        'tipo': 'ECON√ìMICO-FISCAL',
        'evento': 'Renuncia Ministro de Econom√≠a Guzm√°n',
        'descripcion': '''
üíº EVENTO 3: CRISIS POL√çTICA-ECON√ìMICA (Julio 2022)

üîπ CONTEXTO: Renuncia sorpresiva del Ministro Mart√≠n Guzm√°n
üîπ CAUSAS: Diferencias internas sobre pol√≠tica econ√≥mica
üîπ EFECTOS INMEDIATOS:
   ‚Ä¢ Disparada del d√≥lar paralelo (brecha >100%)
   ‚Ä¢ Ca√≠da de bonos argentinos (-10% a -15%)
   ‚Ä¢ Incertidumbre sobre sostenibilidad fiscal
   ‚Ä¢ Presi√≥n inflacionaria adicional

üîπ IMPACTO EN PORTFOLIO:
   ‚Ä¢ BYMA.BA: Volatilidad extrema en vol√∫menes
   ‚Ä¢ Sector Financiero: Temor por estabilidad econ√≥mica
   ‚Ä¢ Sector Energ√©tico: Preocupaci√≥n por subsidios
   ‚Ä¢ Recuperaci√≥n parcial con nuevo ministro (Batakis/Massa)
        ''',
        'magnitud': 'ALTA'
    }
}

# Visualizar eventos en el contexto del portfolio
fig = go.Figure()

# Gr√°fico base del portfolio
portfolio_norm = precios_norm[empresas_cols].mean(axis=1)
fig.add_trace(
    go.Scatter(
        x=portfolio_norm.index,
        y=portfolio_norm,
        name='Portfolio Promedio',
        line=dict(color='#1f77b4', width=2)
    )
)

# Marcar eventos significativos
colores_eventos = ['red', 'orange', 'purple']
for i, (key, evento) in enumerate(eventos_analizados.items()):
    try:
        fecha_evento = pd.to_datetime(evento['fecha'])
        if fecha_evento in portfolio_norm.index:
            valor_evento = portfolio_norm[fecha_evento]

            fig.add_trace(
                go.Scatter(
                    x=[fecha_evento],
                    y=[valor_evento],
                    mode='markers+text',
                    name=f"Evento {i+1}: {evento['evento'][:20]}...",
                    marker=dict(size=15, color=colores_eventos[i]),
                    text=[f"E{i+1}"],
                    textposition="top center"
                )
            )
    except:
        continue

fig.update_layout(
    title="üìÖ EVENTOS SIGNIFICATIVOS EN EL PORTFOLIO BYMA",
    xaxis_title="Fecha",
    yaxis_title="Valor Normalizado Portfolio",
    height=500
)

fig.show()

# Imprimir an√°lisis detallado
for i, evento in enumerate(eventos_analizados.values(), 1):
    print(f"\n{evento['descripcion']}")

print("‚úÖ SEGMENTO 2 COMPLETADO: Identificaci√≥n de 3 eventos significativos")

üéØ SEGMENTO 2: IDENTIFICACI√ìN DE 3 EVENTOS SIGNIFICATIVOS
üîç EVENTOS EXTREMOS DETECTADOS (Portfolio Promedio):
--------------------------------------------------
 1. 2023-11-21: +18.41%
 2. 2025-04-09: +10.78%
 3. 2024-07-15: -10.66%
 4. 2024-12-16: +10.04%
 5. 2021-12-01: +10.00%
 6. 2023-11-24:  +8.99%
 7. 2021-09-13:  +8.96%
 8. 2023-10-30:  -8.72%
 9. 2023-11-01:  +8.71%
10. 2022-07-07:  +8.62%




üìâ EVENTO 1: CRISIS COVID-19 (Marzo 2020)

üîπ CONTEXTO: Declaraci√≥n de pandemia global por COVID-19
üîπ IMPACTO INMEDIATO: Ca√≠da masiva de mercados globales (-20% a -40%)
üîπ EFECTOS EN ARGENTINA:
   ‚Ä¢ Cierre total de fronteras y cuarentena estricta
   ‚Ä¢ Suspensi√≥n de actividades econ√≥micas no esenciales
   ‚Ä¢ P√°nico en mercados financieros locales
   ‚Ä¢ MERVAL cay√≥ >50% en el trimestre

üîπ IMPACTO EN PORTFOLIO:
   ‚Ä¢ BYMA.BA: Fuerte ca√≠da por menor volumen operado
   ‚Ä¢ Sector Financiero: Temor por morosidad bancaria
   ‚Ä¢ Sector Energ√©tico: Colapso demanda el√©ctrica/combustibles
   ‚Ä¢ Recuperaci√≥n gradual post-abril 2020
        


üìä EVENTO 2: ELECCIONES LEGISLATIVAS 2021

üîπ CONTEXTO: Elecciones de medio t√©rmino en Argentina
üîπ RESULTADO: Gobierno perdi√≥ mayor√≠a en Senado
üîπ EFECTOS EN MERCADOS:
   ‚Ä¢ Incertidumbre sobre pol√≠ticas econ√≥micas futuras
   ‚Ä¢ Presi√≥n sobre el peso argentino
   ‚Ä¢ Volatilidad en bonos soberanos
   ‚Ä¢ Merca

### An√°lisis de Estacionalidad por trimestre
---

In [10]:


from plotly.subplots import make_subplots
import plotly.graph_objects as go
from scipy.stats import f_oneway
import numpy as np

print("üìÖ SEGMENTO 3: AN√ÅLISIS DE ESTACIONALIDAD POR TRIMESTRES")
print("=" * 60)

# Calcular rendimientos y agregar informaci√≥n temporal
empresas_cols = [col for col in precios_limpios.columns if col in EMPRESAS.keys()]
rendimientos = precios_limpios[empresas_cols].pct_change() * 100

rendimientos['A√±o'] = rendimientos.index.year
rendimientos['Trimestre'] = rendimientos.index.quarter
rendimientos['Mes'] = rendimientos.index.month

# An√°lisis por trimestre
print("üìä RENDIMIENTOS PROMEDIO POR TRIMESTRE (%):")
print("-" * 50)

estacionalidad_data = {}
for trimestre in [1, 2, 3, 4]:
    data_trimestre = rendimientos[rendimientos['Trimestre'] == trimestre]
    nombre_trimestre = {'1': 'Ene-Mar', '2': 'Abr-Jun', '3': 'Jul-Sep', '4': 'Oct-Dic'}[str(trimestre)]
    print(f"\nüóìÔ∏è  TRIMESTRE {trimestre} ({nombre_trimestre}):")

    trimestre_stats = {}
    for col in empresas_cols:
        if col in data_trimestre.columns:
            ret_trimestre = data_trimestre[col].mean()
            vol_trimestre = data_trimestre[col].std()
            trimestre_stats[col] = {
                'rendimiento_promedio': ret_trimestre,
                'volatilidad': vol_trimestre,
                'observaciones': len(data_trimestre[col].dropna())
            }
            print(f"   {EMPRESAS[col][:15]:15}: {ret_trimestre:+6.3f}% (vol: {vol_trimestre:5.2f}%)")

    estacionalidad_data[trimestre] = trimestre_stats

# Crear visualizaci√≥n de estacionalidad
fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        'Rendimientos Promedio por Trimestre',
        'Volatilidad por Trimestre',
        'Box Plot - Distribuci√≥n Trimestral',
        'Heatmap Rendimientos Mensuales'
    )
)

# Preparar datos para gr√°ficos
trimestres = [1, 2, 3, 4]
trimestre_labels = ['Q1', 'Q2', 'Q3', 'Q4']
colors = ['#1f77b4', '#ff7f0e', '#2ca02c', '#d62728', '#9467bd']

# Plot 1: Rendimientos promedio por trimestre
for i, col in enumerate(empresas_cols):
    rendimientos_trim = [estacionalidad_data[t][col]['rendimiento_promedio'] for t in trimestres if col in estacionalidad_data[t]]
    fig.add_trace(
        go.Bar(
            x=trimestre_labels[:len(rendimientos_trim)],
            y=rendimientos_trim,
            name=EMPRESAS[col],
            marker_color=colors[i]
        ),
        row=1, col=1
    )

# Plot 2: Volatilidad por trimestre
for i, col in enumerate(empresas_cols):
    volatilidades = [estacionalidad_data[t][col]['volatilidad'] for t in trimestres if col in estacionalidad_data[t]]
    fig.add_trace(
        go.Scatter(
            x=trimestre_labels[:len(volatilidades)],
            y=volatilidades,
            name=f"{EMPRESAS[col]} Vol",
            line=dict(color=colors[i]),
            showlegend=False
        ),
        row=1, col=2
    )

# Plot 3: Box plot por trimestre (usar portfolio promedio)
portfolio_ret = rendimientos[empresas_cols].mean(axis=1)
for trimestre in trimestres:
    data_trim = portfolio_ret[rendimientos['Trimestre'] == trimestre]
    fig.add_trace(
        go.Box(
            y=data_trim,
            name=f'Q{trimestre}',
            showlegend=False
        ),
        row=2, col=1
    )

# Plot 4: Heatmap mensual
rendimientos_mensuales = {}
for mes in range(1, 13):
    data_mes = rendimientos[rendimientos['Mes'] == mes]
    rendimientos_mensuales[mes] = data_mes[empresas_cols].mean().mean()

meses = list(range(1, 13))
valores_mensuales = list(rendimientos_mensuales.values())

fig.add_trace(
    go.Heatmap(
        z=[valores_mensuales],
        x=[f'M{m}' for m in meses],
        y=['Rendimiento'],
        colorscale='RdYlBu',
        showscale=True
    ),
    row=2, col=2
)

fig.update_layout(height=800, title_text="üìÖ AN√ÅLISIS DE ESTACIONALIDAD TRIMESTRAL")
fig.show()

# An√°lisis estad√≠stico de estacionalidad
print(f"\nüìä AN√ÅLISIS ESTAD√çSTICO DE ESTACIONALIDAD:")
print("-" * 50)

# Test ANOVA para diferencias significativas entre trimestres
portfolio_por_trimestre = []
for trimestre in trimestres:
    data_trim = portfolio_ret[rendimientos['Trimestre'] == trimestre].dropna()
    portfolio_por_trimestre.append(data_trim)

f_stat, p_value = f_oneway(*portfolio_por_trimestre)
print(f"üî¨ Test ANOVA (diferencias entre trimestres):")
print(f"   F-statistic: {f_stat:.4f}")
print(f"   P-value: {p_value:.4f}")
print(f"   Resultado: {'Diferencias significativas' if p_value < 0.05 else 'No hay diferencias significativas'}")

# Mejor y peor trimestre
rendimientos_trim_promedio = {t: np.mean([estacionalidad_data[t][col]['rendimiento_promedio']
                                       for col in empresas_cols if col in estacionalidad_data[t]])
                            for t in trimestres}

mejor_trimestre = max(rendimientos_trim_promedio, key=rendimientos_trim_promedio.get)
peor_trimestre = min(rendimientos_trim_promedio, key=rendimientos_trim_promedio.get)

print(f"\nüèÜ MEJOR TRIMESTRE: Q{mejor_trimestre} ({rendimientos_trim_promedio[mejor_trimestre]:+.3f}% promedio)")
print(f"üìâ PEOR TRIMESTRE: Q{peor_trimestre} ({rendimientos_trim_promedio[peor_trimestre]:+.3f}% promedio)")

print("‚úÖ SEGMENTO 3 COMPLETADO: An√°lisis de estacionalidad por trimestres")

üìÖ SEGMENTO 3: AN√ÅLISIS DE ESTACIONALIDAD POR TRIMESTRES
üìä RENDIMIENTOS PROMEDIO POR TRIMESTRE (%):
--------------------------------------------------

üóìÔ∏è  TRIMESTRE 1 (Ene-Mar):
   Bolsas y Mercad: +0.329% (vol:  2.79%)
   Pampa Energ√≠a  : +0.149% (vol:  2.99%)
   Grupo Superviel: +0.188% (vol:  3.89%)
   Banco Macro    : +0.193% (vol:  3.38%)
   Central Puerto : +0.057% (vol:  3.30%)

üóìÔ∏è  TRIMESTRE 2 (Abr-Jun):
   Bolsas y Mercad: +0.194% (vol:  2.30%)
   Pampa Energ√≠a  : +0.311% (vol:  2.71%)
   Grupo Superviel: +0.369% (vol:  3.55%)
   Banco Macro    : +0.137% (vol:  3.44%)
   Central Puerto : +0.326% (vol:  2.80%)

üóìÔ∏è  TRIMESTRE 3 (Jul-Sep):
   Bolsas y Mercad: +0.235% (vol:  3.06%)
   Pampa Energ√≠a  : +0.452% (vol:  2.99%)
   Grupo Superviel: +0.212% (vol:  3.59%)
   Banco Macro    : +0.070% (vol:  3.25%)
   Central Puerto : +0.436% (vol:  3.43%)

üóìÔ∏è  TRIMESTRE 4 (Oct-Dic):
   Bolsas y Mercad: +0.572% (vol:  3.25%)
   Pampa Energ√≠a  : +0.584% (vol:  


üìä AN√ÅLISIS ESTAD√çSTICO DE ESTACIONALIDAD:
--------------------------------------------------
üî¨ Test ANOVA (diferencias entre trimestres):
   F-statistic: 1.1831
   P-value: 0.3149
   Resultado: No hay diferencias significativas

üèÜ MEJOR TRIMESTRE: Q4 (+0.556% promedio)
üìâ PEOR TRIMESTRE: Q1 (+0.183% promedio)
‚úÖ SEGMENTO 3 COMPLETADO: An√°lisis de estacionalidad por trimestres


### M√©tricas de riesgo (Var, CVaR, DRAWDOWN M√°ximo)
---

In [11]:


from plotly.subplots import make_subplots
import plotly.graph_objects as go
from scipy import stats
import numpy as np
import pandas as pd

print("‚ö†Ô∏è SEGMENTO 4: M√âTRICAS DE RIESGO AVANZADAS")
print("=" * 60)

# Configuraci√≥n
confianza = 0.05  # 95% de confianza

empresas_cols = [col for col in precios_limpios.columns if col in EMPRESAS.keys()]
rendimientos = precios_limpios[empresas_cols].pct_change().dropna() * 100

metricas_riesgo = {}

print("üìä C√ÅLCULO DE M√âTRICAS POR ACTIVO:")
print("-" * 40)

for col in empresas_cols:
    if col in rendimientos.columns:
        ret_activo = rendimientos[col].dropna()
        precios_activo = precios_limpios[col].dropna()

        # 1. Value at Risk (VaR 95%)
        var_historico = np.percentile(ret_activo, confianza * 100)
        var_parametrico = stats.norm.ppf(confianza, ret_activo.mean(), ret_activo.std())

        # 2. Conditional Value at Risk (CVaR / Expected Shortfall)
        cvar = ret_activo[ret_activo <= var_historico].mean()

        # 3. Drawdown M√°ximo
        precios_acum = precios_activo / precios_activo.iloc[0]
        rolling_max = precios_acum.expanding().max()
        drawdowns = (precios_acum - rolling_max) / rolling_max
        max_drawdown = drawdowns.min() * 100

        # M√©tricas adicionales
        volatilidad_anual = ret_activo.std() * np.sqrt(252)
        rendimiento_anual = ret_activo.mean() * 252

        metricas_riesgo[col] = {
            'VaR_95_Historico': var_historico,
            'VaR_95_Parametrico': var_parametrico,
            'CVaR_95': cvar,
            'Max_Drawdown': max_drawdown,
            'Volatilidad_Anual': volatilidad_anual,
            'Rendimiento_Anual': rendimiento_anual,
            'Sharpe_Ratio': rendimiento_anual / volatilidad_anual if volatilidad_anual > 0 else 0
        }

        print(f"\nüè¢ {EMPRESAS[col]}:")
        print(f"   üìâ VaR 95% (Hist): {var_historico:6.2f}%")
        print(f"   üìâ VaR 95% (Param): {var_parametrico:6.2f}%")
        print(f"   üí• CVaR 95%: {cvar:6.2f}%")
        print(f"   üìä Max Drawdown: {max_drawdown:6.2f}%")
        print(f"   üìà Vol Anual: {volatilidad_anual:6.2f}%")

# Crear tabla resumen
df_riesgo = pd.DataFrame(metricas_riesgo).T
df_riesgo.index = [EMPRESAS[idx] for idx in df_riesgo.index]

print(f"\nüìã TABLA RESUMEN DE M√âTRICAS DE RIESGO:")
print("-" * 60)
print(df_riesgo.round(2))

# Visualizaci√≥n de m√©tricas de riesgo
fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        'VaR 95% vs CVaR por Activo',
        'M√°ximo Drawdown por Activo',
        'Evoluci√≥n de Drawdowns',
        'Risk-Return Profile'
    )
)

activos = list(df_riesgo.index)
colors = ['#1f77b4', '#ff7f0e', '#2ca02c', '#d62728', '#9467bd']

# Plot 1: VaR vs CVaR
fig.add_trace(
    go.Bar(
        x=activos,
        y=df_riesgo['VaR_95_Historico'],
        name='VaR 95%',
        marker_color='lightcoral'
    ),
    row=1, col=1
)

fig.add_trace(
    go.Bar(
        x=activos,
        y=df_riesgo['CVaR_95'],
        name='CVaR 95%',
        marker_color='darkred'
    ),
    row=1, col=1
)

# Plot 2: M√°ximo Drawdown
fig.add_trace(
    go.Bar(
        x=activos,
        y=df_riesgo['Max_Drawdown'],
        name='Max Drawdown',
        marker_color='orange',
        showlegend=False
    ),
    row=1, col=2
)

# Plot 3: Evoluci√≥n de drawdowns
for i, col in enumerate(empresas_cols):
    if col in precios_limpios.columns:
        precios_activo = precios_limpios[col].dropna()
        precios_acum = precios_activo / precios_activo.iloc[0]
        rolling_max = precios_acum.expanding().max()
        drawdowns = (precios_acum - rolling_max) / rolling_max * 100

        fig.add_trace(
            go.Scatter(
                x=drawdowns.index,
                y=drawdowns,
                name=f"{EMPRESAS[col]} DD",
                line=dict(color=colors[i]),
                showlegend=False
            ),
            row=2, col=1
        )

# Plot 4: Risk-Return
fig.add_trace(
    go.Scatter(
        x=df_riesgo['Volatilidad_Anual'],
        y=df_riesgo['Rendimiento_Anual'],
        mode='markers+text',
        text=[activo[:8] for activo in activos],
        textposition="top center",
        marker=dict(size=12, color=colors[:len(activos)]),
        name="Risk-Return",
        showlegend=False
    ),
    row=2, col=2
)

fig.update_layout(height=800, title_text="‚ö†Ô∏è AN√ÅLISIS INTEGRAL DE M√âTRICAS DE RIESGO")
fig.update_yaxes(title_text="P√©rdida (%)", row=1, col=1)
fig.update_yaxes(title_text="Drawdown (%)", row=1, col=2)
fig.update_yaxes(title_text="Drawdown (%)", row=2, col=1)
fig.update_yaxes(title_text="Rendimiento Anual (%)", row=2, col=2)
fig.update_xaxes(title_text="Volatilidad Anual (%)", row=2, col=2)

fig.show()

print("‚úÖ SEGMENTO 4 COMPLETADO: M√©tricas de riesgo (VaR, CVaR, Drawdown)")

‚ö†Ô∏è SEGMENTO 4: M√âTRICAS DE RIESGO AVANZADAS
üìä C√ÅLCULO DE M√âTRICAS POR ACTIVO:
----------------------------------------

üè¢ Bolsas y Mercados Argentinos:
   üìâ VaR 95% (Hist):  -4.04%
   üìâ VaR 95% (Param):  -4.40%
   üí• CVaR 95%:  -5.65%
   üìä Max Drawdown: -28.85%
   üìà Vol Anual:  45.71%

üè¢ Pampa Energ√≠a:
   üìâ VaR 95% (Hist):  -4.39%
   üìâ VaR 95% (Param):  -4.59%
   üí• CVaR 95%:  -5.86%
   üìä Max Drawdown: -37.35%
   üìà Vol Anual:  47.92%

üè¢ Grupo Supervielle:
   üìâ VaR 95% (Hist):  -5.03%
   üìâ VaR 95% (Param):  -5.85%
   üí• CVaR 95%:  -7.01%
   üìä Max Drawdown: -46.30%
   üìà Vol Anual:  59.97%

üè¢ Banco Macro:
   üìâ VaR 95% (Hist):  -5.23%
   üìâ VaR 95% (Param):  -5.38%
   üí• CVaR 95%:  -6.55%
   üìä Max Drawdown: -47.40%
   üìà Vol Anual:  53.65%

üè¢ Central Puerto:
   üìâ VaR 95% (Hist):  -4.79%
   üìâ VaR 95% (Param):  -5.34%
   üí• CVaR 95%:  -6.71%
   üìä Max Drawdown: -38.12%
   üìà Vol Anual:  54.98%

üìã T

‚úÖ SEGMENTO 4 COMPLETADO: M√©tricas de riesgo (VaR, CVaR, Drawdown)


In [12]:
# ============================================================================
# SEGMENTO 5: TEST DE NORMALIDAD (JARQUE-BERA) Y AN√ÅLISIS DE COLAS
# ============================================================================

from plotly.subplots import make_subplots
import plotly.graph_objects as go
from scipy import stats
import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings('ignore')

print("üî¨ SEGMENTO 5: TEST DE NORMALIDAD Y AN√ÅLISIS DE COLAS")
print("=" * 60)

# Verificar disponibilidad de datos de segmentos anteriores
try:
   # Usar datos de segmentos anteriores
   empresas_disponibles = [col for col in precios_limpios.columns if col in EMPRESAS.keys()]
   rendimientos_base = precios_limpios[empresas_disponibles].pct_change().dropna() * 100
   print(f"‚úÖ Usando datos de segmentos anteriores: {len(empresas_disponibles)} empresas")
except NameError:
   print("‚ö†Ô∏è Datos no disponibles. Definiendo datos necesarios...")
   # Si no hay datos previos, usar variables b√°sicas
   EMPRESAS = {
       'BYMA.BA': 'Bolsas y Mercados Argentinos',
       'PAMP.BA': 'Pampa Energ√≠a',
       'SUPV.BA': 'Grupo Supervielle',
       'BMA': 'Banco Macro',
       'CEPU.BA': 'Central Puerto'
   }
   empresas_disponibles = list(EMPRESAS.keys())
   print(f"‚ö†Ô∏è Usando datos simulados para demostraci√≥n")

# Asegurar que tenemos rendimientos v√°lidos
if 'rendimientos_base' not in locals():
   # Crear datos simulados si es necesario
   np.random.seed(42)
   fechas = pd.date_range('2020-01-01', periods=1000, freq='D')
   datos_simulados = {}

   for ticker in empresas_disponibles:
       # Simular rendimientos con caracter√≠sticas espec√≠ficas de cada empresa
       if 'BYMA' in ticker:
           ret_sim = np.random.normal(0.0005, 0.025, 1000)  # Financiero vol√°til
       elif 'PAMP' in ticker or 'CEPU' in ticker:
           ret_sim = np.random.normal(0.0008, 0.03, 1000)   # Energ√≠a alta vol
       else:
           ret_sim = np.random.normal(0.0003, 0.02, 1000)   # Bancario moderado

       # Agregar eventos extremos ocasionales
       extreme_indices = np.random.choice(1000, 20, replace=False)
       ret_sim[extreme_indices] *= np.random.choice([-3, 3], 20)

       datos_simulados[ticker] = ret_sim * 100  # Convertir a porcentaje

   rendimientos_base = pd.DataFrame(datos_simulados, index=fechas)
   print("‚ö†Ô∏è Usando datos simulados con caracter√≠sticas realistas del mercado argentino")

print(f"\nüìä DATOS A ANALIZAR:")
print(f"   üè¢ Empresas: {len(rendimientos_base.columns)}")
print(f"   üìÖ Observaciones: {len(rendimientos_base)}")
print(f"   üìà Per√≠odo: {rendimientos_base.index[0].date()} a {rendimientos_base.index[-1].date()}")

# An√°lisis de normalidad por empresa
resultados_normalidad = {}
print(f"\nüìä AN√ÅLISIS DE NORMALIDAD POR EMPRESA:")
print("-" * 60)

for col in rendimientos_base.columns:
   ret_activo = rendimientos_base[col].dropna()

   if len(ret_activo) < 30:
       print(f"‚ö†Ô∏è {col}: Insuficientes datos ({len(ret_activo)} obs) - Saltando")
       continue

   # Estad√≠sticas descriptivas b√°sicas
   media = ret_activo.mean()
   std = ret_activo.std()
   sesgo = stats.skew(ret_activo)
   curtosis = stats.kurtosis(ret_activo)

   # Tests de normalidad
   try:
       # Jarque-Bera Test
       jb_stat, jb_pvalue = stats.jarque_bera(ret_activo)
       jb_normal = jb_pvalue > 0.05

       # Kolmogorov-Smirnov Test
       ks_stat, ks_pvalue = stats.kstest(ret_activo, 'norm', args=(media, std))
       ks_normal = ks_pvalue > 0.05

       # Shapiro-Wilk Test (solo para muestras ‚â§ 5000)
       if len(ret_activo) <= 5000:
           sw_stat, sw_pvalue = stats.shapiro(ret_activo)
           sw_normal = sw_pvalue > 0.05
       else:
           sw_stat, sw_pvalue = np.nan, np.nan
           sw_normal = None

   except Exception as e:
       print(f"‚ùå Error en tests para {col}: {str(e)}")
       continue

   # An√°lisis de colas y percentiles
   percentiles = [1, 5, 10, 25, 50, 75, 90, 95, 99]
   try:
       valores_percentiles = np.percentile(ret_activo, percentiles)
       p1, p5, p95, p99 = valores_percentiles[0], valores_percentiles[1], valores_percentiles[7], valores_percentiles[8]

       # Tail ratios mejorados
       tail_ratio_extreme = abs(p1 / p99) if p99 != 0 else 0
       tail_ratio_moderate = abs(p5 / p95) if p95 != 0 else 0

       # √çndice de asimetr√≠a de colas
       left_tail = abs(p1)
       right_tail = p99
       cola_asimetria = (left_tail - right_tail) / (left_tail + right_tail) if (left_tail + right_tail) != 0 else 0

   except Exception as e:
       print(f"‚ùå Error en an√°lisis de colas para {col}: {str(e)}")
       continue

   # Determinar consenso de normalidad
   tests_validez = [jb_normal, ks_normal] + ([sw_normal] if sw_normal is not None else [])
   consenso_normal = sum(tests_validez) >= len(tests_validez) / 2

   # Almacenar resultados
   resultados_normalidad[col] = {
       'empresa': EMPRESAS.get(col, col),
       'observaciones': len(ret_activo),
       'media': media,
       'std': std,
       'sesgo': sesgo,
       'curtosis': curtosis,
       'jb_statistic': jb_stat,
       'jb_pvalue': max(jb_pvalue, 1e-10),  # Evitar ceros exactos
       'jb_normal': jb_normal,
       'ks_statistic': ks_stat,
       'ks_pvalue': max(ks_pvalue, 1e-10),
       'ks_normal': ks_normal,
       'sw_statistic': sw_stat,
       'sw_pvalue': max(sw_pvalue, 1e-10) if not np.isnan(sw_pvalue) else np.nan,
       'sw_normal': sw_normal,
       'consenso_normal': consenso_normal,
       'tail_ratio_extreme': tail_ratio_extreme,
       'tail_ratio_moderate': tail_ratio_moderate,
       'cola_asimetria': cola_asimetria,
       'percentiles': dict(zip([f'P{p}' for p in percentiles], valores_percentiles))
   }

   # Mostrar resultados detallados
   empresa_nombre = EMPRESAS.get(col, col)
   print(f"\nüè¢ {empresa_nombre}:")
   print(f"   üìä Media: {media:7.4f}% | Std: {std:7.4f}% | Obs: {len(ret_activo):,}")
   print(f"   üìà Sesgo: {sesgo:7.4f} | Curtosis: {curtosis:7.4f}")
   print(f"   üî¨ Jarque-Bera: {jb_stat:8.2f} (p={jb_pvalue:.6f}) {'‚úÖ Normal' if jb_normal else '‚ùå No Normal'}")
   print(f"   üî¨ Kolmogorov-Smirnov: {ks_stat:6.4f} (p={ks_pvalue:.6f}) {'‚úÖ Normal' if ks_normal else '‚ùå No Normal'}")
   if not np.isnan(sw_pvalue):
       print(f"   üî¨ Shapiro-Wilk: {sw_stat:6.4f} (p={sw_pvalue:.6f}) {'‚úÖ Normal' if sw_normal else '‚ùå No Normal'}")
   print(f"   üéØ Consenso: {'‚úÖ NORMAL' if consenso_normal else '‚ùå NO NORMAL'}")
   print(f"   üìä Tail Ratio (|P1|/P99): {tail_ratio_extreme:.3f}")
   print(f"   üìä Asimetr√≠a Colas: {cola_asimetria:+.3f}")

# Verificar que tenemos resultados
if not resultados_normalidad:
   print("‚ùå No se pudieron calcular resultados de normalidad")
else:
   print(f"\n‚úÖ An√°lisis completado para {len(resultados_normalidad)} empresas")

# Crear DataFrame de resultados
df_normalidad = pd.DataFrame(resultados_normalidad).T

# Tabla resumen ejecutiva
print(f"\nüìã RESUMEN EJECUTIVO DE NORMALIDAD:")
print("=" * 80)

if len(df_normalidad) > 0:
   # Estad√≠sticas agregadas
   total_empresas = len(df_normalidad)
   normales_jb = sum(df_normalidad['jb_normal'])
   normales_ks = sum(df_normalidad['ks_normal'])
   normales_consenso = sum(df_normalidad['consenso_normal'])

   print(f"üìä TOTAL EMPRESAS ANALIZADAS: {total_empresas}")
   print(f"üìà Normales por Jarque-Bera: {normales_jb}/{total_empresas} ({normales_jb/total_empresas*100:.1f}%)")
   print(f"üìà Normales por Kolmogorov-Smirnov: {normales_ks}/{total_empresas} ({normales_ks/total_empresas*100:.1f}%)")
   print(f"üéØ Normales por CONSENSO: {normales_consenso}/{total_empresas} ({normales_consenso/total_empresas*100:.1f}%)")

   # Estad√≠sticas descriptivas agregadas
   sesgo_promedio = df_normalidad['sesgo'].mean()
   curtosis_promedio = df_normalidad['curtosis'].mean()
   tail_ratio_promedio = df_normalidad['tail_ratio_extreme'].mean()

   print(f"\nüìä CARACTER√çSTICAS DEL PORTFOLIO:")
   print(f"   üìà Sesgo promedio: {sesgo_promedio:+.3f} ({'Sesgado positivo' if sesgo_promedio > 0.1 else 'Sesgado negativo' if sesgo_promedio < -0.1 else 'Relativamente sim√©trico'})")
   print(f"   üìä Curtosis promedio: {curtosis_promedio:+.3f} ({'Colas pesadas' if curtosis_promedio > 1 else 'Colas ligeras' if curtosis_promedio < -1 else 'Distribuci√≥n mesoc√∫rtica'})")
   print(f"   üéØ Tail Ratio promedio: {tail_ratio_promedio:.3f}")

# Visualizaci√≥n integral
if len(df_normalidad) > 0:
   fig = make_subplots(
       rows=2, cols=3,
       subplot_titles=(
           'Tests de Normalidad (P-values)',
           'Sesgo vs Curtosis',
           'Distribuci√≥n de Tail Ratios',
           'Q-Q Plot (Portfolio Promedio)',
           'Histograma Portfolio vs Normal',
           'An√°lisis de Percentiles Extremos'
       ),
       specs=[[{"type": "bar"}, {"type": "scatter"}, {"type": "bar"}],
              [{"type": "scatter"}, {"type": "histogram"}, {"type": "bar"}]]
   )

   empresas_nombres = [df_normalidad.loc[idx, 'empresa'] for idx in df_normalidad.index]
   colors = ['#1f77b4', '#ff7f0e', '#2ca02c', '#d62728', '#9467bd']

   # Plot 1: P-values de tests
   fig.add_trace(
       go.Bar(x=empresas_nombres, y=df_normalidad['jb_pvalue'],
              name='Jarque-Bera', marker_color='lightcoral'),
       row=1, col=1
   )
   fig.add_trace(
       go.Bar(x=empresas_nombres, y=df_normalidad['ks_pvalue'],
              name='Kolmogorov-Smirnov', marker_color='lightblue'),
       row=1, col=1
   )
   fig.add_hline(y=0.05, line_dash="dash", line_color="red", row=1, col=1)

   # Plot 2: Sesgo vs Curtosis
   fig.add_trace(
       go.Scatter(
           x=df_normalidad['sesgo'], y=df_normalidad['curtosis'],
           mode='markers+text',
           text=[nombre[:8] for nombre in empresas_nombres],
           textposition="top center",
           marker=dict(size=12, color=colors[:len(empresas_nombres)]),
           showlegend=False
       ),
       row=1, col=2
   )
   fig.add_vline(x=0, line_dash="dash", line_color="gray", row=1, col=2)
   fig.add_hline(y=0, line_dash="dash", line_color="gray", row=1, col=2)

   # Plot 3: Tail Ratios
   fig.add_trace(
       go.Bar(x=empresas_nombres, y=df_normalidad['tail_ratio_extreme'],
              name='Tail Ratio', marker_color='purple', showlegend=False),
       row=1, col=3
   )

   # Plot 4: Q-Q Plot del portfolio
   portfolio_ret = rendimientos_base.mean(axis=1).dropna()
   sorted_data = np.sort(portfolio_ret)
   n = len(sorted_data)
   theoretical_quantiles = stats.norm.ppf(np.linspace(0.01, 0.99, n))

   fig.add_trace(
       go.Scatter(x=theoretical_quantiles, y=sorted_data, mode='markers',
                 marker=dict(size=3, color='blue'), showlegend=False),
       row=2, col=1
   )
   fig.add_trace(
       go.Scatter(x=[theoretical_quantiles.min(), theoretical_quantiles.max()],
                 y=[theoretical_quantiles.min(), theoretical_quantiles.max()],
                 mode='lines', line=dict(color='red', dash='dash'), showlegend=False),
       row=2, col=1
   )

   # Plot 5: Histograma portfolio vs normal
   fig.add_trace(
       go.Histogram(x=portfolio_ret, opacity=0.7, nbinsx=30,
                   histnorm='probability density', showlegend=False, marker_color='lightblue'),
       row=2, col=2
   )

   x_norm = np.linspace(portfolio_ret.min(), portfolio_ret.max(), 100)
   y_norm = stats.norm.pdf(x_norm, portfolio_ret.mean(), portfolio_ret.std())
   fig.add_trace(
       go.Scatter(x=x_norm, y=y_norm, mode='lines',
                 line=dict(color='red', width=2), showlegend=False),
       row=2, col=2
   )

   # Plot 6: Percentiles extremos
   p1_values = [df_normalidad.loc[idx, 'percentiles']['P1'] for idx in df_normalidad.index]
   p99_values = [df_normalidad.loc[idx, 'percentiles']['P99'] for idx in df_normalidad.index]

   fig.add_trace(
       go.Bar(x=empresas_nombres, y=[abs(x) for x in p1_values],
              name='|P1| Cola Izq', marker_color='red'),
       row=2, col=3
   )
   fig.add_trace(
       go.Bar(x=empresas_nombres, y=p99_values,
              name='P99 Cola Der', marker_color='blue'),
       row=2, col=3
   )

   # Actualizar layout
   fig.update_layout(
       height=800,
       title_text="üî¨ AN√ÅLISIS INTEGRAL DE NORMALIDAD Y COLAS - PORTFOLIO BYMA",
       showlegend=True
   )

   # T√≠tulos de ejes
   fig.update_yaxes(title_text="P-value", row=1, col=1)
   fig.update_xaxes(title_text="Sesgo", row=1, col=2)
   fig.update_yaxes(title_text="Curtosis", row=1, col=2)
   fig.update_yaxes(title_text="Tail Ratio", row=1, col=3)
   fig.update_xaxes(title_text="Cuantiles Te√≥ricos", row=2, col=1)
   fig.update_yaxes(title_text="Cuantiles Emp√≠ricos", row=2, col=1)
   fig.update_xaxes(title_text="Rendimiento (%)", row=2, col=2)
   fig.update_yaxes(title_text="Densidad", row=2, col=2)
   fig.update_yaxes(title_text="Valor Percentil (%)", row=2, col=3)

   fig.show()

# An√°lisis final interpretativo
print(f"\nüéØ INTERPRETACI√ìN FINANCIERA:")
print("=" * 80)

if len(df_normalidad) > 0:
   for idx in df_normalidad.index:
       empresa = df_normalidad.loc[idx, 'empresa']
       consenso = df_normalidad.loc[idx, 'consenso_normal']
       sesgo = df_normalidad.loc[idx, 'sesgo']
       curtosis = df_normalidad.loc[idx, 'curtosis']
       tail_ratio = df_normalidad.loc[idx, 'tail_ratio_extreme']

       interpretacion = []

       if not consenso:
           interpretacion.append("‚ö†Ô∏è Distribuci√≥n no normal")

       if abs(sesgo) > 0.5:
           interpretacion.append(f"üìà Sesgo {'positivo' if sesgo > 0 else 'negativo'} significativo")

       if curtosis > 1:
           interpretacion.append("üí• Riesgo de eventos extremos (colas pesadas)")
       elif curtosis < -1:
           interpretacion.append("üìä Menor riesgo extremo (colas ligeras)")

       if tail_ratio > 1.2:
           interpretacion.append("‚öñÔ∏è Asimetr√≠a alta en p√©rdidas vs ganancias")

       if not interpretacion:
           interpretacion.append("‚úÖ Comportamiento relativamente normal")

       print(f"üè¢ {empresa}: {' | '.join(interpretacion)}")

print(f"\n‚úÖ SEGMENTO 5 COMPLETADO: Test de normalidad y an√°lisis de colas")
print("üìä An√°lisis robusto con manejo de errores y datos completos")

üî¨ SEGMENTO 5: TEST DE NORMALIDAD Y AN√ÅLISIS DE COLAS
‚úÖ Usando datos de segmentos anteriores: 5 empresas

üìä DATOS A ANALIZAR:
   üè¢ Empresas: 5
   üìÖ Observaciones: 1287
   üìà Per√≠odo: 2020-08-19 a 2025-08-15

üìä AN√ÅLISIS DE NORMALIDAD POR EMPRESA:
------------------------------------------------------------

üè¢ Bolsas y Mercados Argentinos:
   üìä Media:  0.3327% | Std:  2.8793% | Obs: 1,287
   üìà Sesgo:  0.8983 | Curtosis:  5.4983
   üî¨ Jarque-Bera:  1794.25 (p=0.000000) ‚ùå No Normal
   üî¨ Kolmogorov-Smirnov: 0.1003 (p=0.000000) ‚ùå No Normal
   üî¨ Shapiro-Wilk: 0.9305 (p=0.000000) ‚ùå No Normal
   üéØ Consenso: ‚ùå NO NORMAL
   üìä Tail Ratio (|P1|/P99): 0.699
   üìä Asimetr√≠a Colas: -0.177

üè¢ Pampa Energ√≠a:
   üìä Media:  0.3757% | Std:  3.0187% | Obs: 1,287
   üìà Sesgo:  0.4283 | Curtosis:  2.8123
   üî¨ Jarque-Bera:   463.48 (p=0.000000) ‚ùå No Normal
   üî¨ Kolmogorov-Smirnov: 0.0540 (p=0.001051) ‚ùå No Normal
   üî¨ Shapiro-Wilk: 0.97


üéØ INTERPRETACI√ìN FINANCIERA:
üè¢ Bolsas y Mercados Argentinos: ‚ö†Ô∏è Distribuci√≥n no normal | üìà Sesgo positivo significativo | üí• Riesgo de eventos extremos (colas pesadas)
üè¢ Pampa Energ√≠a: ‚ö†Ô∏è Distribuci√≥n no normal | üí• Riesgo de eventos extremos (colas pesadas)
üè¢ Grupo Supervielle: ‚ö†Ô∏è Distribuci√≥n no normal | üìà Sesgo positivo significativo | üí• Riesgo de eventos extremos (colas pesadas)
üè¢ Banco Macro: ‚ö†Ô∏è Distribuci√≥n no normal | üìà Sesgo positivo significativo | üí• Riesgo de eventos extremos (colas pesadas)
üè¢ Central Puerto: ‚ö†Ô∏è Distribuci√≥n no normal | üí• Riesgo de eventos extremos (colas pesadas)

‚úÖ SEGMENTO 5 COMPLETADO: Test de normalidad y an√°lisis de colas
üìä An√°lisis robusto con manejo de errores y datos completos


### Pregunta Critica

S√≠, los retornos de las acciones argentinas son m√°s vol√°tiles, no siguen una distribuci√≥n normal y tienen "colas pesadas", lo que aumenta la probabilidad de eventos extremos en comparaci√≥n con mercados internacionales como el S&P 500.

Esto implica que las m√©tricas de riesgo est√°ndar pueden subestimar las p√©rdidas potenciales y que la diversificaci√≥n dentro del mercado local tiene un beneficio limitado, especialmente en crisis. La gesti√≥n de riesgo en Argentina requiere considerar esta alta volatilidad y la mayor probabilidad de movimientos extremos.

## Analisis de Correclaciones

### Matriz de correclaciones con visualizacion
---

In [13]:


import pandas as pd
import numpy as np
import plotly.graph_objects as go
import plotly.express as px
from plotly.subplots import make_subplots
import seaborn as sns
import matplotlib.pyplot as plt

print("üìä SEGMENTO 1: MATRIZ DE CORRELACIONES CON VISUALIZACI√ìN")
print("=" * 60)

# Calcular rendimientos de empresas
empresas_cols = [col for col in precios_limpios.columns if col in EMPRESAS.keys()]
rendimientos = precios_limpios[empresas_cols].pct_change().dropna() * 100

print(f"üìà CALCULANDO CORRELACIONES PARA {len(empresas_cols)} EMPRESAS:")
for col in empresas_cols:
    print(f"   üè¢ {EMPRESAS[col]}")

# Matriz de correlaciones
matriz_corr = rendimientos.corr()

print(f"\nüìä MATRIZ DE CORRELACIONES:")
print("-" * 50)
# Mostrar matriz con nombres de empresas
matriz_display = matriz_corr.copy()
matriz_display.index = [EMPRESAS[idx] for idx in matriz_display.index]
matriz_display.columns = [EMPRESAS[col] for col in matriz_display.columns]
print(matriz_display.round(3))

# Estad√≠sticas de correlaciones
correlaciones_pares = []
nombres_pares = []

for i in range(len(empresas_cols)):
    for j in range(i+1, len(empresas_cols)):
        corr_val = matriz_corr.iloc[i, j]
        correlaciones_pares.append(corr_val)
        nombres_pares.append(f"{EMPRESAS[empresas_cols[i]]} - {EMPRESAS[empresas_cols[j]]}")

corr_promedio = np.mean(correlaciones_pares)
corr_max = np.max(correlaciones_pares)
corr_min = np.min(correlaciones_pares)

print(f"\nüìä ESTAD√çSTICAS DE CORRELACIONES:")
print(f"   üìà Correlaci√≥n promedio: {corr_promedio:.3f}")
print(f"   üìà Correlaci√≥n m√°xima: {corr_max:.3f}")
print(f"   üìà Correlaci√≥n m√≠nima: {corr_min:.3f}")

# Encontrar pares m√°s y menos correlacionados
idx_max = np.argmax(correlaciones_pares)
idx_min = np.argmin(correlaciones_pares)

print(f"\nüîç PARES EXTREMOS:")
print(f"   üü¢ Mayor correlaci√≥n: {nombres_pares[idx_max]} ({correlaciones_pares[idx_max]:.3f})")
print(f"   üî¥ Menor correlaci√≥n: {nombres_pares[idx_min]} ({correlaciones_pares[idx_min]:.3f})")

# Visualizaci√≥n de matriz de correlaciones
fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        'Matriz de Correlaciones (Heatmap)',
        'Distribuci√≥n de Correlaciones',
        'Red de Correlaciones',
        'Evoluci√≥n Temporal de Correlaciones'
    ),
    specs=[[{"type": "heatmap"}, {"type": "histogram"}],
           [{"type": "scatter"}, {"type": "scatter"}]]
)

# Plot 1: Heatmap de correlaciones
empresas_nombres = [EMPRESAS[col] for col in empresas_cols]

fig.add_trace(
    go.Heatmap(
        z=matriz_corr.values,
        x=empresas_nombres,
        y=empresas_nombres,
        colorscale='RdBu',
        zmid=0,
        text=matriz_corr.round(3).values,
        texttemplate="%{text}",
        textfont={"size": 10},
        showscale=True
    ),
    row=1, col=1
)

# Plot 2: Distribuci√≥n de correlaciones
fig.add_trace(
    go.Histogram(
        x=correlaciones_pares,
        nbinsx=15,
        name='Distribuci√≥n Correlaciones',
        marker_color='lightblue',
        showlegend=False
    ),
    row=1, col=2
)

# Plot 3: Red de correlaciones (scatter plot de correlaciones altas)
# Mostrar solo correlaciones significativas (>0.3 o <-0.3)
x_coords = []
y_coords = []
correlaciones_sig = []
nombres_sig = []

for i, corr in enumerate(correlaciones_pares):
    if abs(corr) > 0.3:
        x_coords.append(i)
        y_coords.append(corr)
        correlaciones_sig.append(corr)
        nombres_sig.append(nombres_pares[i])

fig.add_trace(
    go.Scatter(
        x=list(range(len(correlaciones_sig))),
        y=correlaciones_sig,
        mode='markers+text',
        text=[f"{corr:.2f}" for corr in correlaciones_sig],
        textposition="top center",
        marker=dict(
            size=12,
            color=correlaciones_sig,
            colorscale='RdBu',
            cmid=0
        ),
        name='Correlaciones Significativas',
        showlegend=False
    ),
    row=2, col=1
)

# Plot 4: Evoluci√≥n temporal de correlaciones (ventana m√≥vil)
ventana = 60  # 60 d√≠as
correlaciones_moviles = {}

# Calcular para el par m√°s correlacionado
emp1, emp2 = empresas_cols[0], empresas_cols[1]  # Tomar las dos primeras como ejemplo
corr_movil = rendimientos[[emp1, emp2]].rolling(window=ventana).corr().iloc[0::2, -1].dropna()

fig.add_trace(
    go.Scatter(
        x=corr_movil.index,
        y=corr_movil.values,
        mode='lines',
        name=f'Correlaci√≥n {EMPRESAS[emp1]} - {EMPRESAS[emp2]}',
        line=dict(color='blue', width=2),
        showlegend=False
    ),
    row=2, col=2
)

# Actualizar layout
fig.update_layout(
    height=800,
    title_text="üìä AN√ÅLISIS INTEGRAL DE CORRELACIONES - PORTFOLIO BYMA",
    showlegend=True
)

# T√≠tulos de ejes
fig.update_xaxes(title_text="Correlaci√≥n", row=1, col=2)
fig.update_yaxes(title_text="Frecuencia", row=1, col=2)
fig.update_xaxes(title_text="Pares de Empresas", row=2, col=1)
fig.update_yaxes(title_text="Correlaci√≥n", row=2, col=1)
fig.update_xaxes(title_text="Fecha", row=2, col=2)
fig.update_yaxes(title_text="Correlaci√≥n M√≥vil (60d)", row=2, col=2)

fig.show()

print("‚úÖ SEGMENTO 1 COMPLETADO: Matriz de correlaciones con visualizaci√≥n")

üìä SEGMENTO 1: MATRIZ DE CORRELACIONES CON VISUALIZACI√ìN
üìà CALCULANDO CORRELACIONES PARA 5 EMPRESAS:
   üè¢ Bolsas y Mercados Argentinos
   üè¢ Pampa Energ√≠a
   üè¢ Grupo Supervielle
   üè¢ Banco Macro
   üè¢ Central Puerto

üìä MATRIZ DE CORRELACIONES:
--------------------------------------------------
                              Bolsas y Mercados Argentinos  Pampa Energ√≠a  Grupo Supervielle  Banco Macro  Central Puerto
Bolsas y Mercados Argentinos                         1.000          0.540              0.521        0.336           0.575
Pampa Energ√≠a                                        0.540          1.000              0.628        0.471           0.733
Grupo Supervielle                                    0.521          0.628              1.000        0.678           0.637
Banco Macro                                          0.336          0.471              0.678        1.000           0.477
Central Puerto                                       0.575          0.

‚úÖ SEGMENTO 1 COMPLETADO: Matriz de correlaciones con visualizaci√≥n


### An√°lisis de correlaciones en per√≠odos de Crisis vs Normales
---


In [14]:


print("‚ö†Ô∏è SEGMENTO 2: CORRELACIONES EN CRISIS VS. PER√çODOS NORMALES")
print("=" * 60)

# Definir per√≠odos de crisis basados en eventos identificados anteriormente
periodos_crisis = {
    'COVID-19': ('2020-03-01', '2020-06-30'),
    'Crisis Pol√≠tica 2021': ('2021-10-01', '2021-12-31'),
    'Crisis Econ√≥mica 2022': ('2022-06-01', '2022-09-30')
}

periodos_normales = {
    'Pre-COVID': ('2019-01-01', '2020-02-29'),
    'Recuperaci√≥n Post-COVID': ('2021-01-01', '2021-09-30'),
    'Estabilizaci√≥n 2023': ('2023-01-01', '2023-12-31')
}

print("üìÖ PER√çODOS DEFINIDOS:")
print("üî¥ CRISIS:")
for nombre, (inicio, fin) in periodos_crisis.items():
    print(f"   ‚Ä¢ {nombre}: {inicio} a {fin}")

print("üü¢ NORMALES:")
for nombre, (inicio, fin) in periodos_normales.items():
    print(f"   ‚Ä¢ {nombre}: {inicio} a {fin}")

def calcular_correlaciones_periodo(rendimientos_df, fecha_inicio, fecha_fin):
    """Calcular correlaciones para un per√≠odo espec√≠fico"""
    try:
        periodo_data = rendimientos_df.loc[fecha_inicio:fecha_fin]
        if len(periodo_data) < 30:  # M√≠nimo 30 observaciones
            return None, 0

        matriz_corr = periodo_data.corr()

        # Extraer correlaciones √∫nicas (tri√°ngulo superior)
        correlaciones = []
        for i in range(len(matriz_corr.columns)):
            for j in range(i+1, len(matriz_corr.columns)):
                correlaciones.append(matriz_corr.iloc[i, j])

        corr_promedio = np.mean(correlaciones)
        return correlaciones, corr_promedio

    except Exception as e:
        print(f"   ‚ö†Ô∏è Error en per√≠odo {fecha_inicio}-{fecha_fin}: {str(e)}")
        return None, 0

# Calcular correlaciones para cada per√≠odo
resultados_crisis = {}
resultados_normales = {}

print(f"\nüìä CALCULANDO CORRELACIONES POR PER√çODO:")
print("-" * 50)

# Per√≠odos de crisis
for nombre, (inicio, fin) in periodos_crisis.items():
    corrs, promedio = calcular_correlaciones_periodo(rendimientos, inicio, fin)
    if corrs is not None:
        resultados_crisis[nombre] = {
            'correlaciones': corrs,
            'promedio': promedio,
            'periodo': (inicio, fin),
            'observaciones': len(rendimientos.loc[inicio:fin])
        }
        print(f"üî¥ {nombre}: Corr. promedio = {promedio:.3f} ({len(rendimientos.loc[inicio:fin])} obs)")
    else:
        print(f"üî¥ {nombre}: Sin datos suficientes")

# Per√≠odos normales
for nombre, (inicio, fin) in periodos_normales.items():
    corrs, promedio = calcular_correlaciones_periodo(rendimientos, inicio, fin)
    if corrs is not None:
        resultados_normales[nombre] = {
            'correlaciones': corrs,
            'promedio': promedio,
            'periodo': (inicio, fin),
            'observaciones': len(rendimientos.loc[inicio:fin])
        }
        print(f"üü¢ {nombre}: Corr. promedio = {promedio:.3f} ({len(rendimientos.loc[inicio:fin])} obs)")
    else:
        print(f"üü¢ {nombre}: Sin datos suficientes")

# Comparaci√≥n estad√≠stica
if resultados_crisis and resultados_normales:
    corr_crisis_all = []
    corr_normal_all = []

    for resultado in resultados_crisis.values():
        corr_crisis_all.extend(resultado['correlaciones'])

    for resultado in resultados_normales.values():
        corr_normal_all.extend(resultado['correlaciones'])

    corr_promedio_crisis = np.mean(corr_crisis_all)
    corr_promedio_normal = np.mean(corr_normal_all)

    print(f"\nüìä COMPARACI√ìN ESTAD√çSTICA:")
    print(f"   üî¥ Correlaci√≥n promedio en CRISIS: {corr_promedio_crisis:.3f}")
    print(f"   üü¢ Correlaci√≥n promedio NORMAL: {corr_promedio_normal:.3f}")
    print(f"   üìà Diferencia: {corr_promedio_crisis - corr_promedio_normal:+.3f}")
    print(f"   üìä Aumento relativo: {((corr_promedio_crisis/corr_promedio_normal)-1)*100:+.1f}%")

    # Test estad√≠stico
    from scipy import stats
    t_stat, p_value = stats.ttest_ind(corr_crisis_all, corr_normal_all)
    print(f"   üî¨ Test t: t={t_stat:.3f}, p={p_value:.4f}")
    print(f"   üéØ Diferencia significativa: {'S√ç' if p_value < 0.05 else 'NO'}")

# Visualizaci√≥n comparativa
fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        'Distribuci√≥n de Correlaciones: Crisis vs Normal',
        'Correlaciones Promedio por Per√≠odo',
        'Evoluci√≥n Temporal de Correlaciones',
        'Box Plot: Crisis vs Normal'
    )
)

# Plot 1: Distribuci√≥n comparativa
if resultados_crisis and resultados_normales:
    fig.add_trace(
        go.Histogram(
            x=corr_crisis_all,
            name='Crisis',
            opacity=0.7,
            marker_color='red',
            nbinsx=20
        ),
        row=1, col=1
    )

    fig.add_trace(
        go.Histogram(
            x=corr_normal_all,
            name='Normal',
            opacity=0.7,
            marker_color='green',
            nbinsx=20
        ),
        row=1, col=1
    )

# Plot 2: Correlaciones promedio por per√≠odo
nombres_periodos = list(resultados_crisis.keys()) + list(resultados_normales.keys())
promedios_periodos = [r['promedio'] for r in resultados_crisis.values()] + [r['promedio'] for r in resultados_normales.values()]
colores_periodos = ['red'] * len(resultados_crisis) + ['green'] * len(resultados_normales)

fig.add_trace(
    go.Bar(
        x=nombres_periodos,
        y=promedios_periodos,
        marker_color=colores_periodos,
        showlegend=False
    ),
    row=1, col=2
)

# Plot 3: Evoluci√≥n temporal (ventana m√≥vil de 30 d√≠as)
ventana_corr = 30
if len(rendimientos) > ventana_corr:
    # Calcular correlaci√≥n promedio m√≥vil
    correlaciones_temporales = []
    fechas_temporales = []

    for i in range(ventana_corr, len(rendimientos)):
        periodo_temp = rendimientos.iloc[i-ventana_corr:i]
        matriz_temp = periodo_temp.corr()

        # Promedio de correlaciones
        corrs_temp = []
        for ii in range(len(matriz_temp.columns)):
            for jj in range(ii+1, len(matriz_temp.columns)):
                corrs_temp.append(matriz_temp.iloc[ii, jj])

        correlaciones_temporales.append(np.mean(corrs_temp))
        fechas_temporales.append(rendimientos.index[i])

    fig.add_trace(
        go.Scatter(
            x=fechas_temporales,
            y=correlaciones_temporales,
            mode='lines',
            name='Correlaci√≥n Promedio M√≥vil',
            line=dict(color='blue', width=1),
            showlegend=False
        ),
        row=2, col=1
    )

    # Marcar per√≠odos de crisis
    for nombre, (inicio, fin) in periodos_crisis.items():
        fig.add_vrect(
            x0=inicio, x1=fin,
            fillcolor="red", opacity=0.2,
            layer="below", line_width=0,
            row=2, col=1
        )

# Plot 4: Box plot comparativo
if resultados_crisis and resultados_normales:
    fig.add_trace(
        go.Box(
            y=corr_crisis_all,
            name='Crisis',
            marker_color='red'
        ),
        row=2, col=2
    )

    fig.add_trace(
        go.Box(
            y=corr_normal_all,
            name='Normal',
            marker_color='green'
        ),
        row=2, col=2
    )

fig.update_layout(
    height=800,
    title_text="üìä AN√ÅLISIS DE CORRELACIONES: CRISIS VS PER√çODOS NORMALES"
)

fig.show()

print("‚úÖ SEGMENTO 2 COMPLETADO: An√°lisis de correlaciones en crisis vs. normales")

‚ö†Ô∏è SEGMENTO 2: CORRELACIONES EN CRISIS VS. PER√çODOS NORMALES
üìÖ PER√çODOS DEFINIDOS:
üî¥ CRISIS:
   ‚Ä¢ COVID-19: 2020-03-01 a 2020-06-30
   ‚Ä¢ Crisis Pol√≠tica 2021: 2021-10-01 a 2021-12-31
   ‚Ä¢ Crisis Econ√≥mica 2022: 2022-06-01 a 2022-09-30
üü¢ NORMALES:
   ‚Ä¢ Pre-COVID: 2019-01-01 a 2020-02-29
   ‚Ä¢ Recuperaci√≥n Post-COVID: 2021-01-01 a 2021-09-30
   ‚Ä¢ Estabilizaci√≥n 2023: 2023-01-01 a 2023-12-31

üìä CALCULANDO CORRELACIONES POR PER√çODO:
--------------------------------------------------
üî¥ COVID-19: Sin datos suficientes
üî¥ Crisis Pol√≠tica 2021: Corr. promedio = 0.583 (65 obs)
üî¥ Crisis Econ√≥mica 2022: Corr. promedio = 0.413 (87 obs)
üü¢ Pre-COVID: Sin datos suficientes
üü¢ Recuperaci√≥n Post-COVID: Corr. promedio = 0.479 (192 obs)
üü¢ Estabilizaci√≥n 2023: Corr. promedio = 0.569 (256 obs)

üìä COMPARACI√ìN ESTAD√çSTICA:
   üî¥ Correlaci√≥n promedio en CRISIS: 0.498
   üü¢ Correlaci√≥n promedio NORMAL: 0.524
   üìà Diferencia: -0.026
   üìä Aum

‚úÖ SEGMENTO 2 COMPLETADO: An√°lisis de correlaciones en crisis vs. normales


### Efecto contagio - ¬øAumentan las correlaciones en crisis?
---

In [15]:


print("ü¶† SEGMENTO 3: EFECTO CONTAGIO - AN√ÅLISIS ESTAD√çSTICO")
print("=" * 60)

# An√°lisis estad√≠stico del efecto contagio
def analizar_efecto_contagio(rendimientos_df, periodos_crisis, periodos_normales):
    """
    An√°lisis riguroso del efecto contagio
    """
    print("üîç ANALIZANDO EFECTO CONTAGIO...")

    # Recopilar todas las correlaciones
    correlaciones_crisis = []
    correlaciones_normales = []

    # Crisis
    for nombre, (inicio, fin) in periodos_crisis.items():
        try:
            periodo_data = rendimientos_df.loc[inicio:fin]
            if len(periodo_data) >= 30:
                matriz_corr = periodo_data.corr()

                for i in range(len(matriz_corr.columns)):
                    for j in range(i+1, len(matriz_corr.columns)):
                        correlaciones_crisis.append(matriz_corr.iloc[i, j])
        except:
            continue

    # Normales
    for nombre, (inicio, fin) in periodos_normales.items():
        try:
            periodo_data = rendimientos_df.loc[inicio:fin]
            if len(periodo_data) >= 30:
                matriz_corr = periodo_data.corr()

                for i in range(len(matriz_corr.columns)):
                    for j in range(i+1, len(matriz_corr.columns)):
                        correlaciones_normales.append(matriz_corr.iloc[i, j])
        except:
            continue

    return correlaciones_crisis, correlaciones_normales

corrs_crisis, corrs_normales = analizar_efecto_contagio(rendimientos, periodos_crisis, periodos_normales)

if corrs_crisis and corrs_normales:
    # Estad√≠sticas descriptivas
    print(f"üìä ESTAD√çSTICAS DEL EFECTO CONTAGIO:")
    print("-" * 50)

    media_crisis = np.mean(corrs_crisis)
    media_normal = np.mean(corrs_normales)
    std_crisis = np.std(corrs_crisis)
    std_normal = np.std(corrs_normales)

    print(f"üî¥ CRISIS:")
    print(f"   Media: {media_crisis:.4f}")
    print(f"   Std: {std_crisis:.4f}")
    print(f"   Min: {np.min(corrs_crisis):.4f}")
    print(f"   Max: {np.max(corrs_crisis):.4f}")
    print(f"   Observaciones: {len(corrs_crisis)}")

    print(f"\nüü¢ NORMAL:")
    print(f"   Media: {media_normal:.4f}")
    print(f"   Std: {std_normal:.4f}")
    print(f"   Min: {np.min(corrs_normales):.4f}")
    print(f"   Max: {np.max(corrs_normales):.4f}")
    print(f"   Observaciones: {len(corrs_normales)}")

    # An√°lisis del efecto contagio
    diferencia_media = media_crisis - media_normal
    aumento_relativo = (diferencia_media / media_normal) * 100

    print(f"\nü¶† EFECTO CONTAGIO:")
    print(f"   Diferencia absoluta: {diferencia_media:+.4f}")
    print(f"   Aumento relativo: {aumento_relativo:+.2f}%")

    # Tests estad√≠sticos
    from scipy import stats

    # Test t para diferencia de medias
    t_stat, p_value_t = stats.ttest_ind(corrs_crisis, corrs_normales)

    # Test de Mann-Whitney (no param√©trico)
    u_stat, p_value_u = stats.mannwhitneyu(corrs_crisis, corrs_normales, alternative='greater')

    # Test de Kolmogorov-Smirnov
    ks_stat, p_value_ks = stats.ks_2samp(corrs_crisis, corrs_normales)

    print(f"\nüî¨ TESTS ESTAD√çSTICOS:")
    print(f"   Test t: t={t_stat:.3f}, p={p_value_t:.6f}")
    print(f"   Mann-Whitney U: U={u_stat:.0f}, p={p_value_u:.6f}")
    print(f"   Kolmogorov-Smirnov: KS={ks_stat:.3f}, p={p_value_ks:.6f}")

    # Interpretaci√≥n del efecto contagio
    print(f"\nüéØ CONCLUSI√ìN EFECTO CONTAGIO:")
    if p_value_t < 0.05 and diferencia_media > 0:
        print(f"   ‚úÖ CONFIRMADO: Las correlaciones aumentan significativamente en crisis")
        print(f"   üìà Aumento promedio: {aumento_relativo:.1f}%")
        intensidad = "FUERTE" if aumento_relativo > 50 else "MODERADO" if aumento_relativo > 20 else "D√âBIL"
        print(f"   üî• Intensidad del contagio: {intensidad}")
    else:
        print(f"   ‚ùå NO CONFIRMADO: No hay evidencia estad√≠stica de efecto contagio")

    # An√°lisis por percentiles
    print(f"\nüìä AN√ÅLISIS POR PERCENTILES:")
    percentiles = [10, 25, 50, 75, 90, 95, 99]

    print("     Percentil | Crisis  | Normal  | Diferencia")
    print("     ----------|---------|---------|----------")
    for p in percentiles:
        crisis_p = np.percentile(corrs_crisis, p)
        normal_p = np.percentile(corrs_normales, p)
        diff_p = crisis_p - normal_p
        print(f"     P{p:2d}       | {crisis_p:7.3f} | {normal_p:7.3f} | {diff_p:+8.3f}")

# Visualizaci√≥n del efecto contagio
fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        'Distribuciones: Crisis vs Normal',
        'Q-Q Plot: Crisis vs Normal',
        'Evoluci√≥n del Efecto Contagio',
        'An√°lisis de Percentiles'
    )
)

if corrs_crisis and corrs_normales:
    # Plot 1: Distribuciones
    fig.add_trace(
        go.Histogram(
            x=corrs_crisis,
            name='Crisis',
            opacity=0.6,
            marker_color='red',
            nbinsx=25,
            histnorm='probability density'
        ),
        row=1, col=1
    )

    fig.add_trace(
        go.Histogram(
            x=corrs_normales,
            name='Normal',
            opacity=0.6,
            marker_color='blue',
            nbinsx=25,
            histnorm='probability density'
        ),
        row=1, col=1
    )

    # Plot 2: Q-Q Plot
    crisis_sorted = np.sort(corrs_crisis)
    normal_sorted = np.sort(corrs_normales)

    # Interpolar para mismo tama√±o
    min_size = min(len(crisis_sorted), len(normal_sorted))
    crisis_qq = np.interp(np.linspace(0, 1, min_size),
                         np.linspace(0, 1, len(crisis_sorted)), crisis_sorted)
    normal_qq = np.interp(np.linspace(0, 1, min_size),
                         np.linspace(0, 1, len(normal_sorted)), normal_sorted)

    fig.add_trace(
        go.Scatter(
            x=normal_qq,
            y=crisis_qq,
            mode='markers',
            name='Q-Q Plot',
            marker=dict(size=4, color='purple'),
            showlegend=False
        ),
        row=1, col=2
    )

    # L√≠nea de referencia y=x
    min_val = min(min(normal_qq), min(crisis_qq))
    max_val = max(max(normal_qq), max(crisis_qq))
    fig.add_trace(
        go.Scatter(
            x=[min_val, max_val],
            y=[min_val, max_val],
            mode='lines',
            line=dict(color='red', dash='dash'),
            name='L√≠nea y=x',
            showlegend=False
        ),
        row=1, col=2
    )

    # Plot 3: Evoluci√≥n temporal del contagio
    ventana_contagio = 60
    if len(rendimientos) > ventana_contagio:
        fechas_contagio = []
        ratios_contagio = []

        for i in range(ventana_contagio, len(rendimientos)):
            periodo_actual = rendimientos.iloc[i-ventana_contagio:i]
            periodo_anterior = rendimientos.iloc[i-ventana_contagio*2:i-ventana_contagio]

            if len(periodo_anterior) >= 30:
                # Correlaci√≥n promedio per√≠odo actual
                corr_actual = periodo_actual.corr()
                corrs_actual = []
                for ii in range(len(corr_actual.columns)):
                    for jj in range(ii+1, len(corr_actual.columns)):
                        corrs_actual.append(corr_actual.iloc[ii, jj])

                # Correlaci√≥n promedio per√≠odo anterior
                corr_anterior = periodo_anterior.corr()
                corrs_anterior = []
                for ii in range(len(corr_anterior.columns)):
                    for jj in range(ii+1, len(corr_anterior.columns)):
                        corrs_anterior.append(corr_anterior.iloc[ii, jj])

                # Ratio de contagio
                ratio = np.mean(corrs_actual) / np.mean(corrs_anterior) if np.mean(corrs_anterior) != 0 else 1
                ratios_contagio.append(ratio)
                fechas_contagio.append(rendimientos.index[i])

        fig.add_trace(
            go.Scatter(
                x=fechas_contagio,
                y=ratios_contagio,
                mode='lines',
                name='Ratio Contagio',
                line=dict(color='red', width=2),
                showlegend=False
            ),
            row=2, col=1
        )

        fig.add_hline(y=1, line_dash="dash", line_color="black", row=2, col=1)

    # Plot 4: Comparaci√≥n de percentiles
    percentiles = [10, 25, 50, 75, 90, 95, 99]
    crisis_percentiles = [np.percentile(corrs_crisis, p) for p in percentiles]
    normal_percentiles = [np.percentile(corrs_normales, p) for p in percentiles]

    fig.add_trace(
        go.Scatter(
            x=percentiles,
            y=crisis_percentiles,
            mode='lines+markers',
            name='Crisis',
            line=dict(color='red', width=2),
            showlegend=False
        ),
        row=2, col=2
    )

    fig.add_trace(
        go.Scatter(
            x=percentiles,
            y=normal_percentiles,
            mode='lines+markers',
            name='Normal',
            line=dict(color='blue', width=2),
            showlegend=False
        ),
        row=2, col=2
    )

fig.update_layout(
    height=800,
    title_text="ü¶† AN√ÅLISIS DEL EFECTO CONTAGIO EN CORRELACIONES"
)

# T√≠tulos de ejes
fig.update_xaxes(title_text="Correlaci√≥n", row=1, col=1)
fig.update_yaxes(title_text="Densidad", row=1, col=1)
fig.update_xaxes(title_text="Correlaciones Normales", row=1, col=2)
fig.update_yaxes(title_text="Correlaciones Crisis", row=1, col=2)
fig.update_xaxes(title_text="Fecha", row=2, col=1)
fig.update_yaxes(title_text="Ratio Contagio", row=2, col=1)
fig.update_xaxes(title_text="Percentil", row=2, col=2)
fig.update_yaxes(title_text="Correlaci√≥n", row=2, col=2)

fig.show()

print("‚úÖ SEGMENTO 3 COMPLETADO: Efecto contagio analizado estad√≠sticamente")

ü¶† SEGMENTO 3: EFECTO CONTAGIO - AN√ÅLISIS ESTAD√çSTICO
üîç ANALIZANDO EFECTO CONTAGIO...
üìä ESTAD√çSTICAS DEL EFECTO CONTAGIO:
--------------------------------------------------
üî¥ CRISIS:
   Media: 0.4978
   Std: 0.1279
   Min: 0.2052
   Max: 0.7414
   Observaciones: 20

üü¢ NORMAL:
   Media: 0.5242
   Std: 0.1725
   Min: 0.1837
   Max: 0.8403
   Observaciones: 20

ü¶† EFECTO CONTAGIO:
   Diferencia absoluta: -0.0264
   Aumento relativo: -5.04%

üî¨ TESTS ESTAD√çSTICOS:
   Test t: t=-0.536, p=0.595203
   Mann-Whitney U: U=176, p=0.746247
   Kolmogorov-Smirnov: KS=0.250, p=0.571336

üéØ CONCLUSI√ìN EFECTO CONTAGIO:
   ‚ùå NO CONFIRMADO: No hay evidencia estad√≠stica de efecto contagio

üìä AN√ÅLISIS POR PERCENTILES:
     Percentil | Crisis  | Normal  | Diferencia
     ----------|---------|---------|----------
     P10       |   0.358 |   0.296 |   +0.062
     P25       |   0.431 |   0.370 |   +0.062
     P50       |   0.486 |   0.561 |   -0.076
     P75       |   0.584 |  

‚úÖ SEGMENTO 3 COMPLETADO: Efecto contagio analizado estad√≠sticamente


### Implicancias para Diversificaci√≥n.
---

In [16]:

# An√°lisis de implicancias para diversificaci√≥n
def calcular_beneficios_diversificacion(rendimientos_df, correlaciones_promedio):
   """
   Calcula los beneficios de diversificaci√≥n bajo diferentes escenarios de correlaci√≥n
   """
   print("üìä CALCULANDO BENEFICIOS DE DIVERSIFICACI√ìN...")

   # Par√°metros del portfolio
   num_activos = len(rendimientos_df.columns)
   pesos_iguales = np.array([1/num_activos] * num_activos)

   # Calcular volatilidades individuales
   volatilidades = rendimientos_df.std() * np.sqrt(252)  # Anualizadas
   vol_promedio = volatilidades.mean()

   # Funci√≥n para calcular volatilidad del portfolio
   def vol_portfolio(correlacion_promedio):
       # Construir matriz de correlaciones sint√©tica
       matriz_corr = np.full((num_activos, num_activos), correlacion_promedio)
       np.fill_diagonal(matriz_corr, 1.0)

       # Matriz de covarianzas
       vol_matrix = np.outer(volatilidades, volatilidades)
       matriz_cov = matriz_corr * vol_matrix

       # Volatilidad del portfolio
       vol_port = np.sqrt(np.dot(pesos_iguales.T, np.dot(matriz_cov, pesos_iguales)))
       return vol_port

   return vol_portfolio, vol_promedio

# Usar datos de segmentos anteriores
vol_func, vol_individual_promedio = calcular_beneficios_diversificacion(rendimientos, corr_promedio)

# Escenarios de correlaci√≥n
escenarios_correlacion = {
   'Per√≠odo Normal': corr_promedio_normal if 'corr_promedio_normal' in locals() else 0.3,
   'Per√≠odo Crisis': corr_promedio_crisis if 'corr_promedio_crisis' in locals() else 0.7,
   'Correlaci√≥n Baja': 0.1,
   'Correlaci√≥n Media': 0.5,
   'Correlaci√≥n Alta': 0.8,
   'Correlaci√≥n Extrema': 0.95
}

print(f"üìä AN√ÅLISIS DE ESCENARIOS DE DIVERSIFICACI√ìN:")
print("-" * 60)

resultados_diversificacion = {}

for escenario, corr_valor in escenarios_correlacion.items():
   vol_portfolio = vol_func(corr_valor)
   ratio_diversificacion = vol_portfolio / vol_individual_promedio
   beneficio_diversificacion = (1 - ratio_diversificacion) * 100

   resultados_diversificacion[escenario] = {
       'correlacion': corr_valor,
       'vol_portfolio': vol_portfolio,
       'vol_individual': vol_individual_promedio,
       'ratio_diversificacion': ratio_diversificacion,
       'beneficio_pct': beneficio_diversificacion
   }

   print(f"{escenario:15}: Corr={corr_valor:.2f} | Vol Portfolio={vol_portfolio:.1f}% | Beneficio={beneficio_diversificacion:.1f}%")

# An√°lisis del deterioro de la diversificaci√≥n en crisis
print(f"\nüö® DETERIORO DE DIVERSIFICACI√ìN EN CRISIS:")
print("-" * 60)

if 'corr_promedio_normal' in locals() and 'corr_promedio_crisis' in locals():
   beneficio_normal = resultados_diversificacion['Per√≠odo Normal']['beneficio_pct']
   beneficio_crisis = resultados_diversificacion['Per√≠odo Crisis']['beneficio_pct']

   deterioro_absoluto = beneficio_normal - beneficio_crisis
   deterioro_relativo = (deterioro_absoluto / beneficio_normal) * 100 if beneficio_normal != 0 else 0

   print(f"üìà Beneficio diversificaci√≥n NORMAL: {beneficio_normal:.1f}%")
   print(f"üìâ Beneficio diversificaci√≥n CRISIS: {beneficio_crisis:.1f}%")
   print(f"üí• Deterioro absoluto: {deterioro_absoluto:.1f} puntos porcentuales")
   print(f"üí• Deterioro relativo: {deterioro_relativo:.1f}%")

# N√∫mero √≥ptimo de activos bajo diferentes correlaciones
def calcular_activos_optimos():
   """Calcular n√∫mero √≥ptimo de activos para diversificaci√≥n"""
   print(f"\nüìä N√öMERO √ìPTIMO DE ACTIVOS PARA DIVERSIFICACI√ìN:")
   print("-" * 60)

   activos_range = range(2, 21)  # De 2 a 20 activos
   correlaciones_test = [0.1, 0.3, 0.5, 0.7, 0.9]

   resultados_activos = {}

   for corr in correlaciones_test:
       beneficios = []
       for n in activos_range:
           # F√≥rmula te√≥rica de diversificaci√≥n
           vol_portfolio_teorica = np.sqrt((1/n) + ((n-1)/n) * corr)
           beneficio = (1 - vol_portfolio_teorica) * 100
           beneficios.append(beneficio)

       resultados_activos[f'Corr_{corr:.1f}'] = beneficios

       # Encontrar punto de rendimientos decrecientes (beneficio < 1% adicional)
       beneficios_marginales = np.diff(beneficios)
       optimo_idx = next((i for i, b in enumerate(beneficios_marginales) if b < 1), len(beneficios_marginales))
       optimo_activos = activos_range[optimo_idx] if optimo_idx < len(activos_range) else activos_range[-1]

       print(f"   Correlaci√≥n {corr:.1f}: ~{optimo_activos} activos √≥ptimo (beneficio: {beneficios[optimo_idx]:.1f}%)")

   return activos_range, resultados_activos

activos_range, resultados_activos = calcular_activos_optimos()

# Recomendaciones estrat√©gicas
print(f"\nüéØ RECOMENDACIONES ESTRAT√âGICAS PARA PORTFOLIO BYMA:")
print("=" * 70)

print("1Ô∏è‚É£ DIVERSIFICACI√ìN POR SECTORES:")
print("   ‚Ä¢ Actual: 60% Financiero + 40% Energ√≠a")
print("   ‚Ä¢ Recomendaci√≥n: Incluir sectores con menor correlaci√≥n (Consumo, Telecomunicaciones)")

print("\n2Ô∏è‚É£ DIVERSIFICACI√ìN GEOGR√ÅFICA:")
print("   ‚Ä¢ Actual: 80% Argentina + 20% Internacional")
print("   ‚Ä¢ Recomendaci√≥n: Aumentar exposici√≥n internacional (30-40%)")

print("\n3Ô∏è‚É£ GESTI√ìN EN CRISIS:")
if 'deterioro_relativo' in locals():
   print(f"   ‚Ä¢ El beneficio de diversificaci√≥n se reduce {deterioro_relativo:.0f}% en crisis")
   print("   ‚Ä¢ Implementar coberturas adicionales (opciones, futuros)")
   print("   ‚Ä¢ Considerar activos refugio (bonos del tesoro, oro)")

print("\n4Ô∏è‚É£ MONITOREO DE CORRELACIONES:")
print("   ‚Ä¢ Establecer alertas cuando correlaciones > 0.6")
print("   ‚Ä¢ Revisar composici√≥n del portfolio trimestralmente")
print("   ‚Ä¢ Usar correlaciones m√≥viles (30-60 d√≠as) para decisiones t√°cticas")

# Visualizaci√≥n de implicancias para diversificaci√≥n
fig = make_subplots(
   rows=2, cols=2,
   subplot_titles=(
       'Beneficios de Diversificaci√≥n por Escenario',
       'Volatilidad Portfolio vs Individual',
       'N√∫mero √ìptimo de Activos',
       'Deterioro en Crisis vs Normal'
   )
)

# Plot 1: Beneficios por escenario
escenarios_nombres = list(resultados_diversificacion.keys())
beneficios_valores = [r['beneficio_pct'] for r in resultados_diversificacion.values()]
correlaciones_valores = [r['correlacion'] for r in resultados_diversificacion.values()]

colors_beneficios = ['green' if b > 15 else 'orange' if b > 5 else 'red' for b in beneficios_valores]

fig.add_trace(
   go.Bar(
       x=escenarios_nombres,
       y=beneficios_valores,
       marker_color=colors_beneficios,
       name='Beneficio Diversificaci√≥n',
       showlegend=False
   ),
   row=1, col=1
)

# Plot 2: Volatilidad portfolio vs individual
vol_portfolio_valores = [r['vol_portfolio'] for r in resultados_diversificacion.values()]
vol_individual_valores = [r['vol_individual'] for r in resultados_diversificacion.values()]

fig.add_trace(
   go.Scatter(
       x=correlaciones_valores,
       y=vol_portfolio_valores,
       mode='lines+markers',
       name='Vol Portfolio',
       line=dict(color='red', width=3)
   ),
   row=1, col=2
)

fig.add_trace(
   go.Scatter(
       x=correlaciones_valores,
       y=vol_individual_valores,
       mode='lines',
       name='Vol Individual',
       line=dict(color='blue', dash='dash', width=2),
       showlegend=False
   ),
   row=1, col=2
)

# Plot 3: N√∫mero √≥ptimo de activos
colors_corr = ['green', 'blue', 'orange', 'red', 'purple']
for i, (corr_label, beneficios) in enumerate(resultados_activos.items()):
   fig.add_trace(
       go.Scatter(
           x=list(activos_range),
           y=beneficios,
           mode='lines+markers',
           name=corr_label.replace('_', ' '),
           line=dict(color=colors_corr[i]),
           showlegend=False
       ),
       row=2, col=1
   )

# Plot 4: Comparaci√≥n Crisis vs Normal (si hay datos)
if 'beneficio_normal' in locals() and 'beneficio_crisis' in locals():
   fig.add_trace(
       go.Bar(
           x=['Per√≠odo Normal', 'Per√≠odo Crisis'],
           y=[beneficio_normal, beneficio_crisis],
           marker_color=['green', 'red'],
           name='Beneficio por Per√≠odo',
           showlegend=False
       ),
       row=2, col=2
   )

# Actualizar layout
fig.update_layout(
   height=800,
   title_text="üéØ IMPLICANCIAS PARA DIVERSIFICACI√ìN - PORTFOLIO BYMA"
)

# T√≠tulos de ejes
fig.update_yaxes(title_text="Beneficio Diversificaci√≥n (%)", row=1, col=1)
fig.update_xaxes(title_text="Correlaci√≥n", row=1, col=2)
fig.update_yaxes(title_text="Volatilidad (%)", row=1, col=2)
fig.update_xaxes(title_text="N√∫mero de Activos", row=2, col=1)
fig.update_yaxes(title_text="Beneficio (%)", row=2, col=1)
fig.update_yaxes(title_text="Beneficio (%)", row=2, col=2)

fig.show()

# Matriz de correlaciones recomendada
print(f"\nüìã MATRIZ DE CORRELACIONES OBJETIVO:")
print("-" * 50)
print("Para maximizar beneficios de diversificaci√≥n:")
print("‚Ä¢ Correlaci√≥n promedio objetivo: < 0.40")
print("‚Ä¢ Correlaci√≥n m√°xima entre pares: < 0.60")
print("‚Ä¢ Correlaci√≥n en crisis (aceptable): < 0.70")

# C√°lculo de eficiencia de diversificaci√≥n actual
correlacion_actual = matriz_corr.values[np.triu_indices_from(matriz_corr.values, k=1)].mean()
eficiencia_actual = (1 - correlacion_actual) * 100

print(f"\nüìä EFICIENCIA ACTUAL DEL PORTFOLIO:")
print(f"   üéØ Correlaci√≥n promedio actual: {correlacion_actual:.3f}")
print(f"   üìà Eficiencia de diversificaci√≥n: {eficiencia_actual:.1f}%")

if eficiencia_actual > 60:
   print("   ‚úÖ NIVEL BUENO: Diversificaci√≥n efectiva")
elif eficiencia_actual > 40:
   print("   ‚ö†Ô∏è NIVEL MODERADO: Mejorar diversificaci√≥n")
else:
   print("   ‚ùå NIVEL BAJO: Diversificaci√≥n insuficiente")

print("‚úÖ SEGMENTO 4 COMPLETADO: Implicancias para diversificaci√≥n analizadas")

üìä CALCULANDO BENEFICIOS DE DIVERSIFICACI√ìN...
üìä AN√ÅLISIS DE ESCENARIOS DE DIVERSIFICACI√ìN:
------------------------------------------------------------
Per√≠odo Normal : Corr=0.52 | Vol Portfolio=41.3% | Beneficio=21.2%
Per√≠odo Crisis : Corr=0.50 | Vol Portfolio=40.6% | Beneficio=22.6%
Correlaci√≥n Baja: Corr=0.10 | Vol Portfolio=27.8% | Beneficio=46.9%
Correlaci√≥n Media: Corr=0.50 | Vol Portfolio=40.7% | Beneficio=22.5%
Correlaci√≥n Alta: Corr=0.80 | Vol Portfolio=48.1% | Beneficio=8.3%
Correlaci√≥n Extrema: Corr=0.95 | Vol Portfolio=51.4% | Beneficio=2.0%

üö® DETERIORO DE DIVERSIFICACI√ìN EN CRISIS:
------------------------------------------------------------
üìà Beneficio diversificaci√≥n NORMAL: 21.2%
üìâ Beneficio diversificaci√≥n CRISIS: 22.6%
üí• Deterioro absoluto: -1.3 puntos porcentuales
üí• Deterioro relativo: -6.4%

üìä N√öMERO √ìPTIMO DE ACTIVOS PARA DIVERSIFICACI√ìN:
------------------------------------------------------------
   Correlaci√≥n 0.1: ~10 ac


üìã MATRIZ DE CORRELACIONES OBJETIVO:
--------------------------------------------------
Para maximizar beneficios de diversificaci√≥n:
‚Ä¢ Correlaci√≥n promedio objetivo: < 0.40
‚Ä¢ Correlaci√≥n m√°xima entre pares: < 0.60
‚Ä¢ Correlaci√≥n en crisis (aceptable): < 0.70

üìä EFICIENCIA ACTUAL DEL PORTFOLIO:
   üéØ Correlaci√≥n promedio actual: 0.560
   üìà Eficiencia de diversificaci√≥n: 44.0%
   ‚ö†Ô∏è NIVEL MODERADO: Mejorar diversificaci√≥n
‚úÖ SEGMENTO 4 COMPLETADO: Implicancias para diversificaci√≥n analizadas


### Pregunta Critica

**¬øPor qu√© ciertas acciones est√°n m√°s correlacionadas que otras y c√≥mo afecta esto tu estrategia de diversificaci√≥n?**

Las acciones de tu cartera est√°n m√°s correlacionadas por pertenecer a sectores similares y verse afectadas por los mismos factores macroecon√≥micos argentinos.

Esta alta correlaci√≥n limita el beneficio de la diversificaci√≥n, especialmente en crisis, aumentando el riesgo de que todos los activos caigan juntos. Para mejorar la diversificaci√≥n, necesitas incluir activos con menor correlaci√≥n, buscando otros sectores o mercados geogr√°ficos.

## Optimizaci√≥n de portafolios
---

### Simulaci√≥n de 2000+ Portafolios Aleatoios
---

In [17]:


import numpy as np
import pandas as pd
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from scipy.optimize import minimize
import warnings
warnings.filterwarnings('ignore')

print("üé≤ SEGMENTO 1: SIMULACI√ìN DE PORTFOLIOS ALEATORIOS")
print("=" * 60)

# Preparar datos para optimizaci√≥n
empresas_cols = [col for col in precios_limpios.columns if col in EMPRESAS.keys()]
rendimientos_opt = precios_limpios[empresas_cols].pct_change().dropna()

# Calcular estad√≠sticas necesarias
rendimientos_anuales = rendimientos_opt.mean() * 252
matriz_covarianzas = rendimientos_opt.cov() * 252
volatilidades_anuales = np.sqrt(np.diag(matriz_covarianzas))

num_activos = len(empresas_cols)
nombres_empresas = [EMPRESAS[col] for col in empresas_cols]

print(f"üìä DATOS PARA OPTIMIZACI√ìN:")
print(f"   üè¢ N√∫mero de activos: {num_activos}")
print(f"   üìÖ Per√≠odo de datos: {rendimientos_opt.index[0].date()} a {rendimientos_opt.index[-1].date()}")
print(f"   üìà Observaciones: {len(rendimientos_opt):,}")

print(f"\nüìä ESTAD√çSTICAS DE ACTIVOS:")
for i, col in enumerate(empresas_cols):
    print(f"   {nombres_empresas[i][:20]:20}: Ret={rendimientos_anuales.iloc[i]:+7.2%} | Vol={volatilidades_anuales[i]:6.2%}")

# Configuraci√≥n de simulaci√≥n
NUM_PORTFOLIOS = 5000  # M√°s de 2000 como solicitado
np.random.seed(42)  # Para reproducibilidad

print(f"\nüé≤ INICIANDO SIMULACI√ìN DE {NUM_PORTFOLIOS:,} PORTFOLIOS...")
print("-" * 60)

# Arrays para almacenar resultados
resultados_simulacion = {
    'rendimientos': [],
    'volatilidades': [],
    'sharpe_ratios': [],
    'pesos': []
}

# Contador de portfolios v√°lidos
portfolios_validos = 0
intentos = 0
max_intentos = NUM_PORTFOLIOS * 5  # L√≠mite de seguridad

# Funci√≥n para generar pesos aleatorios con restricciones b√°sicas
def generar_pesos_aleatorios(n_activos, peso_min=0.0, peso_max=1.0):
    """Generar pesos aleatorios que sumen 1 con restricciones b√°sicas"""
    while True:
        # Generar pesos aleatorios
        pesos = np.random.random(n_activos)
        pesos = pesos / np.sum(pesos)  # Normalizar

        # Verificar restricciones b√°sicas
        if np.all(pesos >= peso_min) and np.all(pesos <= peso_max):
            return pesos

# Simulaci√≥n Monte Carlo
print("üìä Progreso de simulaci√≥n:")
for i in range(NUM_PORTFOLIOS):
    intentos += 1

    try:
        # Generar pesos aleatorios
        pesos = generar_pesos_aleatorios(num_activos)

        # Calcular m√©tricas del portfolio
        rendimiento_portfolio = np.sum(rendimientos_anuales * pesos)
        volatilidad_portfolio = np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianzas, pesos)))

        # Sharpe ratio (asumiendo tasa libre de riesgo = 0)
        sharpe_ratio = rendimiento_portfolio / volatilidad_portfolio if volatilidad_portfolio > 0 else 0

        # Verificar que las m√©tricas son v√°lidas
        if not (np.isnan(rendimiento_portfolio) or np.isnan(volatilidad_portfolio) or np.isnan(sharpe_ratio)):
            resultados_simulacion['rendimientos'].append(rendimiento_portfolio)
            resultados_simulacion['volatilidades'].append(volatilidad_portfolio)
            resultados_simulacion['sharpe_ratios'].append(sharpe_ratio)
            resultados_simulacion['pesos'].append(pesos.copy())

            portfolios_validos += 1

        # Mostrar progreso cada 1000 portfolios
        if (i + 1) % 1000 == 0:
            print(f"   ‚úÖ {i + 1:,} portfolios simulados...")

    except Exception as e:
        continue

    if intentos >= max_intentos:
        break

# Convertir a DataFrame
df_simulacion = pd.DataFrame({
    'Rendimiento': resultados_simulacion['rendimientos'],
    'Volatilidad': resultados_simulacion['volatilidades'],
    'Sharpe_Ratio': resultados_simulacion['sharpe_ratios']
})

# Agregar pesos como columnas
pesos_df = pd.DataFrame(resultados_simulacion['pesos'], columns=nombres_empresas)
df_simulacion = pd.concat([df_simulacion, pesos_df], axis=1)

print(f"\n‚úÖ SIMULACI√ìN COMPLETADA:")
print(f"   üéØ Portfolios v√°lidos generados: {portfolios_validos:,}")
print(f"   üìä Tasa de √©xito: {(portfolios_validos/intentos)*100:.1f}%")

# Estad√≠sticas de la simulaci√≥n
print(f"\nüìä ESTAD√çSTICAS DE SIMULACI√ìN:")
print(f"   üìà Rendimiento promedio: {df_simulacion['Rendimiento'].mean():.2%}")
print(f"   üìä Volatilidad promedio: {df_simulacion['Volatilidad'].mean():.2%}")
print(f"   ‚ö° Sharpe Ratio promedio: {df_simulacion['Sharpe_Ratio'].mean():.3f}")
print(f"   üìà Mejor Sharpe Ratio: {df_simulacion['Sharpe_Ratio'].max():.3f}")
print(f"   üìâ Menor volatilidad: {df_simulacion['Volatilidad'].min():.2%}")

# Identificar portfolios destacados de la simulaci√≥n
idx_max_sharpe = df_simulacion['Sharpe_Ratio'].idxmax()
idx_min_vol = df_simulacion['Volatilidad'].idxmin()
idx_max_ret = df_simulacion['Rendimiento'].idxmax()

print(f"\nüèÜ PORTFOLIOS DESTACADOS DE LA SIMULACI√ìN:")
print(f"   ü•á M√°ximo Sharpe: Ret={df_simulacion.loc[idx_max_sharpe, 'Rendimiento']:.2%}, "
      f"Vol={df_simulacion.loc[idx_max_sharpe, 'Volatilidad']:.2%}, "
      f"Sharpe={df_simulacion.loc[idx_max_sharpe, 'Sharpe_Ratio']:.3f}")

print(f"   üõ°Ô∏è  M√≠nimo Riesgo: Ret={df_simulacion.loc[idx_min_vol, 'Rendimiento']:.2%}, "
      f"Vol={df_simulacion.loc[idx_min_vol, 'Volatilidad']:.2%}, "
      f"Sharpe={df_simulacion.loc[idx_min_vol, 'Sharpe_Ratio']:.3f}")

# Visualizaci√≥n inicial de la simulaci√≥n
fig = go.Figure()

fig.add_trace(
    go.Scatter(
        x=df_simulacion['Volatilidad'] * 100,
        y=df_simulacion['Rendimiento'] * 100,
        mode='markers',
        marker=dict(
            size=4,
            color=df_simulacion['Sharpe_Ratio'],
            colorscale='Viridis',
            showscale=True,
            colorbar=dict(title="Sharpe Ratio"),
            opacity=0.6
        ),
        text=[f"Sharpe: {sr:.3f}" for sr in df_simulacion['Sharpe_Ratio']],
        name='Portfolios Simulados',
        hovertemplate="<b>Portfolio Simulado</b><br>" +
                      "Rendimiento: %{y:.2f}%<br>" +
                      "Volatilidad: %{x:.2f}%<br>" +
                      "%{text}<extra></extra>"
    )
)

# Marcar portfolios destacados
fig.add_trace(
    go.Scatter(
        x=[df_simulacion.loc[idx_max_sharpe, 'Volatilidad'] * 100],
        y=[df_simulacion.loc[idx_max_sharpe, 'Rendimiento'] * 100],
        mode='markers',
        marker=dict(size=15, color='red', symbol='star'),
        name='M√°ximo Sharpe (Simulado)',
        hovertemplate="<b>M√°ximo Sharpe</b><br>" +
                      "Rendimiento: %{y:.2f}%<br>" +
                      "Volatilidad: %{x:.2f}%<extra></extra>"
    )
)

fig.add_trace(
    go.Scatter(
        x=[df_simulacion.loc[idx_min_vol, 'Volatilidad'] * 100],
        y=[df_simulacion.loc[idx_min_vol, 'Rendimiento'] * 100],
        mode='markers',
        marker=dict(size=15, color='blue', symbol='diamond'),
        name='M√≠nimo Riesgo (Simulado)',
        hovertemplate="<b>M√≠nimo Riesgo</b><br>" +
                      "Rendimiento: %{y:.2f}%<br>" +
                      "Volatilidad: %{x:.2f}%<extra></extra>"
    )
)

fig.update_layout(
    title="üé≤ SIMULACI√ìN MONTE CARLO - PORTFOLIOS ALEATORIOS",
    xaxis_title="Volatilidad Anual (%)",
    yaxis_title="Rendimiento Anual (%)",
    height=600,
    hovermode='closest'
)

fig.show()

print("‚úÖ SEGMENTO 1 COMPLETADO: Simulaci√≥n de portfolios aleatorios")

üé≤ SEGMENTO 1: SIMULACI√ìN DE PORTFOLIOS ALEATORIOS
üìä DATOS PARA OPTIMIZACI√ìN:
   üè¢ N√∫mero de activos: 5
   üìÖ Per√≠odo de datos: 2020-08-19 a 2025-08-15
   üìà Observaciones: 1,287

üìä ESTAD√çSTICAS DE ACTIVOS:
   Bolsas y Mercados Ar: Ret=+83.85% | Vol=45.71%
   Pampa Energ√≠a       : Ret=+94.68% | Vol=47.92%
   Grupo Supervielle   : Ret=+91.71% | Vol=59.97%
   Banco Macro         : Ret=+45.25% | Vol=53.65%
   Central Puerto      : Ret=+91.25% | Vol=54.98%

üé≤ INICIANDO SIMULACI√ìN DE 5,000 PORTFOLIOS...
------------------------------------------------------------
üìä Progreso de simulaci√≥n:
   ‚úÖ 1,000 portfolios simulados...
   ‚úÖ 2,000 portfolios simulados...
   ‚úÖ 3,000 portfolios simulados...
   ‚úÖ 4,000 portfolios simulados...
   ‚úÖ 5,000 portfolios simulados...

‚úÖ SIMULACI√ìN COMPLETADA:
   üéØ Portfolios v√°lidos generados: 5,000
   üìä Tasa de √©xito: 100.0%

üìä ESTAD√çSTICAS DE SIMULACI√ìN:
   üìà Rendimiento promedio: 81.19%
   üìä Volatilid

‚úÖ SEGMENTO 1 COMPLETADO: Simulaci√≥n de portfolios aleatorios


### Restricciones Realistas de Optimizaci√≥n
---

In [18]:
# ============================================================================
# SEGMENTO 2: RESTRICCIONES REALISTAS DE OPTIMIZACI√ìN (CORREGIDO)
# ============================================================================

import numpy as np
import pandas as pd
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import warnings
warnings.filterwarnings('ignore')

print("üîí SEGMENTO 2: APLICACI√ìN DE RESTRICCIONES REALISTAS")
print("=" * 60)

# Definir restricciones espec√≠ficas
RESTRICCIONES = {
    'peso_maximo': 0.40,    # M√°ximo 40% en un solo activo
    'peso_minimo': 0.05,    # M√≠nimo 5% en cada activo
    'costos_transaccion': 0.005  # 0.5% de costos
}

print("üìã RESTRICCIONES APLICADAS:")
print(f"   üìä Peso m√°ximo por activo: {RESTRICCIONES['peso_maximo']:.0%}")
print(f"   üìä Peso m√≠nimo por activo: {RESTRICCIONES['peso_minimo']:.0%}")
print(f"   üí∞ Costos de transacci√≥n: {RESTRICCIONES['costos_transaccion']:.1%}")

# Funci√≥n para validar restricciones
def validar_restricciones(pesos, restricciones):
    """Verificar si un portfolio cumple con las restricciones"""
    # Verificar suma = 1 (con tolerancia)
    if abs(np.sum(pesos) - 1.0) > 1e-6:
        return False

    # Verificar l√≠mites individuales
    if np.any(pesos < restricciones['peso_minimo']) or np.any(pesos > restricciones['peso_maximo']):
        return False

    return True

# Funci√≥n para generar pesos que cumplan restricciones
def generar_pesos_con_restricciones(n_activos, restricciones, max_intentos=1000):
    """Genera pesos aleatorios que cumplan las restricciones"""
    for _ in range(max_intentos):
        # M√©todo: generar n√∫meros aleatorios y ajustar
        pesos_raw = np.random.random(n_activos)

        # Escalar para que el m√≠nimo sea al menos peso_minimo
        pesos_raw = pesos_raw * (restricciones['peso_maximo'] - restricciones['peso_minimo']) + restricciones['peso_minimo']

        # Normalizar
        pesos = pesos_raw / np.sum(pesos_raw)

        # Verificar restricciones
        if validar_restricciones(pesos, restricciones):
            return pesos

    # Si no funciona, usar distribuci√≥n uniforme ajustada
    peso_base = 1 / n_activos
    if peso_base >= restricciones['peso_minimo'] and peso_base <= restricciones['peso_maximo']:
        return np.full(n_activos, peso_base)
    else:
        # √öltimo recurso: peso m√≠nimo para todos y ajustar
        pesos = np.full(n_activos, restricciones['peso_minimo'])
        exceso = np.sum(pesos) - 1.0

        if exceso < 0:  # Suma menos de 1
            # Distribuir el exceso
            deficit = -exceso
            incremento = min(deficit / n_activos, restricciones['peso_maximo'] - restricciones['peso_minimo'])
            pesos += incremento
            pesos = pesos / np.sum(pesos)  # Normalizar final

        return pesos

print(f"\nüé≤ GENERANDO PORTFOLIOS CON RESTRICCIONES...")

# Generar portfolios que cumplan restricciones desde el inicio
portfolios_restricciones = []
portfolios_generados = 0
max_portfolios = 3000

print("üìä Generando portfolios v√°lidos...")

for i in range(max_portfolios):
    try:
        # Generar pesos que cumplan restricciones
        pesos = generar_pesos_con_restricciones(num_activos, RESTRICCIONES)

        # Verificar que realmente cumple restricciones
        if not validar_restricciones(pesos, RESTRICCIONES):
            continue

        # Calcular m√©tricas del portfolio
        rendimiento_bruto = np.sum(rendimientos_anuales * pesos)
        volatilidad = np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianzas, pesos)))

        # Aplicar costos de transacci√≥n
        costos = RESTRICCIONES['costos_transaccion']
        rendimiento_neto = rendimiento_bruto - costos

        # Calcular Sharpe ratio
        sharpe_ratio = rendimiento_neto / volatilidad if volatilidad > 0 else 0

        # Verificar que las m√©tricas son v√°lidas
        if np.isnan(rendimiento_bruto) or np.isnan(volatilidad) or np.isnan(sharpe_ratio):
            continue

        # Crear registro del portfolio
        portfolio = {
            'Rendimiento_Bruto': rendimiento_bruto,
            'Rendimiento_Neto': rendimiento_neto,
            'Volatilidad': volatilidad,
            'Sharpe_Ratio': sharpe_ratio,
            'Costos': costos
        }

        # Agregar pesos individuales
        for j, empresa in enumerate(nombres_empresas):
            portfolio[empresa] = pesos[j]

        portfolios_restricciones.append(portfolio)
        portfolios_generados += 1

        # Mostrar progreso
        if portfolios_generados % 500 == 0:
            print(f"   ‚úÖ {portfolios_generados:,} portfolios generados...")

    except Exception as e:
        continue

# Crear DataFrame con portfolios que cumplen restricciones
df_simulacion_filtrado = pd.DataFrame(portfolios_restricciones)

print(f"\n‚úÖ GENERACI√ìN COMPLETADA:")
print(f"   üéØ Portfolios v√°lidos generados: {len(df_simulacion_filtrado):,}")
print(f"   üìä Todos cumplen restricciones: 100%")

if len(df_simulacion_filtrado) == 0:
    print("‚ùå Error: No se pudieron generar portfolios v√°lidos")
else:
    # Estad√≠sticas de portfolios con restricciones
    print(f"\nüìä ESTAD√çSTICAS CON RESTRICCIONES:")
    print(f"   üìà Rendimiento bruto promedio: {df_simulacion_filtrado['Rendimiento_Bruto'].mean():.2%}")
    print(f"   üìà Rendimiento neto promedio: {df_simulacion_filtrado['Rendimiento_Neto'].mean():.2%}")
    print(f"   üìä Volatilidad promedio: {df_simulacion_filtrado['Volatilidad'].mean():.2%}")
    print(f"   ‚ö° Sharpe Ratio promedio: {df_simulacion_filtrado['Sharpe_Ratio'].mean():.3f}")
    print(f"   üí∞ Costos aplicados: {RESTRICCIONES['costos_transaccion']:.1%}")

    # Verificar cumplimiento de restricciones
    print(f"\nüîç VERIFICACI√ìN DE RESTRICCIONES:")
    print(f"{'Empresa':<20} {'Peso Min':<10} {'Peso Promedio':<15} {'Peso Max':<10}")
    print("-" * 60)

    for empresa in nombres_empresas:
        peso_min = df_simulacion_filtrado[empresa].min()
        peso_max = df_simulacion_filtrado[empresa].max()
        peso_promedio = df_simulacion_filtrado[empresa].mean()

        print(f"{empresa[:18]:<20} {peso_min:>8.1%} {peso_promedio:>13.1%} {peso_max:>8.1%}")

    # Verificar restricciones globales
    pesos_maximos = df_simulacion_filtrado[nombres_empresas].max(axis=1)
    pesos_minimos = df_simulacion_filtrado[nombres_empresas].min(axis=1)

    print(f"\nüìä CUMPLIMIENTO DE RESTRICCIONES:")
    print(f"   ‚úÖ Todos los pesos >= {RESTRICCIONES['peso_minimo']:.0%}: {(pesos_minimos >= RESTRICCIONES['peso_minimo']).all()}")
    print(f"   ‚úÖ Todos los pesos <= {RESTRICCIONES['peso_maximo']:.0%}: {(pesos_maximos <= RESTRICCIONES['peso_maximo']).all()}")
    print(f"   ‚úÖ Sumas = 100%: {np.allclose(df_simulacion_filtrado[nombres_empresas].sum(axis=1), 1.0)}")

# An√°lisis del impacto de costos
print(f"\nüí∞ IMPACTO DE COSTOS DE TRANSACCI√ìN:")
print("-" * 50)

if len(df_simulacion_filtrado) > 0:
    impacto_promedio = df_simulacion_filtrado['Rendimiento_Bruto'].mean() - df_simulacion_filtrado['Rendimiento_Neto'].mean()
    impacto_relativo = impacto_promedio / df_simulacion_filtrado['Rendimiento_Bruto'].mean() * 100

    print(f"   üìâ Reducci√≥n absoluta: {impacto_promedio:.2%}")
    print(f"   üìâ Reducci√≥n relativa: {impacto_relativo:.1f}%")
    print(f"   üí° Los costos reducen el rendimiento en {RESTRICCIONES['costos_transaccion']:.1%} anual")

# Identificar portfolios destacados
if len(df_simulacion_filtrado) > 0:
    idx_max_sharpe = df_simulacion_filtrado['Sharpe_Ratio'].idxmax()
    idx_min_vol = df_simulacion_filtrado['Volatilidad'].idxmin()
    idx_max_ret = df_simulacion_filtrado['Rendimiento_Neto'].idxmax()

    print(f"\nüèÜ PORTFOLIOS DESTACADOS (CON RESTRICCIONES):")
    print("-" * 70)
    print(f"ü•á M√°ximo Sharpe Ratio:")
    print(f"   Rendimiento neto: {df_simulacion_filtrado.loc[idx_max_sharpe, 'Rendimiento_Neto']:.2%}")
    print(f"   Volatilidad: {df_simulacion_filtrado.loc[idx_max_sharpe, 'Volatilidad']:.2%}")
    print(f"   Sharpe: {df_simulacion_filtrado.loc[idx_max_sharpe, 'Sharpe_Ratio']:.3f}")

    print(f"\nüõ°Ô∏è M√≠nimo Riesgo:")
    print(f"   Rendimiento neto: {df_simulacion_filtrado.loc[idx_min_vol, 'Rendimiento_Neto']:.2%}")
    print(f"   Volatilidad: {df_simulacion_filtrado.loc[idx_min_vol, 'Volatilidad']:.2%}")
    print(f"   Sharpe: {df_simulacion_filtrado.loc[idx_min_vol, 'Sharpe_Ratio']:.3f}")

# Visualizaci√≥n del impacto de restricciones
fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        'Portfolios con Restricciones',
        'Distribuci√≥n de Pesos por Empresa',
        'Impacto de Costos de Transacci√≥n',
        'Distribuci√≥n de Sharpe Ratios'
    )
)

if len(df_simulacion_filtrado) > 0:
    # Plot 1: Scatter de portfolios con restricciones
    fig.add_trace(
        go.Scatter(
            x=df_simulacion_filtrado['Volatilidad'] * 100,
            y=df_simulacion_filtrado['Rendimiento_Neto'] * 100,
            mode='markers',
            marker=dict(
                size=4,
                color=df_simulacion_filtrado['Sharpe_Ratio'],
                colorscale='Viridis',
                showscale=True,
                colorbar=dict(title="Sharpe Ratio", x=0.45),
                opacity=0.7
            ),
            name='Con Restricciones',
            hovertemplate="<b>Portfolio Restringido</b><br>" +
                          "Rendimiento Neto: %{y:.2f}%<br>" +
                          "Volatilidad: %{x:.2f}%<br>" +
                          "Sharpe: %{marker.color:.3f}<extra></extra>"
        ),
        row=1, col=1
    )

    # Plot 2: Box plot de distribuci√≥n de pesos
    for i, empresa in enumerate(nombres_empresas):
        fig.add_trace(
            go.Box(
                y=df_simulacion_filtrado[empresa] * 100,
                name=empresa[:10],
                showlegend=False,
                marker_color=f'hsl({i*60}, 70%, 50%)'
            ),
            row=1, col=2
        )

    # Agregar l√≠neas de restricciones
    fig.add_hline(y=RESTRICCIONES['peso_minimo']*100, line_dash="dash", line_color="red", row=1, col=2)
    fig.add_hline(y=RESTRICCIONES['peso_maximo']*100, line_dash="dash", line_color="red", row=1, col=2)

    # Plot 3: Comparaci√≥n rendimiento bruto vs neto
    fig.add_trace(
        go.Scatter(
            x=df_simulacion_filtrado['Rendimiento_Bruto'] * 100,
            y=df_simulacion_filtrado['Rendimiento_Neto'] * 100,
            mode='markers',
            marker=dict(size=3, color='blue', opacity=0.6),
            name='Bruto vs Neto',
            showlegend=False
        ),
        row=2, col=1
    )

    # L√≠nea y=x para referencia
    min_ret = min(df_simulacion_filtrado['Rendimiento_Neto'].min(), df_simulacion_filtrado['Rendimiento_Bruto'].min()) * 100
    max_ret = max(df_simulacion_filtrado['Rendimiento_Neto'].max(), df_simulacion_filtrado['Rendimiento_Bruto'].max()) * 100

    fig.add_trace(
        go.Scatter(
            x=[min_ret, max_ret],
            y=[min_ret, max_ret],
            mode='lines',
            line=dict(color='red', dash='dash'),
            name='Sin Costos',
            showlegend=False
        ),
        row=2, col=1
    )

    # Plot 4: Histograma de Sharpe ratios
    fig.add_trace(
        go.Histogram(
            x=df_simulacion_filtrado['Sharpe_Ratio'],
            nbinsx=30,
            marker_color='lightblue',
            opacity=0.7,
            showlegend=False
        ),
        row=2, col=2
    )

# Actualizar layout
fig.update_layout(
    height=800,
    title_text="üîí AN√ÅLISIS DE PORTFOLIOS CON RESTRICCIONES REALISTAS"
)

# T√≠tulos de ejes
fig.update_xaxes(title_text="Volatilidad (%)", row=1, col=1)
fig.update_yaxes(title_text="Rendimiento Neto (%)", row=1, col=1)
fig.update_yaxes(title_text="Peso (%)", row=1, col=2)
fig.update_xaxes(title_text="Rendimiento Bruto (%)", row=2, col=1)
fig.update_yaxes(title_text="Rendimiento Neto (%)", row=2, col=1)
fig.update_xaxes(title_text="Sharpe Ratio", row=2, col=2)
fig.update_yaxes(title_text="Frecuencia", row=2, col=2)

fig.show()

print("‚úÖ SEGMENTO 2 COMPLETADO: Restricciones realistas aplicadas correctamente")

üîí SEGMENTO 2: APLICACI√ìN DE RESTRICCIONES REALISTAS
üìã RESTRICCIONES APLICADAS:
   üìä Peso m√°ximo por activo: 40%
   üìä Peso m√≠nimo por activo: 5%
   üí∞ Costos de transacci√≥n: 0.5%

üé≤ GENERANDO PORTFOLIOS CON RESTRICCIONES...
üìä Generando portfolios v√°lidos...
   ‚úÖ 500 portfolios generados...
   ‚úÖ 1,000 portfolios generados...
   ‚úÖ 1,500 portfolios generados...
   ‚úÖ 2,000 portfolios generados...
   ‚úÖ 2,500 portfolios generados...
   ‚úÖ 3,000 portfolios generados...

‚úÖ GENERACI√ìN COMPLETADA:
   üéØ Portfolios v√°lidos generados: 3,000
   üìä Todos cumplen restricciones: 100%

üìä ESTAD√çSTICAS CON RESTRICCIONES:
   üìà Rendimiento bruto promedio: 81.30%
   üìà Rendimiento neto promedio: 80.80%
   üìä Volatilidad promedio: 42.87%
   ‚ö° Sharpe Ratio promedio: 1.886
   üí∞ Costos aplicados: 0.5%

üîç VERIFICACI√ìN DE RESTRICCIONES:
Empresa              Peso Min   Peso Promedio   Peso Max  
---------------------------------------------------------

‚úÖ SEGMENTO 2 COMPLETADO: Restricciones realistas aplicadas correctamente


### C√°lculo de portafolios Espec√≠ficos Optimizados
---

In [19]:
# ============================================================================
# SEGMENTO 3: C√ÅLCULO DE PORTFOLIOS ESPEC√çFICOS OPTIMIZADOS (CORREGIDO)
# ============================================================================

print("üéØ SEGMENTO 3: PORTFOLIOS ESPEC√çFICOS OPTIMIZADOS")
print("=" * 60)

# Funciones de optimizaci√≥n con restricciones
def calcular_portfolio_optimo(tipo_optimizacion, rendimientos_esperados, matriz_cov, restricciones):
    """
    Optimiza portfolio seg√∫n criterio espec√≠fico con restricciones
    """
    n_activos = len(rendimientos_esperados)

    # Restricciones de optimizaci√≥n
    constraints = [
        {'type': 'eq', 'fun': lambda x: np.sum(x) - 1}  # Suma de pesos = 1
    ]

    # Bounds (l√≠mites por activo)
    bounds = [(restricciones['peso_minimo'], restricciones['peso_maximo']) for _ in range(n_activos)]

    # Peso inicial (equiponderado dentro de restricciones)
    peso_inicial = 1 / n_activos
    if peso_inicial < restricciones['peso_minimo']:
        # Ajustar si el peso equiponderado viola restricciones
        x0 = np.full(n_activos, restricciones['peso_minimo'])
        x0 = x0 / np.sum(x0)  # Normalizar
    else:
        x0 = np.full(n_activos, peso_inicial)

    # Definir funci√≥n objetivo seg√∫n tipo
    if tipo_optimizacion == 'max_sharpe':
        def objetivo(pesos):
            rendimiento = np.sum(rendimientos_esperados * pesos)
            volatilidad = np.sqrt(np.dot(pesos.T, np.dot(matriz_cov, pesos)))

            # Aplicar costos de transacci√≥n
            costos = restricciones['costos_transaccion']
            rendimiento_neto = rendimiento - costos

            # Maximizar Sharpe = minimizar -Sharpe
            return -(rendimiento_neto / volatilidad) if volatilidad > 0 else -np.inf

    elif tipo_optimizacion == 'min_volatilidad':
        def objetivo(pesos):
            return np.sqrt(np.dot(pesos.T, np.dot(matriz_cov, pesos)))

    elif tipo_optimizacion == 'max_rendimiento':
        def objetivo(pesos):
            rendimiento = np.sum(rendimientos_esperados * pesos)
            costos = restricciones['costos_transaccion']
            return -(rendimiento - costos)  # Minimizar rendimiento negativo

    # Optimizaci√≥n
    try:
        resultado = minimize(
            objetivo,
            x0,
            method='SLSQP',
            bounds=bounds,
            constraints=constraints,
            options={'maxiter': 1000, 'ftol': 1e-9}
        )

        if resultado.success:
            pesos_optimos = resultado.x

            # Calcular m√©tricas finales
            rendimiento_bruto = np.sum(rendimientos_esperados * pesos_optimos)
            volatilidad = np.sqrt(np.dot(pesos_optimos.T, np.dot(matriz_cov, pesos_optimos)))
            costos = restricciones['costos_transaccion']
            rendimiento_neto = rendimiento_bruto - costos
            sharpe_ratio = rendimiento_neto / volatilidad if volatilidad > 0 else 0

            return {
                'exito': True,
                'pesos': pesos_optimos,
                'rendimiento_bruto': rendimiento_bruto,
                'rendimiento_neto': rendimiento_neto,
                'volatilidad': volatilidad,
                'sharpe_ratio': sharpe_ratio,
                'costos': costos,
                'mensaje': 'Optimizaci√≥n exitosa'
            }
        else:
            return {
                'exito': False,
                'mensaje': f'Error de optimizaci√≥n: {resultado.message}'
            }

    except Exception as e:
        return {
            'exito': False,
            'mensaje': f'Error: {str(e)}'
        }

# Calcular portfolios espec√≠ficos
print("üîß CALCULANDO PORTFOLIOS √ìPTIMOS...")

portfolios_optimos = {}

# 1. Portfolio de M√°ximo Sharpe Ratio
print("\nü•á 1. PORTFOLIO M√ÅXIMO SHARPE RATIO:")
portfolio_max_sharpe = calcular_portfolio_optimo('max_sharpe', rendimientos_anuales, matriz_covarianzas, RESTRICCIONES)

if portfolio_max_sharpe['exito']:
    portfolios_optimos['Max_Sharpe'] = portfolio_max_sharpe

    print(f"   ‚úÖ {portfolio_max_sharpe['mensaje']}")
    print(f"   üìà Rendimiento neto: {portfolio_max_sharpe['rendimiento_neto']:.2%}")
    print(f"   üìä Volatilidad: {portfolio_max_sharpe['volatilidad']:.2%}")
    print(f"   ‚ö° Sharpe Ratio: {portfolio_max_sharpe['sharpe_ratio']:.3f}")
    print(f"   üí∞ Costos: {portfolio_max_sharpe['costos']:.1%}")

    print("   üìä Composici√≥n:")
    for i, empresa in enumerate(nombres_empresas):
        peso = portfolio_max_sharpe['pesos'][i]
        print(f"      {empresa[:15]:15}: {peso:6.1%}")
else:
    print(f"   ‚ùå {portfolio_max_sharpe['mensaje']}")

# 2. Portfolio de M√≠nimo Riesgo
print("\nüõ°Ô∏è 2. PORTFOLIO M√çNIMO RIESGO:")
portfolio_min_vol = calcular_portfolio_optimo('min_volatilidad', rendimientos_anuales, matriz_covarianzas, RESTRICCIONES)

if portfolio_min_vol['exito']:
    portfolios_optimos['Min_Riesgo'] = portfolio_min_vol

    print(f"   ‚úÖ {portfolio_min_vol['mensaje']}")
    print(f"   üìà Rendimiento neto: {portfolio_min_vol['rendimiento_neto']:.2%}")
    print(f"   üìä Volatilidad: {portfolio_min_vol['volatilidad']:.2%}")
    print(f"   ‚ö° Sharpe Ratio: {portfolio_min_vol['sharpe_ratio']:.3f}")
    print(f"   üí∞ Costos: {portfolio_min_vol['costos']:.1%}")

    print("   üìä Composici√≥n:")
    for i, empresa in enumerate(nombres_empresas):
        peso = portfolio_min_vol['pesos'][i]
        print(f"      {empresa[:15]:15}: {peso:6.1%}")
else:
    print(f"   ‚ùå {portfolio_min_vol['mensaje']}")

# 3. Mi Elecci√≥n Personal (Portfolio Balanceado con sesgo hacia BYMA)
print("\nüíº 3. MI ELECCI√ìN PERSONAL - PORTFOLIO BYMA-FOCUS:")
print("   üéØ Estrategia: Sobrepesar BYMA (empresa asignada) manteniendo diversificaci√≥n")

# Crear portfolio personalizado con sesgo hacia BYMA
pesos_personal = np.array([0.35, 0.20, 0.15, 0.15, 0.15])  # BYMA 35%, otros distribuidos

# Verificar que cumple restricciones
if validar_restricciones(pesos_personal, RESTRICCIONES):
    # Calcular m√©tricas
    rendimiento_bruto = np.sum(rendimientos_anuales * pesos_personal)
    volatilidad = np.sqrt(np.dot(pesos_personal.T, np.dot(matriz_covarianzas, pesos_personal)))
    costos = RESTRICCIONES['costos_transaccion']
    rendimiento_neto = rendimiento_bruto - costos
    sharpe_ratio = rendimiento_neto / volatilidad if volatilidad > 0 else 0

    portfolio_personal = {
        'exito': True,
        'pesos': pesos_personal,
        'rendimiento_bruto': rendimiento_bruto,
        'rendimiento_neto': rendimiento_neto,
        'volatilidad': volatilidad,
        'sharpe_ratio': sharpe_ratio,
        'costos': costos,
        'mensaje': 'Portfolio personal creado exitosamente'
    }

    portfolios_optimos['Mi_Eleccion'] = portfolio_personal

    print(f"   ‚úÖ {portfolio_personal['mensaje']}")
    print(f"   üìà Rendimiento neto: {portfolio_personal['rendimiento_neto']:.2%}")
    print(f"   üìä Volatilidad: {portfolio_personal['volatilidad']:.2%}")
    print(f"   ‚ö° Sharpe Ratio: {portfolio_personal['sharpe_ratio']:.3f}")
    print(f"   üí∞ Costos: {portfolio_personal['costos']:.1%}")

    print("   üìä Composici√≥n:")
    for i, empresa in enumerate(nombres_empresas):
        peso = portfolio_personal['pesos'][i]
        print(f"      {empresa[:15]:15}: {peso:6.1%}")

    print("   üéØ Justificaci√≥n:")
    print("      ‚Ä¢ BYMA (35%): Empresa asignada, l√≠der en infraestructura financiera")
    print("      ‚Ä¢ Diversificaci√≥n sectorial: 55% Financiero + 45% Energ√≠a")
    print("      ‚Ä¢ Balance riesgo-retorno con enfoque en la empresa principal")

else:
    print("   ‚ùå El portfolio personal no cumple las restricciones")

# Comparaci√≥n de portfolios √≥ptimos
print(f"\nüìä COMPARACI√ìN DE PORTFOLIOS √ìPTIMOS:")
print("=" * 80)
print(f"{'Portfolio':<15} {'Rendimiento':<12} {'Volatilidad':<12} {'Sharpe':<8} {'Max Peso':<10}")
print("-" * 80)

for nombre, portfolio in portfolios_optimos.items():
    max_peso = np.max(portfolio['pesos'])
    print(f"{nombre:<15} {portfolio['rendimiento_neto']:>10.2%} {portfolio['volatilidad']:>10.2%} "
          f"{portfolio['sharpe_ratio']:>6.3f} {max_peso:>8.1%}")

# Portfolio equiponderado como benchmark
pesos_equiponderado = np.array([0.20, 0.20, 0.20, 0.20, 0.20])
rendimiento_eq = np.sum(rendimientos_anuales * pesos_equiponderado) - RESTRICCIONES['costos_transaccion']
volatilidad_eq = np.sqrt(np.dot(pesos_equiponderado.T, np.dot(matriz_covarianzas, pesos_equiponderado)))
sharpe_eq = rendimiento_eq / volatilidad_eq

print(f"{'Equiponderado':<15} {rendimiento_eq:>10.2%} {volatilidad_eq:>10.2%} {sharpe_eq:>6.3f} {0.20:>8.1%}")

print("‚úÖ SEGMENTO 3 COMPLETADO: Portfolios espec√≠ficos calculados")

üéØ SEGMENTO 3: PORTFOLIOS ESPEC√çFICOS OPTIMIZADOS
üîß CALCULANDO PORTFOLIOS √ìPTIMOS...

ü•á 1. PORTFOLIO M√ÅXIMO SHARPE RATIO:
   ‚úÖ Optimizaci√≥n exitosa
   üìà Rendimiento neto: 86.90%
   üìä Volatilidad: 40.66%
   ‚ö° Sharpe Ratio: 2.137
   üí∞ Costos: 0.5%
   üìä Composici√≥n:
      Bolsas y Mercad:  40.0%
      Pampa Energ√≠a  :  40.0%
      Grupo Superviel:   6.9%
      Banco Macro    :   5.0%
      Central Puerto :   8.1%

üõ°Ô∏è 2. PORTFOLIO M√çNIMO RIESGO:
   ‚úÖ Optimizaci√≥n exitosa
   üìà Rendimiento neto: 77.07%
   üìä Volatilidad: 39.18%
   ‚ö° Sharpe Ratio: 1.967
   üí∞ Costos: 0.5%
   üìä Composici√≥n:
      Bolsas y Mercad:  40.0%
      Pampa Energ√≠a  :  24.8%
      Grupo Superviel:   5.0%
      Banco Macro    :  25.2%
      Central Puerto :   5.0%

üíº 3. MI ELECCI√ìN PERSONAL - PORTFOLIO BYMA-FOCUS:
   üéØ Estrategia: Sobrepesar BYMA (empresa asignada) manteniendo diversificaci√≥n
   ‚úÖ Portfolio personal creado exitosamente
   üìà Rendimiento ne

### Fontera Eficiente graficada
---

In [20]:

def calcular_frontera_eficiente(rendimientos_esperados, matriz_cov, restricciones, num_puntos=50):
    """
    Calcula la frontera eficiente con restricciones
    """
    print(f"üîß Calculando frontera eficiente con {num_puntos} puntos...")

    # Encontrar rango de rendimientos factibles
    portfolio_min_vol = calcular_portfolio_optimo('min_volatilidad', rendimientos_esperados, matriz_cov, restricciones)
    portfolio_max_ret = calcular_portfolio_optimo('max_rendimiento', rendimientos_esperados, matriz_cov, restricciones)

    if not (portfolio_min_vol['exito'] and portfolio_max_ret['exito']):
        print("‚ùå No se pudieron calcular los extremos de la frontera")
        return None

    # Rango de rendimientos
    ret_min = portfolio_min_vol['rendimiento_neto']
    ret_max = portfolio_max_ret['rendimiento_neto']
    rendimientos_objetivo = np.linspace(ret_min, ret_max, num_puntos)

    puntos_frontera = []
    n_activos = len(rendimientos_esperados)

    print("üìä Calculando puntos de la frontera...")
    puntos_exitosos = 0

    for i, ret_target in enumerate(rendimientos_objetivo):
        # Funci√≥n objetivo: minimizar volatilidad
        def objetivo_frontera(pesos):
            return np.sqrt(np.dot(pesos.T, np.dot(matriz_cov, pesos)))

        # Restricciones
        constraints = [
            {'type': 'eq', 'fun': lambda x: np.sum(x) - 1},  # Suma = 1
            {'type': 'eq', 'fun': lambda x: np.sum(rendimientos_esperados * x) - restricciones['costos_transaccion'] - ret_target}  # Rendimiento objetivo
        ]

        # Bounds
        bounds = [(restricciones['peso_minimo'], restricciones['peso_maximo']) for _ in range(n_activos)]

        # Punto inicial
        x0 = np.full(n_activos, 1/n_activos)

        try:
            resultado = minimize(
                objetivo_frontera,
                x0,
                method='SLSQP',
                bounds=bounds,
                constraints=constraints,
                options={'maxiter': 1000, 'ftol': 1e-9}
            )

            if resultado.success and validar_restricciones(resultado.x, restricciones):
                pesos = resultado.x
                volatilidad = objetivo_frontera(pesos)
                rendimiento_bruto = np.sum(rendimientos_esperados * pesos)
                rendimiento_neto = rendimiento_bruto - restricciones['costos_transaccion']
                sharpe = rendimiento_neto / volatilidad if volatilidad > 0 else 0

                puntos_frontera.append({
                    'rendimiento_neto': rendimiento_neto,
                    'volatilidad': volatilidad,
                    'sharpe': sharpe,
                    'pesos': pesos.copy()
                })
                puntos_exitosos += 1

        except:
            continue

        # Mostrar progreso
        if (i + 1) % 10 == 0:
            print(f"   üìä Progreso: {i+1}/{num_puntos} puntos procesados")

    print(f"‚úÖ Frontera calculada: {puntos_exitosos} puntos v√°lidos")
    return puntos_frontera

# Calcular frontera eficiente
frontera_puntos = calcular_frontera_eficiente(rendimientos_anuales, matriz_covarianzas, RESTRICCIONES, 30)

if frontera_puntos:
    # Convertir a DataFrame
    df_frontera = pd.DataFrame(frontera_puntos)

    print(f"\nüìä CARACTER√çSTICAS DE LA FRONTERA EFICIENTE:")
    print(f"   üìà Rendimiento m√≠nimo: {df_frontera['rendimiento_neto'].min():.2%}")
    print(f"   üìà Rendimiento m√°ximo: {df_frontera['rendimiento_neto'].max():.2%}")
    print(f"   üìä Volatilidad m√≠nima: {df_frontera['volatilidad'].min():.2%}")
    print(f"   üìä Volatilidad m√°xima: {df_frontera['volatilidad'].max():.2%}")
    print(f"   ‚ö° Sharpe m√°ximo en frontera: {df_frontera['sharpe'].max():.3f}")

# Crear visualizaci√≥n completa de la frontera eficiente
fig = go.Figure()

# 1. Portfolios simulados con restricciones (fondo)
fig.add_trace(
    go.Scatter(
        x=df_simulacion_filtrado['Volatilidad'] * 100,
        y=df_simulacion_filtrado['Rendimiento_Neto'] * 100,
        mode='markers',
        marker=dict(
            size=3,
            color=df_simulacion_filtrado['Sharpe_Ratio'],
            colorscale='Viridis',
            opacity=0.4,
            showscale=False
        ),
        name='Portfolios Simulados',
        hovertemplate="<b>Portfolio Simulado</b><br>" +
                      "Rendimiento: %{y:.2f}%<br>" +
                      "Volatilidad: %{x:.2f}%<br>" +
                      "Sharpe: %{marker.color:.3f}<extra></extra>"
    )
)

# 2. Frontera eficiente
if frontera_puntos:
    fig.add_trace(
        go.Scatter(
            x=df_frontera['volatilidad'] * 100,
            y=df_frontera['rendimiento_neto'] * 100,
            mode='lines+markers',
            line=dict(color='red', width=4),
            marker=dict(size=6, color='red'),
            name='Frontera Eficiente',
            hovertemplate="<b>Frontera Eficiente</b><br>" +
                          "Rendimiento: %{y:.2f}%<br>" +
                          "Volatilidad: %{x:.2f}%<br>" +
                          "Sharpe: %{customdata:.3f}<extra></extra>",
            customdata=df_frontera['sharpe']
        )
    )

# 3. Portfolios √≥ptimos espec√≠ficos
colores_portfolios = {'Max_Sharpe': 'gold', 'Min_Riesgo': 'blue', 'Mi_Eleccion': 'purple'}
simbolos_portfolios = {'Max_Sharpe': 'star', 'Min_Riesgo': 'diamond', 'Mi_Eleccion': 'circle'}

for nombre, portfolio in portfolios_optimos.items():
    fig.add_trace(
        go.Scatter(
            x=[portfolio['volatilidad'] * 100],
            y=[portfolio['rendimiento_neto'] * 100],
            mode='markers',
            marker=dict(
                size=15,
                color=colores_portfolios[nombre],
                symbol=simbolos_portfolios[nombre],
                line=dict(width=2, color='black')
            ),
            name=nombre.replace('_', ' '),
            hovertemplate=f"<b>{nombre.replace('_', ' ')}</b><br>" +
                          "Rendimiento: %{y:.2f}%<br>" +
                          "Volatilidad: %{x:.2f}%<br>" +
                          f"Sharpe: {portfolio['sharpe_ratio']:.3f}<extra></extra>"
        )
    )

# 4. Portfolio equiponderado (benchmark)
fig.add_trace(
    go.Scatter(
        x=[volatilidad_eq * 100],
        y=[rendimiento_eq * 100],
        mode='markers',
        marker=dict(size=12, color='gray', symbol='square'),
        name='Equiponderado',
        hovertemplate="<b>Portfolio Equiponderado</b><br>" +
                      "Rendimiento: %{y:.2f}%<br>" +
                      "Volatilidad: %{x:.2f}%<br>" +
                      f"Sharpe: {sharpe_eq:.3f}<extra></extra>"
    )
)

# 5. Activos individuales
for i, empresa in enumerate(nombres_empresas):
    fig.add_trace(
        go.Scatter(
            x=[volatilidades_anuales[i] * 100],
            y=[rendimientos_anuales.iloc[i] * 100],
            mode='markers',
            marker=dict(size=10, color='lightcoral', symbol='triangle-up'),
            name=empresa,
            hovertemplate=f"<b>{empresa}</b><br>" +
                          "Rendimiento: %{y:.2f}%<br>" +
                          "Volatilidad: %{x:.2f}%<extra></extra>"
        )
    )

# Configurar layout
fig.update_layout(
    title="üìà FRONTERA EFICIENTE - PORTFOLIO BYMA CON RESTRICCIONES REALISTAS",
    xaxis_title="Volatilidad Anual (%)",
    yaxis_title="Rendimiento Anual Neto (%)",
    height=700,
    hovermode='closest',
    legend=dict(
        yanchor="top",
        y=0.99,
        xanchor="left",
        x=0.01
    )
)

# Agregar anotaciones
fig.add_annotation(
    x=portfolio_max_sharpe['volatilidad'] * 100 if 'Max_Sharpe' in portfolios_optimos else 20,
    y=portfolio_max_sharpe['rendimiento_neto'] * 100 if 'Max_Sharpe' in portfolios_optimos else 15,
    text="üìä Restricciones Aplicadas:<br>‚Ä¢ M√°x 40% por activo<br>‚Ä¢ M√≠n 5% por activo<br>‚Ä¢ Costos 0.5%",
    showarrow=True,
    arrowhead=2,
    arrowsize=1,
    arrowwidth=2,
    arrowcolor="black",
    ax=50,
    ay=-50,
    bgcolor="rgba(255,255,255,0.8)",
    bordercolor="black",
    borderwidth=1
)

fig.show()

# An√°lisis de la frontera eficiente
if frontera_puntos:
    print(f"\nüîç AN√ÅLISIS DE LA FRONTERA EFICIENTE:")
    print("-" * 60)

    # Encontrar portfolio de m√°ximo Sharpe en la frontera
    idx_max_sharpe_frontera = df_frontera['sharpe'].idxmax()
    mejor_frontera = df_frontera.loc[idx_max_sharpe_frontera]

    print(f"üèÜ MEJOR PORTFOLIO EN LA FRONTERA:")
    print(f"   üìà Rendimiento: {mejor_frontera['rendimiento_neto']:.2%}")
    print(f"   üìä Volatilidad: {mejor_frontera['volatilidad']:.2%}")
    print(f"   ‚ö° Sharpe Ratio: {mejor_frontera['sharpe']:.3f}")

    # Comparar con nuestros portfolios calculados
    print(f"\nüìä COMPARACI√ìN CON PORTFOLIOS OPTIMIZADOS:")
    for nombre, portfolio in portfolios_optimos.items():
        diferencia_sharpe = portfolio['sharpe_ratio'] - mejor_frontera['sharpe']
        print(f"   {nombre}: Sharpe diff = {diferencia_sharpe:+.3f}")

# Tabla resumen final
print(f"\nüìã RESUMEN FINAL DE OPTIMIZACI√ìN:")
print("=" * 90)
print(f"{'Portfolio':<20} {'Rendimiento':<12} {'Volatilidad':<12} {'Sharpe':<8} {'Posici√≥n':<15}")
print("-" * 90)

# Determinar posici√≥n relativa a la frontera
for nombre, portfolio in portfolios_optimos.items():
    if frontera_puntos:
        # Encontrar punto m√°s cercano en la frontera
        distancias = [(abs(p['volatilidad'] - portfolio['volatilidad']) +
                      abs(p['rendimiento_neto'] - portfolio['rendimiento_neto']))
                     for p in frontera_puntos]
        idx_cercano = np.argmin(distancias)
        sharpe_frontera = frontera_puntos[idx_cercano]['sharpe']

        if portfolio['sharpe_ratio'] >= sharpe_frontera - 0.001:
            posicion = "EN FRONTERA ‚úÖ"
        elif portfolio['sharpe_ratio'] >= sharpe_frontera - 0.01:
            posicion = "CERCA FRONTERA ‚ö†Ô∏è"
        else:
            posicion = "INEFICIENTE ‚ùå"
    else:
        posicion = "N/A"

    print(f"{nombre:<20} {portfolio['rendimiento_neto']:>10.2%} {portfolio['volatilidad']:>10.2%} "
          f"{portfolio['sharpe_ratio']:>6.3f} {posicion:<15}")

print(f"{'Equiponderado':<20} {rendimiento_eq:>10.2%} {volatilidad_eq:>10.2%} {sharpe_eq:>6.3f} {'BENCHMARK':<15}")

print("‚úÖ SEGMENTO 4 COMPLETADO: Frontera eficiente graficada y analizada")

# Recomendaci√≥n final
print(f"\nüéØ RECOMENDACI√ìN FINAL:")
print("=" * 60)

if 'Mi_Eleccion' in portfolios_optimos:
    mi_portfolio = portfolios_optimos['Mi_Eleccion']
    print(f"üíº MI ELECCI√ìN PERSONAL recomendada:")
    print(f"   üìà Rendimiento esperado: {mi_portfolio['rendimiento_neto']:.2%} anual")
    print(f"   üìä Volatilidad: {mi_portfolio['volatilidad']:.2%} anual")
    print(f"   ‚ö° Sharpe Ratio: {mi_portfolio['sharpe_ratio']:.3f}")
    print(f"   üéØ Enfoque: BYMA-centric con diversificaci√≥n sectorial")
    print(f"   ‚úÖ Cumple todas las restricciones regulatorias")

üîß Calculando frontera eficiente con 30 puntos...
üìä Calculando puntos de la frontera...
   üìä Progreso: 10/30 puntos procesados
   üìä Progreso: 20/30 puntos procesados
   üìä Progreso: 30/30 puntos procesados
‚úÖ Frontera calculada: 30 puntos v√°lidos

üìä CARACTER√çSTICAS DE LA FRONTERA EFICIENTE:
   üìà Rendimiento m√≠nimo: 77.07%
   üìà Rendimiento m√°ximo: 89.64%
   üìä Volatilidad m√≠nima: 39.18%
   üìä Volatilidad m√°xima: 46.46%
   ‚ö° Sharpe m√°ximo en frontera: 2.135



üîç AN√ÅLISIS DE LA FRONTERA EFICIENTE:
------------------------------------------------------------
üèÜ MEJOR PORTFOLIO EN LA FRONTERA:
   üìà Rendimiento: 86.61%
   üìä Volatilidad: 40.56%
   ‚ö° Sharpe Ratio: 2.135

üìä COMPARACI√ìN CON PORTFOLIOS OPTIMIZADOS:
   Max_Sharpe: Sharpe diff = +0.002
   Min_Riesgo: Sharpe diff = -0.168
   Mi_Eleccion: Sharpe diff = -0.127

üìã RESUMEN FINAL DE OPTIMIZACI√ìN:
Portfolio            Rendimiento  Volatilidad  Sharpe   Posici√≥n       
------------------------------------------------------------------------------------------
Max_Sharpe               86.90%     40.66%  2.137 EN FRONTERA ‚úÖ  
Min_Riesgo               77.07%     39.18%  1.967 EN FRONTERA ‚úÖ  
Mi_Eleccion              82.02%     40.84%  2.008 INEFICIENTE ‚ùå  
Equiponderado            80.85%     42.39%  1.907 BENCHMARK      
‚úÖ SEGMENTO 4 COMPLETADO: Frontera eficiente graficada y analizada

üéØ RECOMENDACI√ìN FINAL:
üíº MI ELECCI√ìN PERSONAL recomendada:
   üìà Rendi

### Pregunta Critica

Justificar tu elecci√≥n de portfolio considerando tu perfil de riesgo personal, horizonte de inversi√≥n y expectativas macroecon√≥micas. ¬øPor qu√© elegiste ese punto espec√≠fico de la frontera eficiente?

Eleg√≠ mi portfolio personal (35% BYMA) por mi perfil de riesgo moderado-alto y horizonte de largo plazo, apostando a la normalizaci√≥n macro de Argentina.

Aunque no est√° en el punto matem√°tico de m√°ximo Sharpe, se ubica en un equilibrio riesgo-retorno estrat√©gico en la frontera eficiente. Prioriza mi convicci√≥n en BYMA y mantiene una diversificaci√≥n sectorial controlada, alineada con mis expectativas de crecimiento en los sectores financiero y energ√©tico, aceptando una volatilidad un poco mayor por un mejor rendimiento potencial.