In [1]:
from pathlib import Path
import pandas as pd
from dotenv import load_dotenv


def find_project_root(marker: str = ".env") -> Path:
    """Busca el marcador (.env) hacia arriba para fijar la ra√≠z del proyecto."""
    current = Path().resolve()
    for parent in [current] + list(current.parents):
        if (parent / marker).exists():
            return parent
    return current


ROOT_PATH = find_project_root()
load_dotenv(ROOT_PATH / ".env")


def get_data_path(relative_path: str | Path) -> str:
    """Devuelve ruta absoluta como str; usa *_sample si el archivo principal no existe."""
    path = Path(relative_path)
    if not path.is_absolute():
        path = ROOT_PATH / path

    if path.exists():
        return str(path)

    sample_path = path.with_name(path.stem + "_sample" + path.suffix)
    if sample_path.exists():
        print(f"‚ö†Ô∏è Usando muestra: {sample_path.name}")
        return str(sample_path)

    raise FileNotFoundError(f"No se encontr√≥ el archivo {path} ni su muestra {sample_path}")


print(f"‚úÖ Ra√≠z detectada: {ROOT_PATH}")

‚úÖ Ra√≠z detectada: /home/els4nchez/Videos/Harmeregildo


## 1Ô∏è‚É£ Importaci√≥n de Librer√≠as y Configuraci√≥n

In [2]:
# Manipulaci√≥n de datos
import pandas as pd
import numpy as np
from pathlib import Path
import json
from datetime import datetime
import warnings
warnings.filterwarnings('ignore')

# Visualizaci√≥n
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.graph_objects as go
import plotly.express as px
from plotly.subplots import make_subplots

# Configuraci√≥n
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette('husl')
pd.set_option('display.max_columns', None)
pd.set_option('display.precision', 4)

print("‚úÖ Librer√≠as importadas correctamente")

‚úÖ Librer√≠as importadas correctamente


In [3]:
# Configurar rutas
BASE_DIR = ROOT_PATH
DATA_DIR = BASE_DIR / 'data'
UNIFICACION_DIR = BASE_DIR / 'unificacion'
DATA_PROCESADO_DIR = UNIFICACION_DIR / 'datos_procesados'
FIGURAS_DIR = UNIFICACION_DIR / 'figuras'
INFORMES_DIR = UNIFICACION_DIR / 'informes'

# Crear directorios si no existen
FIGURAS_DIR.mkdir(parents=True, exist_ok=True)
INFORMES_DIR.mkdir(parents=True, exist_ok=True)

print("üìÇ Directorios configurados")
print(f"   Datos procesados: {DATA_PROCESADO_DIR}")
print(f"   Figuras: {FIGURAS_DIR}")
print(f"   Informes: {INFORMES_DIR}")

üìÇ Directorios configurados
   Datos procesados: /home/els4nchez/Videos/Harmeregildo/unificacion/datos_procesados
   Figuras: /home/els4nchez/Videos/Harmeregildo/unificacion/figuras
   Informes: /home/els4nchez/Videos/Harmeregildo/unificacion/informes


---

## 2Ô∏è‚É£ Carga de Resultados de Notebooks Anteriores

In [4]:
print("üìÇ Cargando resultados de an√°lisis previos...\n")

# 1. Precios del oro (limpio)
df_precios = pd.read_csv(
    get_data_path(DATA_PROCESADO_DIR / 'precios_oro_diario_limpio.csv'),
    index_col=0,
    parse_dates=True
)
print(f"‚úÖ Precios del oro: {df_precios.shape[0]:,} d√≠as")

# 2. Noticias limpias
df_noticias = pd.read_csv(
    get_data_path(DATA_PROCESADO_DIR / 'noticias_oro_limpias.csv'),
    parse_dates=['fecha']
)
print(f"‚úÖ Noticias filtradas: {df_noticias.shape[0]:,} noticias")

# 3. Outliers detectados
df_outliers = pd.read_csv(
    get_data_path(DATA_PROCESADO_DIR / 'outliers_precios_oro.csv'),
    index_col=0,
    parse_dates=True
)
print(f"‚úÖ Outliers detectados: {df_outliers.shape[0]:,} eventos")

# 4. Sentimientos de noticias
df_sentimientos = pd.read_csv(
    get_data_path(DATA_PROCESADO_DIR / 'noticias_oro_con_sentimientos.csv'),
    parse_dates=['fecha']
)
print(f"‚úÖ Sentimientos clasificados: {df_sentimientos.shape[0]:,} noticias")

# 5. Datos integrados
df_integrado = pd.read_csv(
    get_data_path(DATA_PROCESADO_DIR / 'datos_integrados_precios_sentimientos.csv'),
    index_col=0,
    parse_dates=True
)
print(f"‚úÖ Dataset integrado: {df_integrado.shape[0]:,} d√≠as")

# 6. Predicciones LSTM
df_predicciones = pd.read_csv(
    get_data_path(DATA_PROCESADO_DIR / 'predicciones_lstm.csv'),
    parse_dates=['fecha']
)
print(f"‚úÖ Predicciones LSTM: {df_predicciones.shape[0]:,} d√≠as")

print("\n" + "="*80)

üìÇ Cargando resultados de an√°lisis previos...

‚úÖ Precios del oro: 3,614 d√≠as
‚úÖ Noticias filtradas: 18,776 noticias
‚úÖ Outliers detectados: 132 eventos
‚úÖ Sentimientos clasificados: 18,776 noticias
‚úÖ Dataset integrado: 2,273 d√≠as
‚úÖ Predicciones LSTM: 389 d√≠as



In [5]:
# Cargar estad√≠sticas y resultados JSON
print("üìä Cargando estad√≠sticas y m√©tricas...\n")

# Estad√≠sticas de outliers
with open(DATA_PROCESADO_DIR / 'estadisticas_outliers.json', 'r') as f:
    stats_outliers = json.load(f)
print("‚úÖ Estad√≠sticas de outliers cargadas")

# Estad√≠sticas de sentimientos
with open(DATA_PROCESADO_DIR / 'estadisticas_sentimientos.json', 'r') as f:
    stats_sentimientos = json.load(f)
print("‚úÖ Estad√≠sticas de sentimientos cargadas")

# Resultados de correlaci√≥n y causalidad
with open(DATA_PROCESADO_DIR / 'resultados_correlacion_causalidad.json', 'r') as f:
    results_correlacion = json.load(f)
print("‚úÖ Resultados de correlaci√≥n/causalidad cargados")

# Resultados del modelo LSTM
with open(DATA_PROCESADO_DIR / 'resultados_lstm.json', 'r') as f:
    results_lstm = json.load(f)
print("‚úÖ Resultados del modelo LSTM cargados")

print("\n" + "="*80)

üìä Cargando estad√≠sticas y m√©tricas...

‚úÖ Estad√≠sticas de outliers cargadas
‚úÖ Estad√≠sticas de sentimientos cargadas
‚úÖ Resultados de correlaci√≥n/causalidad cargados
‚úÖ Resultados del modelo LSTM cargados



---

## 3Ô∏è‚É£ SECCI√ìN 1: Resumen de Datos

In [6]:
print("\n" + "="*80)
print("üìä TABLA 1: RESUMEN DEL DATASET")
print("="*80 + "\n")

# Crear tabla resumen
tabla_resumen = pd.DataFrame({
    'Dataset': [
        'Precios del Oro (XAU/USD)',
        'Noticias Wall Street Journal',
        'Noticias Filtradas (keywords oro)',
        'Outliers Detectados',
        'Sentimientos Clasificados',
        'Dataset Integrado (Precios + Sentimientos)'
    ],
    'Registros': [
        f"{df_precios.shape[0]:,}",
        "~50,000",  # Aproximado del corpus original
        f"{df_noticias.shape[0]:,}",
        f"{df_outliers.shape[0]:,}",
        f"{df_sentimientos.shape[0]:,}",
        f"{df_integrado.shape[0]:,}"
    ],
    'Per√≠odo': [
        f"{df_precios.index.min().strftime('%Y-%m-%d')} - {df_precios.index.max().strftime('%Y-%m-%d')}",
        "2016-2025",
        f"{df_noticias['fecha'].min().strftime('%Y-%m-%d')} - {df_noticias['fecha'].max().strftime('%Y-%m-%d')}",
        f"{df_outliers.index.min().strftime('%Y-%m-%d')} - {df_outliers.index.max().strftime('%Y-%m-%d')}",
        f"{df_sentimientos['fecha'].min().strftime('%Y-%m-%d')} - {df_sentimientos['fecha'].max().strftime('%Y-%m-%d')}",
        f"{df_integrado.index.min().strftime('%Y-%m-%d')} - {df_integrado.index.max().strftime('%Y-%m-%d')}"
    ],
    'Fuente': [
        'Trading Economics',
        'Wall Street Journal',
        'WSJ (filtrado)',
        'IQR + Z-Score + Isolation Forest',
        'FinBERT (ProsusAI)',
        'Merge temporal'
    ]
})

print(tabla_resumen.to_string(index=False))
print("\n" + "="*80)

# Guardar tabla
tabla_resumen.to_csv(INFORMES_DIR / 'tabla_01_resumen_datos.csv', index=False)
print("\n‚úÖ Tabla guardada: tabla_01_resumen_datos.csv")


üìä TABLA 1: RESUMEN DEL DATASET

                                   Dataset Registros                 Per√≠odo                           Fuente
                 Precios del Oro (XAU/USD)     3,614 2016-01-03 - 2025-11-24                Trading Economics
              Noticias Wall Street Journal   ~50,000               2016-2025              Wall Street Journal
         Noticias Filtradas (keywords oro)    18,776 2016-01-03 - 2025-10-31                   WSJ (filtrado)
                       Outliers Detectados       132 2025-03-13 - 2025-11-24 IQR + Z-Score + Isolation Forest
                 Sentimientos Clasificados    18,776 2016-01-03 - 2025-10-31               FinBERT (ProsusAI)
Dataset Integrado (Precios + Sentimientos)     2,273 2016-01-03 - 2025-10-31                   Merge temporal


‚úÖ Tabla guardada: tabla_01_resumen_datos.csv


In [7]:
# Estad√≠sticas descriptivas del precio del oro
print("\n" + "="*80)
print("üìä TABLA 2: ESTAD√çSTICAS DESCRIPTIVAS - PRECIO DEL ORO")
print("="*80 + "\n")

# Primero verificar qu√© columnas tenemos disponibles
print(f"Columnas en df_precios: {list(df_precios.columns)}")
print(f"Columnas en df_integrado: {list(df_integrado.columns)}\n")

# Usar df_integrado que tiene todas las columnas calculadas
columnas_stats = []
for col in ['Close', 'Returns', 'Volatility_30']:
    if col in df_integrado.columns:
        columnas_stats.append(col)

if columnas_stats:
    stats_precio = df_integrado[columnas_stats].describe().T
    stats_precio['rango'] = stats_precio['max'] - stats_precio['min']
    stats_precio = stats_precio[['count', 'mean', 'std', 'min', '25%', '50%', '75%', 'max', 'rango']]
    
    print(stats_precio.to_string())
    print("\n" + "="*80)
    
    # Guardar
    stats_precio.to_csv(INFORMES_DIR / 'tabla_02_stats_precio_oro.csv')
    print("\n‚úÖ Tabla guardada: tabla_02_stats_precio_oro.csv")
else:
    # Si no hay columnas, usar solo Close de df_precios
    print("‚ö†Ô∏è  Usando solo columna 'Close' de df_precios")
    stats_precio = df_precios[['Close']].describe().T
    stats_precio['rango'] = stats_precio['max'] - stats_precio['min']
    stats_precio = stats_precio[['count', 'mean', 'std', 'min', '25%', '50%', '75%', 'max', 'rango']]
    
    print(stats_precio.to_string())
    print("\n" + "="*80)
    
    stats_precio.to_csv(INFORMES_DIR / 'tabla_02_stats_precio_oro.csv')
    print("\n‚úÖ Tabla guardada: tabla_02_stats_precio_oro.csv")


üìä TABLA 2: ESTAD√çSTICAS DESCRIPTIVAS - PRECIO DEL ORO

Columnas en df_precios: ['Open', 'High', 'Low', 'Close', 'Volume']
Columnas en df_integrado: ['Open', 'High', 'Low', 'Close', 'Volume', 'Returns', 'Volatility_30', 'outlier_iqr', 'z_score', 'outlier_zscore', 'anomaly_score', 'outlier_iforest', 'outlier_count', 'outlier_consensus', 'sentiment_numeric', 'sentiment', 'sentiment_score', 'num_noticias', 'sentiment_ma7', 'sentiment_ma30', 'sentiment_extreme', 'has_outlier', 'outlier_AND_extreme_sentiment']

                count       mean       std        min        25%        50%        75%        max      rango
Close          2273.0  1840.2673  671.5740  1063.0590  1289.5810  1739.8180  2005.6080  4365.2250  3302.1660
Returns        2272.0     0.0006    0.0081    -0.0633    -0.0027     0.0000     0.0037     0.0472     0.1105
Volatility_30  2252.0    11.2176    4.4638     0.0000     8.3212    10.4034    13.1552    34.7693    34.7693


‚úÖ Tabla guardada: tabla_02_stats_precio_oro.

---

## 4Ô∏è‚É£ SECCI√ìN 2: An√°lisis de Sentimientos

In [8]:
print("\n" + "="*80)
print("üìä TABLA 3: DISTRIBUCI√ìN DE SENTIMIENTOS")
print("="*80 + "\n")

# Distribuci√≥n de sentimientos (la columna es 'sentiment_label', no 'sentimiento')
dist_sentimientos = df_sentimientos['sentiment_label'].value_counts().sort_index()
dist_sentimientos_pct = (dist_sentimientos / dist_sentimientos.sum() * 100).round(2)

tabla_sentimientos = pd.DataFrame({
    'Sentimiento': dist_sentimientos.index,
    'Frecuencia': dist_sentimientos.values,
    'Porcentaje': dist_sentimientos_pct.values
})

print(tabla_sentimientos.to_string(index=False))
print("\n" + "="*80)

# Guardar
tabla_sentimientos.to_csv(INFORMES_DIR / 'tabla_03_distribucion_sentimientos.csv', index=False)
print("\n‚úÖ Tabla guardada: tabla_03_distribucion_sentimientos.csv")


üìä TABLA 3: DISTRIBUCI√ìN DE SENTIMIENTOS

Sentimiento  Frecuencia  Porcentaje
   negative        6684       35.60
    neutral        8007       42.64
   positive        4085       21.76


‚úÖ Tabla guardada: tabla_03_distribucion_sentimientos.csv


In [9]:
# Gr√°fico de barras de sentimientos
fig = go.Figure()

colores = {'Negativo': 'red', 'Neutral': 'gray', 'Positivo': 'green', 'negative': 'red', 'neutral': 'gray', 'positive': 'green'}

fig.add_trace(go.Bar(
    x=tabla_sentimientos['Sentimiento'],
    y=tabla_sentimientos['Frecuencia'],
    marker_color=[colores.get(s, 'blue') for s in tabla_sentimientos['Sentimiento']],
    text=tabla_sentimientos['Porcentaje'],
    texttemplate='%{text:.1f}%',
    textposition='outside'
))

fig.update_layout(
    title='üìä Distribuci√≥n de Sentimientos en Noticias sobre Oro (FinBERT)',
    xaxis_title='Sentimiento',
    yaxis_title='Frecuencia',
    template='plotly_white',
    height=500
)

fig.show()

# Guardar figura
fig.write_html(FIGURAS_DIR / 'figura_01_distribucion_sentimientos.html')
print("‚úÖ Figura guardada: figura_01_distribucion_sentimientos.html")

‚úÖ Figura guardada: figura_01_distribucion_sentimientos.html


---

## 5Ô∏è‚É£ SECCI√ìN 3: Detecci√≥n de Anomal√≠as

In [10]:
print("\n" + "="*80)
print("üìä TABLA 4: RESUMEN DE DETECCI√ìN DE ANOMAL√çAS")
print("="*80 + "\n")

# Resumen de m√©todos de detecci√≥n
tabla_outliers = pd.DataFrame({
    'M√©todo': ['IQR', 'Z-Score', 'Isolation Forest', 'Consenso (2+ m√©todos)'],
    'Outliers Detectados': [
        stats_outliers.get('metodos', {}).get('iqr', {}).get('total', 0),
        stats_outliers.get('metodos', {}).get('zscore', {}).get('total', 0),
        stats_outliers.get('metodos', {}).get('isolation_forest', {}).get('total', 0),
        stats_outliers.get('consenso', {}).get('total', 0)
    ],
    'Porcentaje del Total': [
        f"{stats_outliers.get('metodos', {}).get('iqr', {}).get('porcentaje', 0):.2f}%",
        f"{stats_outliers.get('metodos', {}).get('zscore', {}).get('porcentaje', 0):.2f}%",
        f"{stats_outliers.get('metodos', {}).get('isolation_forest', {}).get('porcentaje', 0):.2f}%",
        f"{stats_outliers.get('consenso', {}).get('porcentaje', 0):.2f}%"
    ],
    'Descripci√≥n': [
        'Rango intercuart√≠lico (Q1-1.5*IQR, Q3+1.5*IQR)',
        'Desviaci√≥n est√°ndar (|z| > 3)',
        'Aprendizaje no supervisado (contamination=0.05)',
        'Detectado por al menos 2 m√©todos'
    ]
})

print(tabla_outliers.to_string(index=False))
print("\n" + "="*80)

# Guardar
tabla_outliers.to_csv(INFORMES_DIR / 'tabla_04_deteccion_anomalias.csv', index=False)
print("\n‚úÖ Tabla guardada: tabla_04_deteccion_anomalias.csv")


üìä TABLA 4: RESUMEN DE DETECCI√ìN DE ANOMAL√çAS

               M√©todo  Outliers Detectados Porcentaje del Total                                     Descripci√≥n
                  IQR                    0                0.00%  Rango intercuart√≠lico (Q1-1.5*IQR, Q3+1.5*IQR)
              Z-Score                    0                0.00%                   Desviaci√≥n est√°ndar (|z| > 3)
     Isolation Forest                    0                0.00% Aprendizaje no supervisado (contamination=0.05)
Consenso (2+ m√©todos)                    0                3.65%                Detectado por al menos 2 m√©todos


‚úÖ Tabla guardada: tabla_04_deteccion_anomalias.csv


---

## 6Ô∏è‚É£ SECCI√ìN 4: Correlaci√≥n y Causalidad

In [11]:
print("\n" + "="*80)
print("üìä TABLA 5: CORRELACIONES - SENTIMIENTO vs VARIABLES DE PRECIO")
print("="*80 + "\n")

# Extraer correlaciones
correlaciones = results_correlacion.get('correlaciones_detalladas', {})

tabla_corr = []
for key, valores in correlaciones.items():
    partes = key.split('_vs_')
    if len(partes) == 2:
        tabla_corr.append({
            'Variable Sentimiento': partes[0],
            'Variable Precio': partes[1],
            'Pearson r': f"{valores['pearson_r']:.4f}",
            'Pearson p-value': f"{valores['pearson_p']:.4f}",
            'Spearman œÅ': f"{valores['spearman_r']:.4f}",
            'Spearman p-value': f"{valores['spearman_p']:.4f}",
            'Significativo': '‚úÖ' if valores['pearson_p'] < 0.05 else '‚ùå'
        })

df_corr = pd.DataFrame(tabla_corr)
print(df_corr.to_string(index=False))
print("\n" + "="*80)

# Guardar
df_corr.to_csv(INFORMES_DIR / 'tabla_05_correlaciones.csv', index=False)
print("\n‚úÖ Tabla guardada: tabla_05_correlaciones.csv")


üìä TABLA 5: CORRELACIONES - SENTIMIENTO vs VARIABLES DE PRECIO

Variable Sentimiento Variable Precio Pearson r Pearson p-value Spearman œÅ Spearman p-value Significativo
           sentiment           Close   -0.0612          0.0035    -0.0564           0.0072             ‚úÖ
           sentiment         Returns    0.0057          0.7857     0.0064           0.7604             ‚ùå
           sentiment   Volatility_30   -0.0251          0.2343    -0.0280           0.1839             ‚ùå
       sentiment_ma7           Close   -0.1559          0.0000    -0.1595           0.0000             ‚úÖ
       sentiment_ma7         Returns    0.0036          0.8655     0.0096           0.6493             ‚ùå
       sentiment_ma7   Volatility_30   -0.0665          0.0016    -0.0476           0.0239             ‚úÖ
      sentiment_ma30           Close   -0.2688          0.0000    -0.3015           0.0000             ‚úÖ
      sentiment_ma30         Returns   -0.0152          0.4706    -0.0134     

In [12]:
print("\n" + "="*80)
print("üìä TABLA 6: RESULTADOS TEST DE GRANGER CAUSALITY")
print("="*80 + "\n")

granger_sent_ret = results_correlacion.get('granger_causality', {}).get('sentimiento_a_retornos', [])

if granger_sent_ret:
    tabla_granger = pd.DataFrame(granger_sent_ret)
    tabla_granger['p_value'] = tabla_granger['p_value'].apply(lambda x: f"{x:.4f}")
    
    print("Direcci√≥n: Sentimiento ‚Üí Retornos")
    print(tabla_granger.to_string(index=False))
    
    min_p = results_correlacion.get('granger_causality', {}).get('min_p_value', 1.0)
    resultado = 'RECHAZA H0' if min_p < 0.05 else 'NO RECHAZA H0'
    print(f"\nResultado: {resultado} (p={min_p:.4f})")
    
    if min_p < 0.05:
        print("Interpretaci√≥n: El sentimiento tiene capacidad predictiva sobre los retornos del oro.")
    else:
        print("Interpretaci√≥n: No hay evidencia de causalidad Granger significativa.")
    
    pd.DataFrame(granger_sent_ret).to_csv(INFORMES_DIR / 'tabla_06_granger_causality.csv', index=False)
    print("\nTabla guardada: tabla_06_granger_causality.csv")
else:
    print("No se encontraron resultados de Granger Causality")

print("\n" + "="*80)


üìä TABLA 6: RESULTADOS TEST DE GRANGER CAUSALITY

Direcci√≥n: Sentimiento ‚Üí Retornos
 lag p_value significativo
   1  0.4880            NO
   2  0.1762            NO
   3  0.3020            NO
   4  0.2960            NO
   5  0.0865            NO

Resultado: NO RECHAZA H0 (p=0.0865)
Interpretaci√≥n: No hay evidencia de causalidad Granger significativa.

Tabla guardada: tabla_06_granger_causality.csv



---

## 7Ô∏è‚É£ SECCI√ìN 5: Modelos Predictivos (LSTM)

In [13]:
print("\n" + "="*80)
print("üìä TABLA 7: COMPARACI√ìN DE MODELOS LSTM")
print("="*80 + "\n")

# Extraer m√©tricas de ambos modelos
metricas_base = results_lstm['metricas_test']['base']
metricas_sent = results_lstm['metricas_test']['sentiment']
mejora = results_lstm['metricas_test']['mejora_porcentual']

tabla_modelos = pd.DataFrame({
    'Modelo': ['LSTM Base (sin sentimiento)', 'LSTM + Sentimiento'],
    'Features': [
        f"{len(results_lstm['configuracion']['features_base'])} vars",
        f"{len(results_lstm['configuracion']['features_sentiment'])} vars"
    ],
    'RMSE': [
        f"${metricas_base['RMSE']:.2f}",
        f"${metricas_sent['RMSE']:.2f}"
    ],
    'MAE': [
        f"${metricas_base['MAE']:.2f}",
        f"${metricas_sent['MAE']:.2f}"
    ],
    'R¬≤': [
        f"{metricas_base['R¬≤']:.4f}",
        f"{metricas_sent['R¬≤']:.4f}"
    ],
    'MAPE': [
        f"{metricas_base['MAPE']:.2f}%",
        f"{metricas_sent['MAPE']:.2f}%"
    ]
})

print(tabla_modelos.to_string(index=False))

print("\n" + "-"*80)
print("üéØ MEJORA CON SENTIMIENTO:")
print(f"   RMSE: {mejora['rmse']:+.2f}%")
print(f"   MAE:  {mejora['mae']:+.2f}%")
print(f"   R¬≤:   {mejora['r2']:+.2f}%")
print("="*80)

# Guardar
tabla_modelos.to_csv(INFORMES_DIR / 'tabla_07_comparacion_modelos_lstm.csv', index=False)
print("\n‚úÖ Tabla guardada: tabla_07_comparacion_modelos_lstm.csv")


üìä TABLA 7: COMPARACI√ìN DE MODELOS LSTM

                     Modelo Features    RMSE     MAE      R¬≤   MAPE
LSTM Base (sin sentimiento)   6 vars $524.01 $453.63 -0.7065 14.14%
         LSTM + Sentimiento   9 vars $555.55 $486.24 -0.9181 15.20%

--------------------------------------------------------------------------------
üéØ MEJORA CON SENTIMIENTO:
   RMSE: -6.02%
   MAE:  -7.19%
   R¬≤:   -29.95%

‚úÖ Tabla guardada: tabla_07_comparacion_modelos_lstm.csv


In [14]:
# Gr√°fico comparativo de predicciones
fig = go.Figure()

# Valores reales
fig.add_trace(go.Scatter(
    x=df_predicciones['fecha'],
    y=df_predicciones['precio_real'],
    mode='lines',
    name='Precio Real',
    line=dict(color='black', width=2)
))

# Modelo Base
fig.add_trace(go.Scatter(
    x=df_predicciones['fecha'],
    y=df_predicciones['pred_base'],
    mode='lines',
    name='LSTM Base',
    line=dict(color='blue', width=1.5, dash='dash')
))

# Modelo con Sentimiento
fig.add_trace(go.Scatter(
    x=df_predicciones['fecha'],
    y=df_predicciones['pred_sentiment'],
    mode='lines',
    name='LSTM + Sentimiento',
    line=dict(color='red', width=1.5, dash='dot')
))

fig.update_layout(
    title='üìà Comparaci√≥n de Predicciones: LSTM Base vs LSTM + Sentimiento',
    xaxis_title='Fecha',
    yaxis_title='Precio del Oro (USD)',
    template='plotly_white',
    height=600,
    hovermode='x unified'
)

fig.show()

# Guardar
fig.write_html(FIGURAS_DIR / 'figura_02_comparacion_predicciones_lstm.html')
print("‚úÖ Figura guardada: figura_02_comparacion_predicciones_lstm.html")

‚úÖ Figura guardada: figura_02_comparacion_predicciones_lstm.html


---

## 8Ô∏è‚É£ SECCI√ìN 6: An√°lisis de Errores

In [15]:
print("\n" + "="*80)
print("üìä TABLA 8: ESTAD√çSTICAS DE ERRORES DE PREDICCI√ìN")
print("="*80 + "\n")

# Calcular estad√≠sticas de errores
tabla_errores = pd.DataFrame({
    'Modelo': ['LSTM Base', 'LSTM + Sentimiento'],
    'Error Medio': [
        f"{df_predicciones['error_base'].mean():.2f}",
        f"{df_predicciones['error_sentiment'].mean():.2f}"
    ],
    'Desv. Est√°ndar': [
        f"{df_predicciones['error_base'].std():.2f}",
        f"{df_predicciones['error_sentiment'].std():.2f}"
    ],
    'Error M√≠nimo': [
        f"{df_predicciones['error_base'].min():.2f}",
        f"{df_predicciones['error_sentiment'].min():.2f}"
    ],
    'Error M√°ximo': [
        f"{df_predicciones['error_base'].max():.2f}",
        f"{df_predicciones['error_sentiment'].max():.2f}"
    ],
    'Error Abs. Medio': [
        f"{df_predicciones['error_base'].abs().mean():.2f}",
        f"{df_predicciones['error_sentiment'].abs().mean():.2f}"
    ]
})

print(tabla_errores.to_string(index=False))
print("\n" + "="*80)

# Guardar
tabla_errores.to_csv(INFORMES_DIR / 'tabla_08_estadisticas_errores.csv', index=False)
print("\n‚úÖ Tabla guardada: tabla_08_estadisticas_errores.csv")


üìä TABLA 8: ESTAD√çSTICAS DE ERRORES DE PREDICCI√ìN

            Modelo Error Medio Desv. Est√°ndar Error M√≠nimo Error M√°ximo Error Abs. Medio
         LSTM Base      453.63         262.65        71.41      1308.62           453.63
LSTM + Sentimiento      486.24         269.06        82.54      1360.03           486.24


‚úÖ Tabla guardada: tabla_08_estadisticas_errores.csv


---

## 9Ô∏è‚É£ SECCI√ìN 7: Conclusiones y Hallazgos Principales

In [16]:
# Generar resumen ejecutivo completo
print("""
‚ïî‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïó
‚ïë                   üìä RESUMEN EJECUTIVO FINAL                           ‚ïë
‚ï†‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï£
‚ïë                                                                        ‚ïë
‚ïë  PROYECTO: Predicci√≥n de Precios del Oro con An√°lisis de Sentimientos ‚ïë
‚ïë                                                                        ‚ïë
‚ï†‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï£
‚ïë                                                                        ‚ïë
‚ïë  1Ô∏è‚É£  DATOS PROCESADOS                                                  ‚ïë
‚ïë                                                                        ‚ïë
""")

print(f"‚ïë     ‚Ä¢ Precios del oro: {df_precios.shape[0]:,} d√≠as                                    ‚ïë")
print(f"‚ïë     ‚Ä¢ Noticias analizadas: {df_sentimientos.shape[0]:,}                                 ‚ïë")
print(f"‚ïë     ‚Ä¢ Outliers detectados: {df_outliers.shape[0]:,}                                     ‚ïë")
print(f"‚ïë     ‚Ä¢ Dataset integrado: {df_integrado.shape[0]:,} d√≠as                                 ‚ïë")

print("""
‚ïë                                                                        ‚ïë
‚ïë  2Ô∏è‚É£  AN√ÅLISIS DE SENTIMIENTOS                                          ‚ïë
‚ïë                                                                        ‚ïë
""")

dist_sent = df_sentimientos['sentiment_label'].value_counts(normalize=True) * 100
for sent in ['positive', 'neutral', 'negative']:
    if sent in dist_sent.index:
        print(f"‚ïë     ‚Ä¢ {sent.capitalize():10s}: {dist_sent[sent]:5.1f}%                                            ‚ïë")

print("""
‚ïë                                                                        ‚ïë
‚ïë  3Ô∏è‚É£  CORRELACI√ìN Y CAUSALIDAD                                          ‚ïë
‚ïë                                                                        ‚ïë
""")

lag_optimo = results_correlacion.get('lag_analysis', {}).get('lag_optimo', 0)
corr_optima = results_correlacion.get('lag_analysis', {}).get('correlacion_optima', 0)

print(f"‚ïë     ‚Ä¢ Lag √≥ptimo: {lag_optimo} d√≠as                                             ‚ïë")
print(f"‚ïë     ‚Ä¢ Correlaci√≥n en lag √≥ptimo: {corr_optima:+.4f}                          ‚ïë")

if 'granger_causality' in results_correlacion:
    min_p_granger = results_correlacion['granger_causality'].get('min_p_value', 1.0)
    granger_result = "‚úÖ SIGNIFICATIVO" if min_p_granger < 0.05 else "‚ùå NO SIGNIFICATIVO"
    print(f"‚ïë     ‚Ä¢ Test de Granger: {granger_result:30s}             ‚ïë")

print("""
‚ïë                                                                        ‚ïë
‚ïë  4Ô∏è‚É£  MODELOS LSTM                                                      ‚ïë
‚ïë                                                                        ‚ïë
""")

print(f"‚ïë     üìä LSTM Base (sin sentimiento):                                ‚ïë")
print(f"‚ïë        RMSE: ${metricas_base['RMSE']:7.2f}                                         ‚ïë")
print(f"‚ïë        MAE:  ${metricas_base['MAE']:7.2f}                                         ‚ïë")
print(f"‚ïë        R¬≤:   {metricas_base['R¬≤']:7.4f}                                         ‚ïë")
print("‚ïë                                                                        ‚ïë")
print(f"‚ïë     üìä LSTM + Sentimiento:                                         ‚ïë")
print(f"‚ïë        RMSE: ${metricas_sent['RMSE']:7.2f}                                         ‚ïë")
print(f"‚ïë        MAE:  ${metricas_sent['MAE']:7.2f}                                         ‚ïë")
print(f"‚ïë        R¬≤:   {metricas_sent['R¬≤']:7.4f}                                         ‚ïë")
print("‚ïë                                                                        ‚ïë")
print(f"‚ïë     üéØ Mejora con sentimiento:                                     ‚ïë")
print(f"‚ïë        RMSE: {mejora['rmse']:+6.2f}%                                              ‚ïë")
print(f"‚ïë        MAE:  {mejora['mae']:+6.2f}%                                              ‚ïë")
print(f"‚ïë        R¬≤:   {mejora['r2']:+6.2f}%                                              ‚ïë")

print("""
‚ïë                                                                        ‚ïë
‚ï†‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï£
‚ïë                     üí° CONCLUSIONES PRINCIPALES                        ‚ïë
‚ï†‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï£
‚ïë                                                                        ‚ïë
""")

# Conclusi√≥n 1: Sobre el sentimiento
if mejora['rmse'] > 0 and mejora['mae'] > 0:
    print("‚ïë  ‚úÖ El an√°lisis de sentimientos MEJORA las predicciones del LSTM      ‚ïë")
    print("‚ïë     El sentimiento de noticias tiene valor predictivo para el oro.   ‚ïë")
elif mejora['rmse'] > -2:
    print("‚ïë  ‚ö†Ô∏è  El an√°lisis de sentimientos muestra mejora moderada             ‚ïë")
    print("‚ïë     El sentimiento aporta informaci√≥n complementaria.                ‚ïë")
else:
    print("‚ïë  ‚ùå El an√°lisis de sentimientos NO mejora significativamente          ‚ïë")
    print("‚ïë     Los indicadores t√©cnicos son suficientes para este caso.        ‚ïë")

print("‚ïë                                                                        ‚ïë")

# Conclusi√≥n 2: Sobre causalidad
if 'granger_causality' in results_correlacion and results_correlacion['granger_causality'].get('min_p_value', 1.0) < 0.05:
    print("‚ïë  ‚úÖ Existe causalidad Granger: sentimiento ‚Üí retornos                 ‚ïë")
    print("‚ïë     Las noticias tienen capacidad predictiva sobre los precios.      ‚ïë")
else:
    print("‚ïë  ‚ö†Ô∏è  No se encontr√≥ causalidad Granger significativa                  ‚ïë")
    print("‚ïë     La relaci√≥n puede ser contempor√°nea, no predictiva.              ‚ïë")

print("""
‚ïë                                                                        ‚ïë
‚ï†‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï£
‚ïë                     üîÆ TRABAJO FUTURO                                  ‚ïë
‚ï†‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï£
‚ïë                                                                        ‚ïë
‚ïë  1. Incorporar m√°s fuentes de noticias (Reuters, Bloomberg)           ‚ïë
‚ïë  2. An√°lisis de contenido completo (no solo t√≠tulos)                  ‚ïë
‚ïë  3. Modelos m√°s complejos (Transformers, Attention mechanisms)        ‚ïë
‚ïë  4. Features adicionales (indicadores macroecon√≥micos, FED)           ‚ïë
‚ïë  5. An√°lisis de t√≥picos (LDA, NMF)                                    ‚ïë
‚ïë  6. Predicci√≥n de volatilidad, no solo precio                         ‚ïë
‚ïë  7. Trading strategy basada en se√±ales de sentimiento                 ‚ïë
‚ïë                                                                        ‚ïë
‚ïö‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïù
""")


‚ïî‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïó
‚ïë                   üìä RESUMEN EJECUTIVO FINAL                           ‚ïë
‚ï†‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï£
‚ïë                                                                        ‚ïë
‚ïë  PROYECTO: Predicci√≥n de Precios del Oro con An√°lisis de Sentimientos ‚ïë
‚ïë                                                                        ‚ïë
‚ï†‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï£
‚ïë        

---

## üîü Exportaci√≥n de Resumen Ejecutivo

In [17]:
# Crear documento de resumen ejecutivo
resumen_ejecutivo = f"""
# RESUMEN EJECUTIVO
## Predicci√≥n de Precios del Oro con An√°lisis de Sentimientos de Noticias

**Fecha:** {datetime.now().strftime('%Y-%m-%d')}
**Equipo:** An√°lisis de Datos - Proyecto Oro

---

## 1. DATOS PROCESADOS

- **Precios del oro:** {df_precios.shape[0]:,} d√≠as ({df_precios.index.min().strftime('%Y-%m-%d')} a {df_precios.index.max().strftime('%Y-%m-%d')})
- **Noticias analizadas:** {df_sentimientos.shape[0]:,} art√≠culos del Wall Street Journal
- **Outliers detectados:** {df_outliers.shape[0]:,} eventos an√≥malos en precios
- **Dataset integrado:** {df_integrado.shape[0]:,} d√≠as con precios y sentimientos

## 2. METODOLOG√çA

### 2.1 An√°lisis de Sentimientos
- **Modelo:** FinBERT (ProsusAI/finbert)
- **Clasificaci√≥n:** Positivo, Neutral, Negativo
- **Distribuci√≥n:**
  - Positivo: {dist_sent.get('Positivo', 0):.1f}%
  - Neutral: {dist_sent.get('Neutral', 0):.1f}%
  - Negativo: {dist_sent.get('Negativo', 0):.1f}%

### 2.2 Detecci√≥n de Anomal√≠as
- **M√©todos:** IQR, Z-Score, Isolation Forest
- **Consenso:** Outliers detectados por ‚â•2 m√©todos

### 2.3 Modelos LSTM
- **Arquitectura:** 256-128-64 units, dropout 0.2
- **Secuencias:** {results_lstm['configuracion']['seq_length']} d√≠as lookback
- **Divisi√≥n:** 60% train / 20% val / 20% test

## 3. RESULTADOS PRINCIPALES

### 3.1 Correlaci√≥n y Causalidad
- **Lag √≥ptimo:** {lag_optimo} d√≠as
- **Correlaci√≥n m√°xima:** {corr_optima:+.4f}
- **Test de Granger:** {'SIGNIFICATIVO (p<0.05)' if results_correlacion.get('granger_causality', {}).get('min_p_value', 1.0) < 0.05 else 'NO SIGNIFICATIVO'}

### 3.2 Performance de Modelos

**LSTM Base (sin sentimiento):**
- RMSE: ${metricas_base['RMSE']:.2f}
- MAE: ${metricas_base['MAE']:.2f}
- R¬≤: {metricas_base['R¬≤']:.4f}

**LSTM + Sentimiento:**
- RMSE: ${metricas_sent['RMSE']:.2f}
- MAE: ${metricas_sent['MAE']:.2f}
- R¬≤: {metricas_sent['R¬≤']:.4f}

**Mejora con sentimiento:**
- RMSE: {mejora['rmse']:+.2f}%
- MAE: {mejora['mae']:+.2f}%
- R¬≤: {mejora['r2']:+.2f}%

## 4. CONCLUSIONES

1. **Valor predictivo del sentimiento:** {'El an√°lisis de sentimientos MEJORA las predicciones.' if mejora['rmse'] > 0 else 'El sentimiento NO mejora significativamente las predicciones.'}

2. **Causalidad:** {'Existe evidencia de causalidad Granger (sentimiento ‚Üí retornos).' if results_correlacion.get('granger_causality', {}).get('min_p_value', 1.0) < 0.05 else 'No se encontr√≥ causalidad Granger significativa.'}

3. **Anomal√≠as:** Se detectaron {df_outliers.shape[0]} eventos an√≥malos en el precio del oro, algunos coincidentes con noticias de sentimiento extremo.

## 5. TRABAJO FUTURO

- Incorporar m√°s fuentes de noticias (Reuters, Bloomberg)
- Analizar contenido completo de art√≠culos
- Modelos m√°s sofisticados (Transformers)
- Indicadores macroecon√≥micos adicionales
- Estrategias de trading basadas en sentimiento

---

**Archivos generados:**
- 8 tablas de resultados (CSV)
- 2 figuras principales (HTML + PNG)
- Modelos entrenados (Keras .keras)
- Datasets procesados (CSV)
"""

# Guardar resumen ejecutivo
with open(INFORMES_DIR / 'RESUMEN_EJECUTIVO_FINAL.md', 'w', encoding='utf-8') as f:
    f.write(resumen_ejecutivo)

print("‚úÖ Resumen ejecutivo guardado: RESUMEN_EJECUTIVO_FINAL.md")
print(f"\nüìÇ Todos los archivos guardados en:")
print(f"   - Tablas: {INFORMES_DIR}")
print(f"   - Figuras: {FIGURAS_DIR}")

‚úÖ Resumen ejecutivo guardado: RESUMEN_EJECUTIVO_FINAL.md

üìÇ Todos los archivos guardados en:
   - Tablas: /home/els4nchez/Videos/Harmeregildo/unificacion/informes
   - Figuras: /home/els4nchez/Videos/Harmeregildo/unificacion/figuras


---

## 1Ô∏è‚É£1Ô∏è‚É£ Lista de Archivos Generados

In [18]:
print("""
‚ïî‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïó
‚ïë              üìÇ ARCHIVOS GENERADOS - PROYECTO COMPLETO                 ‚ïë
‚ï†‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï£
‚ïë                                                                        ‚ïë
‚ïë  üìä TABLAS (CSV):                                                      ‚ïë
‚ïë                                                                        ‚ïë
‚ïë     1. tabla_01_resumen_datos.csv                                     ‚ïë
‚ïë     2. tabla_02_stats_precio_oro.csv                                  ‚ïë
‚ïë     3. tabla_03_distribucion_sentimientos.csv                         ‚ïë
‚ïë     4. tabla_04_deteccion_anomalias.csv                               ‚ïë
‚ïë     5. tabla_05_correlaciones.csv                                     ‚ïë
‚ïë     6. tabla_06_granger_causality.csv                                 ‚ïë
‚ïë     7. tabla_07_comparacion_modelos_lstm.csv                          ‚ïë
‚ïë     8. tabla_08_estadisticas_errores.csv                              ‚ïë
‚ïë                                                                        ‚ïë
‚ïë  üìà FIGURAS (HTML + PNG):                                              ‚ïë
‚ïë                                                                        ‚ïë
‚ïë     1. figura_01_distribucion_sentimientos                            ‚ïë
‚ïë     2. figura_02_comparacion_predicciones_lstm                        ‚ïë
‚ïë                                                                        ‚ïë
‚ïë  üìÑ DOCUMENTOS:                                                        ‚ïë
‚ïë                                                                        ‚ïë
‚ïë     ‚Ä¢ RESUMEN_EJECUTIVO_FINAL.md                                      ‚ïë
‚ïë     ‚Ä¢ INFORME_CIENTIFICO_PRINCIPAL.md                                 ‚ïë
‚ïë     ‚Ä¢ RESUMEN_EJECUTIVO.md                                            ‚ïë
‚ïë                                                                        ‚ïë
‚ïë  ü§ñ MODELOS:                                                           ‚ïë
‚ïë                                                                        ‚ïë
‚ïë     ‚Ä¢ lstm_base_final.keras                                           ‚ïë
‚ïë     ‚Ä¢ lstm_sentiment_final.keras                                      ‚ïë
‚ïë                                                                        ‚ïë
‚ïë  üíæ DATASETS PROCESADOS:                                               ‚ïë
‚ïë                                                                        ‚ïë
‚ïë     ‚Ä¢ precios_oro_diario_limpio.csv                                   ‚ïë
‚ïë     ‚Ä¢ noticias_oro_limpias.csv                                        ‚ïë
‚ïë     ‚Ä¢ noticias_oro_con_sentimientos.csv                               ‚ïë
‚ïë     ‚Ä¢ sentimientos_diarios.csv                                        ‚ïë
‚ïë     ‚Ä¢ outliers_precios_oro.csv                                        ‚ïë
‚ïë     ‚Ä¢ datos_integrados_precios_sentimientos.csv                       ‚ïë
‚ïë     ‚Ä¢ predicciones_lstm.csv                                           ‚ïë
‚ïë                                                                        ‚ïë
‚ïë  üìì NOTEBOOKS:                                                         ‚ïë
‚ïë                                                                        ‚ïë
‚ïë     01. Introducci√≥n y Carga de Datos                                 ‚ïë
‚ïë     02. EDA Precios del Oro                                           ‚ïë
‚ïë     03. EDA Noticias WSJ                                              ‚ïë
‚ïë     04. Detecci√≥n de Anomal√≠as                                        ‚ïë
‚ïë     05. An√°lisis de Sentimientos (FinBERT)                            ‚ïë
‚ïë     06. Correlaci√≥n y Causalidad                                      ‚ïë
‚ïë     07. Modelo LSTM Integrado                                         ‚ïë
‚ïë     08. S√≠ntesis y Resultados (ESTE NOTEBOOK)                         ‚ïë
‚ïë                                                                        ‚ïë
‚ïö‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïù

‚úÖ PROYECTO COMPLETADO EXITOSAMENTE

üìä 8 notebooks ejecutables
üìà 8 tablas de resultados
üé® 2 figuras principales
ü§ñ 2 modelos LSTM entrenados
üíæ 7 datasets procesados
üìÑ 3 documentos de informe

üéØ LISTO PARA PUBLICACI√ìN CIENT√çFICA
""")


‚ïî‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïó
‚ïë              üìÇ ARCHIVOS GENERADOS - PROYECTO COMPLETO                 ‚ïë
‚ï†‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ï£
‚ïë                                                                        ‚ïë
‚ïë  üìä TABLAS (CSV):                                                      ‚ïë
‚ïë                                                                        ‚ïë
‚ïë     1. tabla_01_resumen_datos.csv                                     ‚ïë
‚ïë     2. tabla_02_stats_precio_oro.csv                                  ‚ïë
‚ïë     3. tabla_03_distribucion_sentimientos.csv                         ‚ïë