# GAIA ‚àû¬≥ Scientific Validation Protocol

Este notebook implementa el protocolo de validaci√≥n cient√≠fica completo para correlaci√≥n LIGO-GAIA.

## Objetivo

Validar si los eventos gravitacionales detectados por LIGO muestran coherencia estad√≠stica con la frecuencia de referencia **f‚ÇÄ = 141.7001 Hz** identificada en el an√°lisis GAIA ‚àû¬≥.

## Protocolo

1. Cargar datos de eventos GWTC-3
2. Test de normalidad (Shapiro-Wilk)
3. Test t de una muestra
4. C√°lculo de umbral din√°mico 3œÉ
5. Conteo de coincidencias
6. Validaci√≥n de criterios cient√≠ficos
7. Visualizaci√≥n y exportaci√≥n

In [None]:
# Imports
import sys
import os
from pathlib import Path

# Add parent directory to path
sys.path.insert(0, os.path.dirname(os.getcwd()))

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
from scipy.stats import shapiro

from scripts.validate_gaia_ligo import GAIALIGOValidator

# Configure matplotlib
plt.style.use('seaborn-v0_8-darkgrid' if 'seaborn-v0_8-darkgrid' in plt.style.available else 'default')
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 11

print("‚úÖ Imports successful")
print(f"Python version: {sys.version}")
print(f"NumPy version: {np.__version__}")
print(f"Pandas version: {pd.__version__}")

## 1. Configuraci√≥n e Inicializaci√≥n

Configuramos los par√°metros del validador:
- **f‚ÇÄ = 141.7001 Hz**: Frecuencia de referencia GAIA ‚àû¬≥
- **œÉ_GAIA = 0.2 Hz**: Resoluci√≥n espectral de GAIA

In [None]:
# Crear validador
validator = GAIALIGOValidator(
    f0=141.7001,      # Frecuencia de referencia GAIA
    sigma_gaia=0.2    # Resoluci√≥n GAIA (Hz)
)

print(f"Validador configurado:")
print(f"  f‚ÇÄ = {validator.f0} Hz")
print(f"  œÉ_GAIA = {validator.sigma_gaia} Hz")

## 2. Carga de Datos GWTC-3

Cargamos muestra de eventos gravitacionales del cat√°logo GWTC-3:

In [None]:
# Cargar datos
eventos = validator.load_gwtc3_sample()

print(f"\nüìä Datos cargados: {len(eventos)} eventos\n")
display(eventos)

# Estad√≠sticas b√°sicas
print(f"\nüìà Estad√≠sticas de Œîf:")
print(eventos['Œîf'].describe())

## 3. Test de Normalidad (Shapiro-Wilk)

Verificamos si la distribuci√≥n de Œîf es aproximadamente normal:

In [None]:
# Test de normalidad
stat, p_norm = validator.test_normality()

print(f"\nüî¨ Test de Normalidad (Shapiro-Wilk):")
print(f"  Estad√≠stico: {stat:.4f}")
print(f"  p-value: {p_norm:.4f}")

if p_norm > 0.05:
    print(f"  ‚úÖ La distribuci√≥n es aproximadamente normal (p > 0.05)")
    print(f"  ‚úÖ El test t es v√°lido")
else:
    print(f"  ‚ö†Ô∏è  La distribuci√≥n puede no ser normal (p < 0.05)")
    print(f"  ‚ö†Ô∏è  Considerar tests no param√©tricos")

# Visualizar distribuci√≥n
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Histograma
axes[0].hist(eventos['Œîf'], bins=10, edgecolor='black', alpha=0.7, color='steelblue')
axes[0].axvline(eventos['Œîf'].mean(), color='red', linestyle='--', linewidth=2, label='Media')
axes[0].set_xlabel('Œîf (Hz)')
axes[0].set_ylabel('Frecuencia')
axes[0].set_title('Distribuci√≥n de Œîf')
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# Q-Q plot
stats.probplot(eventos['Œîf'], dist="norm", plot=axes[1])
axes[1].set_title('Q-Q Plot (Normal)')
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## 4. Test T de Una Muestra

Testeamos si Œîf es significativamente diferente de 0:

In [None]:
# Realizar t-test
ttest_results = validator.perform_ttest()

print(f"\nüî¨ Test T de Una Muestra:")
print(f"  Media Œîf: {ttest_results['mean']:.4f} Hz")
print(f"  Desv. Std: {ttest_results['std']:.4f} Hz")
print(f"  n: {ttest_results['n']}")
print(f"  t-statistic: {ttest_results['t_stat']:.4f}")
print(f"  p-value: {ttest_results['p_value']:.4e}")
print(f"  IC 95%: [{ttest_results['ci95_lower']:.4f}, {ttest_results['ci95_upper']:.4f}]")

if ttest_results['p_value'] < 0.05:
    print(f"\n  ‚úÖ Rechazamos H‚ÇÄ: La media es significativamente diferente de 0")
else:
    print(f"\n  ‚ö†Ô∏è  No rechazamos H‚ÇÄ: No hay evidencia de diferencia significativa")

if ttest_results['ci95_lower'] > 0 or ttest_results['ci95_upper'] < 0:
    print(f"  ‚úÖ El IC 95% no contiene 0: sesgo sistem√°tico detectado")
else:
    print(f"  ‚ö†Ô∏è  El IC 95% contiene 0: no se puede descartar media = 0")

## 5. Umbral Din√°mico 3œÉ

Calculamos el umbral basado en errores combinados LIGO+GAIA:

In [None]:
# Calcular umbral
threshold = validator.compute_dynamic_threshold()

print(f"\nüî¨ Umbral Din√°mico 3œÉ:")
print(f"  œÉ_LIGO: {validator.results['sigma_ligo']:.4f} Hz")
print(f"  œÉ_GAIA: {validator.sigma_gaia:.4f} Hz")
print(f"  œÉ_combinado: {validator.results['sigma_combined']:.4f} Hz")
print(f"  Umbral 3œÉ: {threshold:.4f} Hz")

# Visualizar errores
fig, ax = plt.subplots(figsize=(10, 6))

# Componentes de error
components = ['œÉ_LIGO', 'œÉ_GAIA', 'œÉ_combinado', '3œÉ threshold']
values = [
    validator.results['sigma_ligo'],
    validator.sigma_gaia,
    validator.results['sigma_combined'],
    threshold
]
colors = ['steelblue', 'orange', 'green', 'red']

bars = ax.bar(components, values, color=colors, alpha=0.7, edgecolor='black')
ax.set_ylabel('Error (Hz)')
ax.set_title('Componentes de Error y Umbral 3œÉ')
ax.grid(True, alpha=0.3, axis='y')

# Agregar valores en las barras
for bar, value in zip(bars, values):
    height = bar.get_height()
    ax.text(bar.get_x() + bar.get_width()/2., height,
            f'{value:.4f}',
            ha='center', va='bottom', fontweight='bold')

plt.tight_layout()
plt.show()

## 6. Conteo de Coincidencias

Contamos eventos dentro del umbral 3œÉ:

In [None]:
# Contar coincidencias
coincidence_results = validator.count_coincidences(threshold)

print(f"\nüî¨ Coincidencias GAIA:")
print(f"  Eventos dentro de 3œÉ: {coincidence_results['n_coincidencias']}/{len(eventos)}")
print(f"  Porcentaje: {coincidence_results['porcentaje']:.1f}%")

if coincidence_results['porcentaje'] > 80:
    print(f"  ‚úÖ Alta tasa de coincidencia (> 80%)")
elif coincidence_results['porcentaje'] > 50:
    print(f"  ‚ö†Ô∏è  Tasa moderada de coincidencia (50-80%)")
else:
    print(f"  ‚ùå Baja tasa de coincidencia (< 50%)")

## 7. Visualizaci√≥n Principal

Gr√°fica de Œîf con barras de error y regi√≥n 3œÉ:

In [None]:
# Generar plot principal
validator.plot_validation()
plt.show()

## 8. Validaci√≥n de Criterios Cient√≠ficos

Evaluamos los cuatro criterios del protocolo GAIA ‚àû¬≥:

In [None]:
# Validar criterios
criteria = validator.validate_criteria()

print(f"\nüìä CRITERIOS DE VALIDACI√ìN GAIA ‚àû¬≥:\n")
print(f"  {'‚úÖ' if criteria['p_value_significant'] else '‚ùå'} p-value < 0.05: {criteria['p_value_significant']}")
print(f"  {'‚úÖ' if criteria['ci95_excludes_zero'] else '‚ùå'} IC 95% excluye 0: {criteria['ci95_excludes_zero']}")
print(f"  {'‚úÖ' if criteria['normality_valid'] else '‚ùå'} Normalidad v√°lida (p > 0.05): {criteria['normality_valid']}")
print(f"  {'‚úÖ' if criteria['coincidence_high'] else '‚ùå'} Coincidencia > 80%: {criteria['coincidence_high']}")

# Resumen visual
fig, ax = plt.subplots(figsize=(10, 6))

criterion_names = [
    'p-value < 0.05\n(Significancia)',
    'IC 95% excluye 0\n(Sesgo)',
    'Normalidad v√°lida\n(Metodolog√≠a)',
    'Coincidencia > 80%\n(Coherencia)'
]
criterion_values = list(criteria.values())
colors = ['green' if v else 'red' for v in criterion_values]

bars = ax.barh(criterion_names, [1]*4, color=colors, alpha=0.6, edgecolor='black')
ax.set_xlim(0, 1.5)
ax.set_xlabel('Estado')
ax.set_title('Criterios de Validaci√≥n GAIA ‚àû¬≥', fontsize=14, fontweight='bold')
ax.set_xticks([])

# Agregar texto
for i, (bar, value) in enumerate(zip(bars, criterion_values)):
    text = '‚úÖ CUMPLIDO' if value else '‚ùå NO CUMPLIDO'
    ax.text(0.5, i, text, ha='center', va='center', 
            fontweight='bold', fontsize=11, color='white')

plt.tight_layout()
plt.show()

# Conclusi√≥n
all_passed = all(criteria.values())
print(f"\n{'='*70}")
if all_passed:
    print("‚úÖ TODOS LOS CRITERIOS CUMPLIDOS")
    print("‚úÖ Evidencia de coherencia entre eventos LIGO y GAIA ‚àû¬≥")
else:
    passed = sum(criteria.values())
    total = len(criteria)
    print(f"‚ö†Ô∏è  {passed}/{total} criterios cumplidos")
    print("‚ö†Ô∏è  Se recomienda investigaci√≥n adicional")
print(f"{'='*70}")

## 9. Resumen Estad√≠stico Completo

In [None]:
# Generar resumen
resumen = validator.generate_summary()

print("\nüìä RESUMEN ESTAD√çSTICO COMPLETO:\n")
display(resumen)

# Estilizar el DataFrame para mejor visualizaci√≥n
styled_resumen = resumen.style.set_properties(**{
    'text-align': 'left',
    'font-size': '11pt'
}).set_table_styles([
    {'selector': 'th', 'props': [('font-size', '12pt'), ('font-weight', 'bold')]}
])

display(styled_resumen)

## 10. Exportaci√≥n de Resultados

Exportamos todos los resultados a archivos:

In [None]:
# Exportar resultados
output_dir = 'gaia_validation_results'
validator.export_results(output_dir)

print(f"\n‚úÖ Resultados exportados a: {output_dir}/")
print(f"\nArchivos generados:")
print(f"  - delta_f_eventos_gaia_inf3.csv")
print(f"  - resumen_validacion_gaia_inf3.csv")
print(f"  - validation_results_gaia_inf3.json")

# Mostrar contenido JSON
import json
json_path = Path(output_dir) / 'validation_results_gaia_inf3.json'
with open(json_path, 'r') as f:
    results_json = json.load(f)

print(f"\nüìÑ Contenido JSON (primeras l√≠neas):")
print(json.dumps({
    'f0': results_json['f0'],
    'sigma_gaia': results_json['sigma_gaia'],
    'statistics_summary': {
        k: results_json['statistics'][k] 
        for k in ['mean', 'p_value', 'threshold_3sigma', 'porcentaje_coincidencias']
    },
    'validation_criteria': results_json['validation_criteria']
}, indent=2))

## 11. An√°lisis de Sensibilidad (Opcional)

Exploramos c√≥mo cambian los resultados con diferentes valores de œÉ_GAIA:

In [None]:
# An√°lisis de sensibilidad
sigma_values = [0.1, 0.15, 0.2, 0.25, 0.3]
coincidences = []
thresholds = []

for sigma in sigma_values:
    v = GAIALIGOValidator(f0=141.7001, sigma_gaia=sigma)
    v.load_gwtc3_sample()
    threshold = v.compute_dynamic_threshold()
    result = v.count_coincidences(threshold)
    
    thresholds.append(threshold)
    coincidences.append(result['porcentaje'])

# Visualizar
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 5))

# Umbral vs sigma
ax1.plot(sigma_values, thresholds, 'o-', linewidth=2, markersize=8, color='steelblue')
ax1.set_xlabel('œÉ_GAIA (Hz)')
ax1.set_ylabel('Umbral 3œÉ (Hz)')
ax1.set_title('Sensibilidad del Umbral a œÉ_GAIA')
ax1.grid(True, alpha=0.3)

# Coincidencias vs sigma
ax2.plot(sigma_values, coincidences, 'o-', linewidth=2, markersize=8, color='green')
ax2.axhline(80, color='red', linestyle='--', linewidth=2, label='Umbral 80%')
ax2.set_xlabel('œÉ_GAIA (Hz)')
ax2.set_ylabel('Coincidencias (%)')
ax2.set_title('Sensibilidad de Coincidencias a œÉ_GAIA')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print(f"\nüìä An√°lisis de Sensibilidad:")
for sigma, threshold, coinc in zip(sigma_values, thresholds, coincidences):
    print(f"  œÉ_GAIA = {sigma:.2f} Hz ‚Üí Umbral 3œÉ = {threshold:.4f} Hz ‚Üí Coincidencias = {coinc:.1f}%")

## Conclusi√≥n Cient√≠fica

Bas√°ndose en los resultados anteriores, se puede formular una conclusi√≥n sobre la coherencia entre eventos LIGO y la se√±al GAIA ‚àû¬≥.

### Interpretaci√≥n

Si **todos los criterios** se cumplen:

> **Existe evidencia estad√≠stica significativa de que los eventos gravitacionales detectados por LIGO est√°n modulados por una frecuencia coherente con la se√±al ‚àû¬≥ detectada en GAIA.**

Si **algunos criterios** se cumplen:

> Se observa coherencia parcial que requiere an√°lisis adicional con muestras m√°s grandes o refinamiento metodol√≥gico.

### Referencias

- **GWTC-3**: Gravitational Wave Transient Catalog 3 (LIGO/Virgo)
- **GAIA**: ESA space observatory for astrometry
- **f‚ÇÄ = 141.7001 Hz**: Derived from |Œ∂'(1/2)| √ó œÜ¬≥
- **Protocolo completo**: Ver `docs/GAIA_VALIDATION.md`

In [None]:
# Informaci√≥n final
print("\n" + "="*70)
print("VALIDACI√ìN GAIA ‚àû¬≥ COMPLETADA")
print("="*70)
print(f"\nResultados guardados en: {output_dir}/")
print("\nPara m√°s informaci√≥n:")
print("  - Documentaci√≥n: docs/GAIA_VALIDATION.md")
print("  - Script: scripts/validate_gaia_ligo.py")
print("  - Tests: tests/test_gaia_validation.py")
print("\n‚ú® An√°lisis completado exitosamente ‚ú®")