# üîç Fase 1: Revisi√≥n de la Anomal√≠a Global ID 134

In [27]:
import os
double_check_path = r"C:\Users\JMGY-\Documents\Advance-data-analitic\5.5 PROYECTO NASA\DATA\ESA-Mission2\ESA-Mission2"
print("Archivos en ESA-Mission2/ESA-Mission2:", os.listdir(double_check_path))

Archivos en ESA-Mission2/ESA-Mission2: ['anomaly_types.csv', 'channels', 'channels.csv', 'events.csv', 'labels.csv', 'telecommands', 'telecommands.csv']


In [None]:
from load_data import load_mission_data

# Carga los datos (la funci√≥n ahora buscar√° en la ruta correcta)
try:
    df = load_mission_data('ESA-Mission2', date_range=('2009-05-01', '2009-07-30'))
    print("‚úÖ Datos cargados correctamente!")
    print(f"Registros: {len(df)} | Columnas: {df.columns.tolist()}")
except Exception as e:
    print(f"üî¥ Error: {str(e)}")

In [24]:
import sys
import os

# Obt√©n la ruta al directorio ra√≠z del proyecto
project_root = os.path.abspath(os.path.join('..'))

# Verifica que SRC est√© en el path
src_path = os.path.join(project_root, 'SRC')
if os.path.exists(src_path) and src_path not in sys.path:
    sys.path.insert(0, src_path)

# Ahora los imports funcionar√°n
from load_data import load_mission_data
from preprocess import SatelliteDataCleaner as clean_telemetry  # Alias para compatibilidad

In [25]:
import os
mission_path = r"C:\Users\JMGY-\Documents\Advance-data-analitic\5.5 PROYECTO NASA\DATA\ESA-Mission2"
print("Archivos en ESA-Mission2:", os.listdir(mission_path))

Archivos en ESA-Mission2: ['ESA-Mission2']


In [26]:
# C√≥digo para an√°lisis forense de la anomal√≠a
import pandas as pd
import matplotlib.pyplot as plt
from load_data import load_mission_data
from preprocess import SatelliteDataCleaner as clean_telemetry  # Alias para compatibilidad

# Cargar datos espec√≠ficos del per√≠odo cr√≠tico
df = load_mission_data('ESA-Mission2', date_range=('2009-05-01', '2009-07-30'))
anomaly_data = df[df['Anomaly_ID'] == 134].sort_values('Timestamp')

# An√°lisis de canales afectados
critical_channels = anomaly_data['Channel'].unique()
print(f"üö® Canales comprometidos: {len(critical_channels)}")
print(f"üìÖ Per√≠odo: {anomaly_data['Timestamp'].min()} a {anomaly_data['Timestamp'].max()}")
print(f"üî¢ Tipos de se√±ales afectadas: {anomaly_data['Signal_Type'].nunique()}")

# Visualizaci√≥n de patrones sospechosos
plt.figure(figsize=(12, 6))
for channel in critical_channels[:5]:  # Top 5 canales
    subset = anomaly_data[anomaly_data['Channel'] == channel]
    plt.plot(subset['Timestamp'], subset['Value'], label=f'Channel {channel}', alpha=0.7)
plt.axvspan(pd.to_datetime('2009-06-15'), pd.to_datetime('2009-06-20'), 
            color='red', alpha=0.2, label='Posible intrusi√≥n')
plt.title('Comportamiento Simult√°neo en Canales Cr√≠ticos (ID 134)')
plt.legend()
plt.savefig('figures/anomaly_134_patterns.png')

FileNotFoundError: üö® Archivo cr√≠tico no encontrado: C:\Users\JMGY-\Documents\Advance-data-analitic\5.5 PROYECTO NASA\data\ESA-ESA-Mission2\telemetry.csv

# üõ†Ô∏è Fase 2: An√°lisis Forense Digital

In [7]:
# Buscar firmas de ataque conocidas
from src.feature_engineering import detect_attack_patterns

# 1. Detecci√≥n de inyecci√≥n de comandos
command_injection = detect_attack_patterns(
    anomaly_data,
    patterns=['OR 1=1', '; DROP', 'UNION SELECT'],
    text_columns=['Telecommand_Log']
)

# 2. An√°lisis de frecuencia an√≥mala (FFT)
from scipy import fft
frequencies = fft.fft(anomaly_data[anomaly_data['Channel'] == 'COMM_MAIN']['Value'])
dominant_freq = np.abs(frequencies[:len(frequencies)//2]).argmax()
print(f"üîä Frecuencia dominante: {dominant_freq} Hz (esperado: 0.5-2 Hz en operaci√≥n normal)")

# 3. Entrop√≠a de se√±ales (indicador de encriptaci√≥n/ruido)
from scipy.stats import entropy
entropy_values = anomaly_data.groupby('Channel')['Value'].apply(
    lambda x: entropy(pd.cut(x, bins=20).value_counts(normalize=True))
)
high_entropy = entropy_values[entropy_values > 2.5]  # Umbral emp√≠rico

ModuleNotFoundError: No module named 'src'

ü§ñ Fase 3: Modelado de Comportamiento Malicioso

In [8]:
# Entrenamiento de modelo de detecci√≥n de anomal√≠as
from sklearn.ensemble import IsolationForest
from src.train_model import train_anomaly_detector

# Datos hist√≥ricos de intrusiones confirmadas (labels del ESA Security Team)
intrusion_data = pd.read_csv('data/ESA-Mission2/known_intrusions.csv')
features = ['Value_Std', 'Packet_Size', 'Command_Rate']

model = train_anomaly_detector(
    intrusion_data,
    features=features,
    model_type='isolation_forest',
    contamination=0.01
)

# Aplicar a la anomal√≠a ID 134
anomaly_features = anomaly_data.groupby('Channel').agg({
    'Value': ['std', 'mean'],
    'Packet_Size': 'sum'
})
anomaly_features.columns = ['Value_Std', 'Value_Mean', 'Packet_Size']

predictions = model.predict(anomaly_features)
print(f"üî¥ Canales marcados como intrusi√≥n: {sum(predictions == -1)}/{len(predictions)}")

ModuleNotFoundError: No module named 'src'

# üì° Fase 4: Simulaci√≥n de Impacto

In [9]:
# Reconstrucci√≥n de posibles escenarios
from src.visualize import plot_attack_scenario

scenarios = {
    'Escenario 1': 'Reenv√≠o de comandos no autorizados',
    'Escenario 2': 'Interceptaci√≥n de telemetr√≠a',
    'Escenario 3': 'DoS en subsistema de comunicaci√≥n'
}

for scenario in scenarios:
    plot_attack_scenario(
        anomaly_data,
        scenario_type=scenario,
        save_path=f'figures/{scenario.lower().replace(" ", "_")}.png'
    )

ModuleNotFoundError: No module named 'src'

In [None]:
# Generar reporte automatizado
from reports import generate_security_report

generate_security_report(
    anomaly_id=134,
    critical_channels=critical_channels,
    action_items=['Firmware Update', 'Key Rotation', 'Traffic Encryption'],
    output_file='reports/CVE-2009-ESA-Anomaly134.pdf'
)