In [6]:
import pandas as pd
import numpy as np
from river import anomaly
from river import preprocessing
import pickle
import os
from datetime import datetime
import warnings
from sklearn.metrics import confusion_matrix, classification_report, accuracy_score
from sklearn.metrics import precision_score, recall_score, f1_score
import seaborn as sns
import matplotlib.pyplot as plt

warnings.filterwarnings('ignore')

print("‚úÖ Librer√≠as importadas correctamente")

‚úÖ Librer√≠as importadas correctamente


# # 1. CONFIGURACI√ìN DE RUTAS Y CARGA DE MODELO

In [13]:
# Rutas de archivos
MODELS_PATH = r"C:\Users\User\Desktop\TESIS\CodigoGithub\MLTallerProyecto1\Modelos"
EVALUATION_CSV_PATH = r"C:\Users\User\Desktop\TESIS\NuevoDataSet\DataSetFinalProbarMatriz.csv"  # üîß CAMBIAR ESTA RUTA
RESULTADO = r"C:\Users\User\Desktop\TESIS\CodigoGithub\MLTallerProyecto1\Resultados"

# Verificar que el directorio de modelos existe
if not os.path.exists(MODELS_PATH):
    print(f"‚ùå Error: Directorio de modelos no encontrado: {MODELS_PATH}")
    exit()

print(f"üìÅ Directorio de modelos: {MODELS_PATH}")

üìÅ Directorio de modelos: C:\Users\User\Desktop\TESIS\CodigoGithub\MLTallerProyecto1\Modelos


# 2. CARGAR MODELO, SCALER Y CONFIGURACI√ìN

In [8]:
print("\nüîÑ Cargando modelo entrenado...")

# Cargar modelo
modelo_path = os.path.join(MODELS_PATH, "modelo_general.pkl")
with open(modelo_path, 'rb') as f:
    modelo_cargado = pickle.load(f)

# Cargar scaler
scaler_path = os.path.join(MODELS_PATH, "scaler_general.pkl")
with open(scaler_path, 'rb') as f:
    scaler_cargado = pickle.load(f)

# Cargar configuraci√≥n
config_path = os.path.join(MODELS_PATH, "config_modelo_general.pkl")
with open(config_path, 'rb') as f:
    config_cargado = pickle.load(f)

print("‚úÖ Modelo cargado exitosamente")

# Mostrar informaci√≥n del modelo
print(f"\nüìä INFORMACI√ìN DEL MODELO CARGADO:")
print(f"üéØ Umbral global: {config_cargado['umbral_global']:.4f}")
print(f"üåç Pa√≠ses en entrenamiento: {config_cargado['paises_entrenamiento']}")
print(f"üìà Registros de entrenamiento: {config_cargado['registros_entrenamiento']}")
print(f"üìÖ Fecha de entrenamiento: {config_cargado['fecha_entrenamiento']}")
print(f"üå≥ N√∫mero de √°rboles: {config_cargado['n_trees']}")
print(f"üìè Altura de √°rboles: {config_cargado['tree_height']}")

# Extraer configuraciones
umbral_global = config_cargado['umbral_global']
stats_dict  = config_cargado['stats_por_pais']
parametros_features = config_cargado['parametros_features']
contexto_historico = config_cargado['contexto_historico']


# Configurar par√°metros de features
PESO_MINUTOS_NORMAL = parametros_features['peso_minutos_normal']
PESO_MINUTOS_EXTREMOS = parametros_features['peso_minutos_extremos']
UMBRAL_MINUTOS_EXTREMOS = parametros_features['umbral_minutos_extremos']
PESO_DESTINOS = parametros_features['peso_destinos']
PESO_SPRAY_RATIO = parametros_features['peso_spray_ratio']

print(f"\n‚öôÔ∏è PAR√ÅMETROS DE FEATURES CARGADOS:")
print(f"üîß Peso minutos normal: {PESO_MINUTOS_NORMAL}")
print(f"üîß Peso minutos extremos: {PESO_MINUTOS_EXTREMOS}")
print(f"üîß Umbral minutos extremos: {UMBRAL_MINUTOS_EXTREMOS}")
print(f"üîß Peso destinos: {PESO_DESTINOS}")
print(f"üîß Peso spray ratio: {PESO_SPRAY_RATIO}")


üîÑ Cargando modelo entrenado...
‚úÖ Modelo cargado exitosamente

üìä INFORMACI√ìN DEL MODELO CARGADO:
üéØ Umbral global: 0.9724
üåç Pa√≠ses en entrenamiento: 188
üìà Registros de entrenamiento: 450900
üìÖ Fecha de entrenamiento: 2025-06-16T20:17:02.325706
üå≥ N√∫mero de √°rboles: 80
üìè Altura de √°rboles: 10

‚öôÔ∏è PAR√ÅMETROS DE FEATURES CARGADOS:
üîß Peso minutos normal: 0.4
üîß Peso minutos extremos: 1.5
üîß Umbral minutos extremos: 300
üîß Peso destinos: 1.2
üîß Peso spray ratio: 1.5


# # 3. FUNCI√ìN DE FEATURES (ID√âNTICA AL MODELO)


In [9]:
def crear_features_contextualizadas_mejorada(row, stats_pais_dict):
    """
    Funci√≥n id√©ntica a la del modelo - MANTENER CONSISTENCIA ABSOLUTA
    """
    pais = row['CODIGODEPAIS']
    llamadas = row['N_LLAMADAS']
    minutos = row['N_MINUTOS']
    destinos = row['N_DESTINOS']
    
    # Obtener contexto del pa√≠s (si existe)
    if pais in stats_pais_dict:
        pais_stats = stats_pais_dict[pais]
        categoria = pais_stats['CATEGORIA']
        
        # Normalizar por el contexto del pa√≠s
        llamadas_norm = min(llamadas / max(pais_stats['LLAMADAS_P95'], 1), 1.5)
        destinos_norm = min(destinos / max(pais_stats['DESTINOS_P95'], 1), 1.5)
        
        # Detecci√≥n inteligente de minutos extremos
        minutos_p90 = pais_stats.get('MINUTOS_P90', pais_stats['MINUTOS_P95'] * 0.9)
        
        # Transformaci√≥n adaptativa de minutos
        if minutos >= UMBRAL_MINUTOS_EXTREMOS:
            minutos_norm = min(minutos / max(minutos_p90, 1), 3.0)
            peso_minutos = PESO_MINUTOS_EXTREMOS
        else:
            minutos_norm = min(np.log1p(minutos) / np.log1p(max(minutos_p90, 1)), 1.2)
            peso_minutos = PESO_MINUTOS_NORMAL
            
    else:
        # Pa√≠s nuevo - SIEMPRE clasificar como 'Muy_Bajo'
        categoria = 'Muy_Bajo'
        llamadas_norm = min(llamadas / 10, 2.0)
        destinos_norm = min(destinos / 5, 2.0)
        
        if minutos >= UMBRAL_MINUTOS_EXTREMOS:
            minutos_norm = min(minutos / 50, 3.0)
            peso_minutos = PESO_MINUTOS_EXTREMOS * 1.2
        else:
            minutos_norm = min(np.log1p(minutos) / np.log1p(60), 1.2)
            peso_minutos = PESO_MINUTOS_NORMAL
    
    # Features principales (id√©nticas al modelo)
    features = {
        'llamadas_norm': llamadas_norm * 0.8,
        'destinos_norm': destinos_norm * PESO_DESTINOS,
        'minutos_norm': minutos_norm * peso_minutos,
        'diversidad_destinos': min(destinos / max(llamadas, 1), 1.0),
        'spray_ratio': min(destinos / max(llamadas, 1) * PESO_SPRAY_RATIO, 1.0) if destinos >= 5 else 0,
        'minutos_extremos': 1.0 if minutos >= UMBRAL_MINUTOS_EXTREMOS else 0.0,
        'minutos_sospechosos': min((minutos - 200) / 300, 1.0) if minutos > 200 else 0.0,
        'patron_spray_fuerte': 1.0 if (destinos >= 10 and llamadas >= 20) else 0.0,
        'patron_spray_medio': 0.5 if (destinos >= 6 and llamadas >= 12) else 0.0,
        'alta_diversidad': min(destinos / 12, 1) if destinos >= 5 else 0,
        'volumen_llamadas_alto': min((llamadas - 30) / 50, 1) if llamadas > 30 else 0,
        'volumen_destinos_alto': min((destinos - 10) / 20, 1) if destinos > 10 else 0,
        'llamadas_por_destino': min(llamadas / max(destinos, 1) / 5, 1),
        'eficiencia_destinos': min(destinos / max(llamadas * 0.5, 1), 1),
        'factor_pais_bajo': 1.5 if categoria in ['Muy_Bajo', 'Bajo'] else 1.0,
        'factor_pais_alto': 0.9 if categoria in ['Alto', 'Medio'] else 1.0
    }
    
    return features

# Funci√≥n de predicci√≥n id√©ntica
def predecir_anomalia_mejorada(pais, linea, llamadas, minutos, destinos, modelo, scaler, umbral, stats_dict, contexto_historico=None):
    """
    Predicci√≥n id√©ntica al modelo original
    """
    # Crear row simulado
    row_data = {
        'CODIGODEPAIS': pais,
        'N_LLAMADAS': llamadas,
        'N_MINUTOS': minutos,
        'N_DESTINOS': destinos
    }
    
    # Crear features
    features = crear_features_contextualizadas_mejorada(row_data, stats_dict)
    
    # Normalizar
    features_scaled = scaler.transform_one(features)
    
    # Obtener score
    score = modelo.score_one(features_scaled)
    
    # L√≥gica de confirmaci√≥n (id√©ntica al modelo)
    es_anomalia_base = score > umbral
    
    if es_anomalia_base:
        # Confirmar diferentes tipos de anomal√≠as
        if minutos >= parametros_features['umbral_minutos_extremos']:
            es_anomalia_final = True
            razon = f"Minutos extremos ({minutos:.1f} min)"
        elif destinos >= 6 and llamadas >= 12:
            es_anomalia_final = True
            razon = "Patr√≥n de spray calling confirmado"
        elif llamadas > 50 or destinos > 15:
            es_anomalia_final = True
            razon = "Volumen excepcionalmente alto"
        elif pais not in stats_dict or stats_dict.get(pais, {}).get('CATEGORIA') in ['Muy_Bajo', 'Bajo']:
            if destinos >= 4 and llamadas >= 8:
                es_anomalia_final = True
                razon = "Actividad sospechosa en pa√≠s de bajo tr√°fico"
            else:
                es_anomalia_final = False
                razon = "Actividad baja en pa√≠s de bajo tr√°fico"
        elif destinos < 3:
            es_anomalia_final = False
            razon = "Muy pocos destinos (<3)"
        elif destinos / max(llamadas, 1) < 0.15:
            es_anomalia_final = False
            razon = "Ratio destinos/llamadas muy bajo"
        elif llamadas < 5:
            es_anomalia_final = False
            razon = "Muy pocas llamadas (<5)"
        else:
            es_anomalia_final = False
            razon = "No cumple criterios de confirmaci√≥n"
    else:
        es_anomalia_final = False
        razon = "Score bajo umbral"
    
    # Determinar contexto usando hist√≥rico
    if contexto_historico and pais in contexto_historico:
        tipo_contexto = contexto_historico[pais]
    elif pais in stats_dict:
        tipo_contexto = stats_dict[pais]['CATEGORIA']
    else:
        tipo_contexto = "Muy_Bajo"
    
    return {
        'score': score,
        'umbral': umbral,
        'es_anomalia': es_anomalia_final,
        'tipo_contexto': tipo_contexto,
        'razon_decision': razon,
        'features': features
    }

print("üîß Funciones de predicci√≥n cargadas (id√©nticas al modelo)")

üîß Funciones de predicci√≥n cargadas (id√©nticas al modelo)


# # 19. CARGAR DATASET DE EVALUACI√ìN CON ETIQUETAS DE FRAUDE

In [10]:
print(f"\nüìÇ Cargando dataset de evaluaci√≥n...")

# Verificar que el archivo existe
if not os.path.exists(EVALUATION_CSV_PATH):
    print(f"‚ùå Error: Archivo de evaluaci√≥n no encontrado: {EVALUATION_CSV_PATH}")
    print(f"üìù Por favor, aseg√∫rate de que el archivo exista y contenga las columnas:")
    print(f"   - FECHA, CODIGODEPAIS, LINEA, N_LLAMADAS, N_MINUTOS, N_DESTINOS, FRAUDE")
    print(f"   - FRAUDE debe ser 1 (fraudulento) o 0 (normal)")
    exit()

# Cargar dataset
df_evaluacion = pd.read_csv(EVALUATION_CSV_PATH)

# Convertir fecha a datetime si existe
if 'FECHA' in df_evaluacion.columns:
    df_evaluacion['FECHA'] = pd.to_datetime(df_evaluacion['FECHA'], format='%d/%m/%Y', errors='coerce')

print(f"‚úÖ Dataset cargado - Shape: {df_evaluacion.shape}")

# Verificar columnas requeridas
columnas_requeridas = ['CODIGODEPAIS', 'LINEA', 'N_LLAMADAS', 'N_MINUTOS', 'N_DESTINOS', 'FRAUDE']
columnas_faltantes = [col for col in columnas_requeridas if col not in df_evaluacion.columns]

if columnas_faltantes:
    print(f"‚ùå Error: Columnas faltantes: {columnas_faltantes}")
    print(f"üìã Columnas disponibles: {list(df_evaluacion.columns)}")
    exit()

# Verificar valores de FRAUDE
valores_fraude = df_evaluacion['FRAUDE'].unique()
if not all(v in [0, 1] for v in valores_fraude):
    print(f"‚ùå Error: FRAUDE debe contener solo valores 0 o 1. Valores encontrados: {valores_fraude}")
    exit()

print(f"üîç AN√ÅLISIS DEL DATASET DE EVALUACI√ìN:")
print(f"üìä Total de registros: {len(df_evaluacion)}")
print(f"üö® Casos de fraude: {df_evaluacion['FRAUDE'].sum()} ({df_evaluacion['FRAUDE'].mean()*100:.2f}%)")
print(f"‚úÖ Casos normales: {(df_evaluacion['FRAUDE'] == 0).sum()} ({(df_evaluacion['FRAUDE'] == 0).mean()*100:.2f}%)")
print(f"üåç Pa√≠ses √∫nicos: {df_evaluacion['CODIGODEPAIS'].nunique()}")
print(f"üìû L√≠neas √∫nicas: {df_evaluacion['LINEA'].nunique()}")

# Mostrar estad√≠sticas por clase
print(f"\nüìä ESTAD√çSTICAS POR CLASE:")
print(f"CASOS NORMALES (FRAUDE = 0):")
normales = df_evaluacion[df_evaluacion['FRAUDE'] == 0]
print(f"  üìû Llamadas - Min: {normales['N_LLAMADAS'].min()}, Max: {normales['N_LLAMADAS'].max()}, Media: {normales['N_LLAMADAS'].mean():.1f}")
print(f"  ‚è±Ô∏è Minutos - Min: {normales['N_MINUTOS'].min()}, Max: {normales['N_MINUTOS'].max()}, Media: {normales['N_MINUTOS'].mean():.1f}")
print(f"  üéØ Destinos - Min: {normales['N_DESTINOS'].min()}, Max: {normales['N_DESTINOS'].max()}, Media: {normales['N_DESTINOS'].mean():.1f}")

if df_evaluacion['FRAUDE'].sum() > 0:
    print(f"\nCASOS DE FRAUDE (FRAUDE = 1):")
    fraudes = df_evaluacion[df_evaluacion['FRAUDE'] == 1]
    print(f"  üìû Llamadas - Min: {fraudes['N_LLAMADAS'].min()}, Max: {fraudes['N_LLAMADAS'].max()}, Media: {fraudes['N_LLAMADAS'].mean():.1f}")
    print(f"  ‚è±Ô∏è Minutos - Min: {fraudes['N_MINUTOS'].min()}, Max: {fraudes['N_MINUTOS'].max()}, Media: {fraudes['N_MINUTOS'].mean():.1f}")
    print(f"  üéØ Destinos - Min: {fraudes['N_DESTINOS'].min()}, Max: {fraudes['N_DESTINOS'].max()}, Media: {fraudes['N_DESTINOS'].mean():.1f}")



üìÇ Cargando dataset de evaluaci√≥n...
‚úÖ Dataset cargado - Shape: (102684, 7)
üîç AN√ÅLISIS DEL DATASET DE EVALUACI√ìN:
üìä Total de registros: 102684
üö® Casos de fraude: 2813 (2.74%)
‚úÖ Casos normales: 99871 (97.26%)
üåç Pa√≠ses √∫nicos: 183
üìû L√≠neas √∫nicas: 71752

üìä ESTAD√çSTICAS POR CLASE:
CASOS NORMALES (FRAUDE = 0):
  üìû Llamadas - Min: 0, Max: 200, Media: 1.5
  ‚è±Ô∏è Minutos - Min: 0.02, Max: 854.79, Media: 3.5
  üéØ Destinos - Min: 0, Max: 121, Media: 1.2

CASOS DE FRAUDE (FRAUDE = 1):
  üìû Llamadas - Min: 1, Max: 295, Media: 57.3
  ‚è±Ô∏è Minutos - Min: 0.02, Max: 459.02, Media: 82.7
  üéØ Destinos - Min: 1, Max: 293, Media: 55.5


# # 20. REALIZAR PREDICCIONES EN DATASET DE EVALUACI√ìN

In [11]:
print(f"\nüîÆ Realizando predicciones en dataset de evaluaci√≥n...")

predicciones = []
scores = []

for contador, (idx, row) in enumerate(df_evaluacion.iterrows()):
    if contador % 1000 == 0:
        print(f"   Procesando: {contador}/{len(df_evaluacion)} registros")
    
    # Realizar predicci√≥n
    resultado = predecir_anomalia_mejorada(
        pais=row['CODIGODEPAIS'],
        linea=row['LINEA'],
        llamadas=row['N_LLAMADAS'],
        minutos=row['N_MINUTOS'],
        destinos=row['N_DESTINOS'],
        modelo=modelo_cargado,
        scaler=scaler_cargado,
        umbral=umbral_global,
        stats_dict=stats_dict,
        contexto_historico=contexto_historico
    )
    
    # Guardar predicci√≥n (1 si es anomal√≠a, 0 si es normal)
    predicciones.append(1 if resultado['es_anomalia'] else 0)
    scores.append(resultado['score'])

# Agregar predicciones al dataframe
df_evaluacion['PREDICCION'] = predicciones
df_evaluacion['SCORE_ANOMALIA'] = scores

print(f"‚úÖ Predicciones completadas")


üîÆ Realizando predicciones en dataset de evaluaci√≥n...
   Procesando: 0/102684 registros
   Procesando: 1000/102684 registros
   Procesando: 2000/102684 registros
   Procesando: 3000/102684 registros
   Procesando: 4000/102684 registros
   Procesando: 5000/102684 registros
   Procesando: 6000/102684 registros
   Procesando: 7000/102684 registros
   Procesando: 8000/102684 registros
   Procesando: 9000/102684 registros
   Procesando: 10000/102684 registros
   Procesando: 11000/102684 registros
   Procesando: 12000/102684 registros
   Procesando: 13000/102684 registros
   Procesando: 14000/102684 registros
   Procesando: 15000/102684 registros
   Procesando: 16000/102684 registros
   Procesando: 17000/102684 registros
   Procesando: 18000/102684 registros
   Procesando: 19000/102684 registros
   Procesando: 20000/102684 registros
   Procesando: 21000/102684 registros
   Procesando: 22000/102684 registros
   Procesando: 23000/102684 registros
   Procesando: 24000/102684 registros
   P

# # 21. CALCULAR M√âTRICAS Y MATRIZ DE CONFUSI√ìN


In [12]:
print(f"\nüìä CALCULANDO M√âTRICAS DE EVALUACI√ìN...")

# Extraer etiquetas reales y predicciones
y_true = df_evaluacion['FRAUDE'].values
y_pred = df_evaluacion['PREDICCION'].values

# Calcular m√©tricas principales
accuracy = accuracy_score(y_true, y_pred)
precision = precision_score(y_true, y_pred, zero_division=0)
recall = recall_score(y_true, y_pred, zero_division=0)
f1 = f1_score(y_true, y_pred, zero_division=0)

print(f"üéØ M√âTRICAS DE EVALUACI√ìN:")
print(f"üìà Accuracy (Exactitud): {accuracy:.4f} ({accuracy*100:.2f}%)")
print(f"üéØ Precision (Precisi√≥n): {precision:.4f} ({precision*100:.2f}%)")
print(f"üîç Recall (Sensibilidad): {recall:.4f} ({recall*100:.2f}%)")
print(f"‚öñÔ∏è F1-Score: {f1:.4f} ({f1*100:.2f}%)")

# Calcular matriz de confusi√≥n
cm = confusion_matrix(y_true, y_pred)
tn, fp, fn, tp = cm.ravel()

print(f"\nüìã MATRIZ DE CONFUSI√ìN:")
print(f"‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê")
print(f"‚îÇ     REAL \\ PRED ‚îÇ   Normal   ‚îÇ Anomal√≠a ‚îÇ")
print(f"‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§")
print(f"‚îÇ      Normal     ‚îÇ   {tn:6d}   ‚îÇ  {fp:6d}  ‚îÇ")
print(f"‚îÇ     Fraude      ‚îÇ   {fn:6d}   ‚îÇ  {tp:6d}  ‚îÇ")
print(f"‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò")

print(f"\nüî¢ INTERPRETACI√ìN:")
print(f"‚úÖ Verdaderos Negativos (TN): {tn} - Casos normales correctamente identificados")
print(f"‚ùå Falsos Positivos (FP): {fp} - Casos normales incorrectamente marcados como fraude")
print(f"‚ùå Falsos Negativos (FN): {fn} - Casos de fraude no detectados")
print(f"‚úÖ Verdaderos Positivos (TP): {tp} - Casos de fraude correctamente detectados")

# Calcular tasas adicionales
if (tn + fp) > 0:
    especificidad = tn / (tn + fp)
    print(f"üõ°Ô∏è Especificidad (Tasa de Verdaderos Negativos): {especificidad:.4f} ({especificidad*100:.2f}%)")

if (fp + tn) > 0:
    tasa_fp = fp / (fp + tn)
    print(f"‚ö†Ô∏è Tasa de Falsos Positivos: {tasa_fp:.4f} ({tasa_fp*100:.2f}%)")

if (fn + tp) > 0:
    tasa_fn = fn / (fn + tp)
    print(f"‚ö†Ô∏è Tasa de Falsos Negativos: {tasa_fn:.4f} ({tasa_fn*100:.2f}%)")


üìä CALCULANDO M√âTRICAS DE EVALUACI√ìN...
üéØ M√âTRICAS DE EVALUACI√ìN:
üìà Accuracy (Exactitud): 0.9911 (99.11%)
üéØ Precision (Precisi√≥n): 0.8988 (89.88%)
üîç Recall (Sensibilidad): 0.7611 (76.11%)
‚öñÔ∏è F1-Score: 0.8243 (82.43%)

üìã MATRIZ DE CONFUSI√ìN:
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ     REAL \ PRED ‚îÇ   Normal   ‚îÇ Anomal√≠a ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ      Normal     ‚îÇ    99630   ‚îÇ     241  ‚îÇ
‚îÇ     Fraude      ‚îÇ      672   ‚îÇ    2141  ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò

üî¢ INTERPRETACI√ìN:
‚úÖ Verdaderos Negativos (TN): 99630 - Casos normales correctamente identificados
‚ùå Falsos Positivos (FP): 241 - Casos normales incorrectamente marcados como fraude
‚ùå Falsos Negativos (FN): 672 - Casos de fraude

# # 22. Guardar Resultados

In [14]:
resultados_path = os.path.join(RESULTADO, "resultados_evaluacion_completa.csv")
df_evaluacion.to_csv(resultados_path, index=False)
print(f"üìÑ Resultados completos: {resultados_path}")



üìÑ Resultados completos: C:\Users\User\Desktop\TESIS\CodigoGithub\MLTallerProyecto1\Resultados\resultados_evaluacion_completa.csv
