# Implementación del Modelo

Se genera nuevos ejemplos para probar el funcionamiento del modelo y determinar si hay fraude o no en una transacción.

In [1]:
import joblib

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [15]:
import pandas as pd

# Load the dataset to define 'df'
df = pd.read_csv('/content/creditcard.csv')
X = df.drop(['Class', 'Time'], axis=1)
y = df['Class']


In [16]:
import numpy as np

# Ruta donde guardaste el modelo en Google Drive
model_filename = '/content/drive/MyDrive/fraud_detection_model_optuna_calibrated_v3.joblib'

# Cargar el modelo
try:
    loaded_model = joblib.load(model_filename)
    print(f"Modelo '{model_filename}' cargado exitosamente.")
except FileNotFoundError:
    print(f"Error: El archivo '{model_filename}' no fue encontrado. Verifica la ruta.")
    loaded_model = None

if loaded_model:
    print("\n--- Generando predicciones con nuevos datos sintéticos ---")

    feature_columns = X.columns.tolist()

    # Generar 5 ejemplos de datos sintéticos
    # Para simplificar, generamos valores aleatorios basados en la media y desviación estándar
    # de cada característica en el DataFrame original.
    # En un escenario real, estos datos podrían venir de transacciones en vivo.
    num_new_examples = 5
    new_data_dict = {}
    for col in feature_columns:
        mean_val = df[col].mean()
        std_val = df[col].std()
        # Generamos valores aleatorios alrededor de la media con cierta dispersión
        new_data_dict[col] = np.random.normal(mean_val, std_val * 0.5, num_new_examples)

    sample_new_data = pd.DataFrame(new_data_dict, columns=feature_columns)

    print("Ejemplos de 'nuevos datos' sintéticos generados:")

    # Realizar predicciones para cada ejemplo sintético
    for i in range(len(sample_new_data)):
        single_example = sample_new_data.iloc[[i]]
        prediction = loaded_model.predict(single_example)
        prediction_proba = loaded_model.predict_proba(single_example)

        print(f"\n--- Ejemplo Sintético {i+1} ---")
        print(single_example)
        print(f"Predicción de la clase: {prediction[0]} (0: No Fraude, 1: Fraude)")
        print(f"Probabilidad de No Fraude: {prediction_proba[0][0]:.4f}")
        print(f"Probabilidad de Fraude: {prediction_proba[0][1]:.4f}")
else:
    print("No se pudo cargar el modelo. Verifica la ruta y que el archivo exista.")

Modelo '/content/drive/MyDrive/fraud_detection_model_optuna_calibrated_v3.joblib' cargado exitosamente.

--- Generando predicciones con nuevos datos sintéticos ---
Ejemplos de 'nuevos datos' sintéticos generados:

--- Ejemplo Sintético 1 ---
         V1        V2       V3        V4        V5        V6        V7  \
0 -1.956688  0.254866  0.23263  0.617807 -0.222245  0.386163 -0.586088   

         V8        V9       V10  ...       V20       V21       V22       V23  \
0 -1.089942 -0.520037 -0.261081  ...  0.187597 -0.842282 -0.006016  0.278969   

        V24       V25     V26       V27       V28     Amount  
0  0.079065  0.032751  0.0035 -0.216478  0.220547 -21.137979  

[1 rows x 29 columns]
Predicción de la clase: 0 (0: No Fraude, 1: Fraude)
Probabilidad de No Fraude: 0.9980
Probabilidad de Fraude: 0.0020

--- Ejemplo Sintético 2 ---
         V1        V2        V3        V4        V5        V6        V7  \
1 -0.694125  0.833221  0.966088 -0.957772 -0.053419 -0.186104 -0.578109   

  

In [17]:
import numpy as np

# Ruta donde guardaste el modelo en Google Drive
model_filename = '/content/drive/MyDrive/fraud_detection_model_optuna_calibrated_v3.joblib'

# Cargar el modelo
try:
    loaded_model = joblib.load(model_filename)
    print(f"Modelo '{model_filename}' cargado exitosamente.")
except FileNotFoundError:
    print(f"Error: El archivo '{model_filename}' no fue encontrado. Verifica la ruta.")
    loaded_model = None

if loaded_model:
    print("\n--- Generando predicciones con nuevos datos sintéticos ---")

    feature_columns = X.columns.tolist()

    num_non_fraud_examples = 3
    num_fraud_examples = 2

    synthetic_data_list = []

    # Separar el DataFrame original por clase para obtener estadísticas
    df_fraud = df[df['Class'] == 1]
    df_non_fraud = df[df['Class'] == 0]

    # Generar ejemplos sintéticos de NO FRAUDES
    for _ in range(num_non_fraud_examples):
        new_row_dict = {}
        for col in feature_columns:
            mean_val = df_non_fraud[col].mean()
            std_val = df_non_fraud[col].std()
            # Generamos valores aleatorios alrededor de la media de transacciones no fraudulentas
            new_row_dict[col] = np.random.normal(mean_val, std_val * 0.5) # Usamos 0.5*std para mantenerlos 'cerca' de la media
        synthetic_data_list.append(new_row_dict)

    # Generar ejemplos sintéticos de FRAUDE
    for _ in range(num_fraud_examples):
        new_row_dict = {}
        for col in feature_columns:
            mean_val = df_fraud[col].mean()
            std_val = df_fraud[col].std()
            new_row_dict[col] = np.random.normal(mean_val, std_val * 1.0)
        synthetic_data_list.append(new_row_dict)

    # Crear un DataFrame con todos los ejemplos sintéticos
    sample_new_data = pd.DataFrame(synthetic_data_list, columns=feature_columns)

    print("Ejemplos de 'nuevos datos' sintéticos generados:")

    # Realizar predicciones para cada ejemplo sintético
    for i in range(len(sample_new_data)):
        single_example = sample_new_data.iloc[[i]]
        prediction = loaded_model.predict(single_example)
        prediction_proba = loaded_model.predict_proba(single_example)

        print(f"\n--- Ejemplo Sintético {i+1} ---")
        print(single_example)
        print(f"Predicción de la clase: {prediction[0]} (0: No Fraude, 1: Fraude)")
        print(f"Probabilidad de No Fraude: {prediction_proba[0][0]:.4f}")
        print(f"Probabilidad de Fraude: {prediction_proba[0][1]:.4f}")
else:
    print("No se pudo cargar el modelo. Verifica la ruta y que el archivo exista.")

Modelo '/content/drive/MyDrive/fraud_detection_model_optuna_calibrated_v3.joblib' cargado exitosamente.

--- Generando predicciones con nuevos datos sintéticos ---
Generando 3 ejemplos sintéticos de NO FRAUDE...
Generando 2 ejemplos sintéticos de FRAUDE...
Ejemplos de 'nuevos datos' sintéticos generados:

--- Ejemplo Sintético 1 ---
         V1        V2        V3        V4        V5        V6        V7  \
0 -0.294365 -0.555743  0.833542  1.444488  0.184668  0.657988  0.478589   

         V8        V9       V10  ...       V20       V21       V22       V23  \
0 -0.133678 -0.472647 -0.779049  ...  0.199145  0.501604 -0.165408 -0.102669   

        V24       V25       V26       V27       V28      Amount  
0 -0.261615 -0.026691  0.101525  0.084268  0.035365  245.882197  

[1 rows x 29 columns]
Predicción de la clase: 0 (0: No Fraude, 1: Fraude)
Probabilidad de No Fraude: 0.9997
Probabilidad de Fraude: 0.0003

--- Ejemplo Sintético 2 ---
        V1        V2        V3        V4        V5  