# Entrenamiento de Modelos para Detección de Fraude en Tarjetas de Crédito

**Este notebook tiene como objetivo entrenar varios modelos de Machine Learning para la detección de fraude en tarjetas de crédito. A continuación, se describen los pasos realizados en el notebook.**

## Importar Librerías y Funciones

**Primero, importamos las librerías necesarias y las funciones definidas en el archivo `model_training.py` que se encuentra en la carpeta `src`.**

In [1]:
# Entrenamiento.ipynb
import sys
sys.path.append('../src')

from model_training import load_train_data, get_models, train_and_evaluate, save_all_models

## Cargar los Datos de Entrenamiento
**Utilizamos la función `load_train_data` para cargar los datos de entrenamiento desde los archivos CSV procesados.**

In [2]:
# Cargar los datos de entrenamiento
X_train, y_train = load_train_data()

## Definir los Modelos
**Utilizamos la función `get_models` para definir varios modelos de Machine Learning que se utilizarán para la detección de fraude.**

In [3]:
# Definir los modelos
models = get_models()

## Entrenar y Evaluar los Modelos
**Utilizamos la función `train_and_evaluate` para entrenar los modelos definidos y evaluar su rendimiento.**

In [4]:
# Entrenar y evaluar los modelos
results, trained_models = train_and_evaluate(models, X_train, y_train)

2025-02-28 14:04:20,305 - INFO - Entrenando Logistic Regression...
2025-02-28 14:04:20,979 - INFO - Logistic Regression - F1-score: 0.9314
2025-02-28 14:04:20,980 - INFO - Entrenando Random Forest...
2025-02-28 14:07:07,052 - INFO - Random Forest - F1-score: 0.9886
2025-02-28 14:07:07,052 - INFO - Entrenando XGBoost...
2025-02-28 14:07:07,053 - INFO - Optimizando hiperparámetros de XGBoost...


Fitting 3 folds for each of 32 candidates, totalling 96 fits


2025-02-28 14:10:09,543 - INFO - Mejores Hiperparámetros para XGBoost: {'colsample_bytree': 1.0, 'learning_rate': 0.1, 'max_depth': 6, 'n_estimators': 200, 'subsample': 0.8}
2025-02-28 14:10:09,544 - INFO - Mejor F1-score: 0.9984
2025-02-28 14:10:14,997 - INFO - XGBoost - F1-score: 0.9991
2025-02-28 14:10:14,999 - INFO - Entrenando LightGBM...


[LightGBM] [Info] Number of positive: 227451, number of negative: 227451
[LightGBM] [Info] Auto-choosing row-wise multi-threading, the overhead of testing was 0.003684 seconds.
You can set `force_row_wise=true` to remove the overhead.
And if memory is not enough, you can set `force_col_wise=true`.
[LightGBM] [Info] Total Bins 2805
[LightGBM] [Info] Number of data points in the train set: 454902, number of used features: 11
[LightGBM] [Info] [binary:BoostFromScore]: pavg=0.500000 -> initscore=0.000000


2025-02-28 14:10:17,672 - INFO - LightGBM - F1-score: 0.9976


## Guardar los Modelos Entrenados
**Utilizamos la función `save_all_models` para guardar los modelos entrenados en la carpeta `models`.**

In [5]:
# Guardar los modelos entrenados
save_all_models(trained_models, results, X_train, y_train)

2025-02-28 14:10:24,197 - INFO - Mejor modelo basado en F1-score: XGBoost
2025-02-28 14:10:24,199 - INFO - Modelo guardado: Logistic Regression en ../models/logistic_regression.pkl
2025-02-28 14:10:24,230 - INFO - Modelo guardado: Random Forest en ../models/random_forest.pkl
2025-02-28 14:10:24,232 - INFO - Modelo guardado: XGBoost en ../models/xgboost.pkl
2025-02-28 14:10:24,237 - INFO - Modelo guardado: LightGBM en ../models/lightgbm.pkl
2025-02-28 14:10:26,389 - INFO - Modelo XGBoost optimizado guardado correctamente.
