# 04 Entrenamiento de Modelos

En esta sección, vamos a entrenar varios modelos de machine learning para predecir si un cliente suscribirá un depósito a plazo. Probaremos diferentes algoritmos, ajustaremos sus hiperparámetros y evaluaremos su rendimiento.

## 1. Cargar Datos Preprocesados y Construidos

In [1]:
## 1. Cargar el Conjunto de Datos
# Importar la librería necesarias
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
import joblib

# Seleccionar el tipo de balanceo a utilizar
tipo_balanceo = 'oversampled' # 'original', 'oversampled', 'undersampled'

if tipo_balanceo == 'original':
    dir_path = '../data/interim'
elif tipo_balanceo == 'oversampled':
    dir_path = '../data/processed/oversampled'
elif tipo_balanceo == 'undersampled':
    dir_path = '../data/processed/undersampled'

# Cargar el conjunto de datos
X_train = pd.read_csv(f'{dir_path}/X_train.csv')
X_test = pd.read_csv(f'{dir_path}/X_test.csv')
y_train = pd.read_csv(f'{dir_path}/y_train.csv')
y_test = pd.read_csv(f'{dir_path}/y_test.csv')

# Mostrar los primeros registros de los datos de entrenamiento
X_train.head()

Unnamed: 0,age,default,balance,housing,loan,day,duration,campaign,pdays,previous,...,month_jul,month_jun,month_mar,month_may,month_nov,month_oct,month_sep,poutcome_other,poutcome_success,poutcome_unknown
0,0.168831,0,0.072803,1,0,0.5,0.214721,0.016129,0.0,0.0,...,True,False,False,False,False,False,False,False,False,True
1,0.285714,0,0.089527,0,0,0.466667,0.011387,0.0,0.0,0.0,...,False,False,False,True,False,False,False,False,False,True
2,0.272727,0,0.071024,1,0,0.233333,0.025824,0.016129,0.0,0.0,...,False,False,False,True,False,False,False,False,False,True
3,0.210909,0,0.07474,0,0,0.966667,0.04884,0.0147,0.0,0.0,...,False,False,False,False,False,False,False,False,False,True
4,0.194805,0,0.074901,1,0,0.033333,0.094754,0.0,0.0,0.0,...,False,True,False,False,False,False,False,False,False,True


## 3. Entrenamiento de Modelos

### 3.1. Entrenamiento de un Modelo de Regresión Logística

In [2]:
from sklearn.linear_model import LogisticRegression

# Crear una instancia del modelo
lr = LogisticRegression(random_state=8)

# Entrenar el modelo
lr.fit(X_train, y_train.values.ravel())

# Guardar el modelo
joblib.dump(lr, '../models/1_lr_model.pkl')

['../models/1_lr_model.pkl']

### 3.2. Entrenamiento de un Modelo de Árbol de Decisión

In [3]:
from sklearn.tree import DecisionTreeClassifier

# Crear una instancia del modelo
dt = DecisionTreeClassifier(random_state=8)

# Entrenar el modelo
dt.fit(X_train, y_train.values.ravel())

# Guardar el modelo
joblib.dump(dt, '../models/2_dt_model.pkl')

['../models/2_dt_model.pkl']

### 3.3. Entrenamiento de un Modelo de Bosque Aleatorio

In [4]:
from sklearn.ensemble import RandomForestClassifier

# Crear una instancia del modelo
rf = RandomForestClassifier(random_state=8)

# Entrenar el modelo
rf.fit(X_train, y_train.values.ravel())

# Guardar el modelo
joblib.dump(rf, '../models/3_rf_model.pkl')

['../models/3_rf_model.pkl']

### 3.4. Entrenamiento de un Modelo de Gradiente Boosting

In [5]:
from sklearn.ensemble import GradientBoostingClassifier

# Crear una instancia del modelo
gb = GradientBoostingClassifier(random_state=8)

# Entrenar el modelo
gb.fit(X_train, y_train.values.ravel())

# Guardar el modelo
joblib.dump(gb, '../models/4_gb_model.pkl')

['../models/4_gb_model.pkl']

### 3.5. Entrenamiento de un Modelo de K-Nearest Neighbors

In [6]:
from sklearn.neighbors import KNeighborsClassifier

# Crear una instancia del modelo
knn = KNeighborsClassifier()

# Entrenar el modelo
knn.fit(X_train, y_train.values.ravel())

# Guardar el modelo
joblib.dump(knn, '../models/5_knn_model.pkl')

['../models/5_knn_model.pkl']

### 3.6. Entrenamiento de un Modelo de Naive Bayes

In [7]:
from sklearn.naive_bayes import GaussianNB

# Crear una instancia del modelo
nb = GaussianNB()

# Entrenar el modelo
nb.fit(X_train, y_train.values.ravel())

# Guardar el modelo
joblib.dump(nb, '../models/6_nb_model.pkl')

['../models/6_nb_model.pkl']

### 3.7. Entrenamiento de un Modelo de Red Neuronal

In [8]:
from sklearn.neural_network import MLPClassifier

# Crear una instancia del modelo
mlp = MLPClassifier(random_state=8)

# Entrenar el modelo
mlp.fit(X_train, y_train.values.ravel())

# Guardar el modelo
joblib.dump(mlp, '../models/7_mlp_model.pkl')



['../models/7_mlp_model.pkl']

### 3.8. Entrenamiento de un Modelo de Support Vector Machine (demora mucho)

In [9]:
# from sklearn.svm import SVC

# Crear una instancia del modelo
# svc = SVC(probability=True, random_state=8)

# Entrenar el modelo
# svc.fit(X_train, y_train.values.ravel())

# Guardar el modelo
# joblib.dump(svc, '../models/8_svc_model.pkl')