In [4]:
from sklearn.model_selection import train_test_split
from catboost import CatBoostClassifier
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.metrics import recall_score, f1_score, roc_auc_score

df = pd.read_csv('airline_passenger_satisfaction_cleaned.csv')
# Seleccionar las características (X) y la variable objetivo (y)
X = df.drop(columns=['satisfaction'])  # Eliminar la columna objetivo del conjunto de características
y = df['satisfaction']  # Columna objetivo

# Dividir los datos en conjunto de entrenamiento (80%) y prueba (20%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar el modelo CatBoostClassifier
model = CatBoostClassifier(iterations=500, depth=6, learning_rate=0.1, verbose=100)

# Entrenar el modelo
model.fit(X_train, y_train)

# Evaluar el modelo en el conjunto de prueba
accuracy = model.score(X_test, y_test)
print(f"Exactitud del modelo en el conjunto de prueba: {accuracy:.2f}")


catboost_train_preds = model.predict(X_train)
catboost_test_preds = model.predict(X_test)
catboost_train_proba = model.predict_proba(X_train)[:, 1]
catboost_test_proba = model.predict_proba(X_test)[:, 1]

catboost_train_recall = recall_score(y_train, catboost_train_preds)
catboost_test_recall = recall_score(y_test, catboost_test_preds)
catboost_train_f1 = f1_score(y_train, catboost_train_preds)
catboost_test_f1 = f1_score(y_test, catboost_test_preds)
catboost_train_auc = roc_auc_score(y_train, catboost_train_proba)
catboost_test_auc = roc_auc_score(y_test, catboost_test_proba)

print(f"CatBoost - Recall en Entrenamiento: {catboost_train_recall:.2f}")
print(f"CatBoost - Recall en Prueba: {catboost_test_recall:.2f}")
print(f"CatBoost - F1 Score en Entrenamiento: {catboost_train_f1:.2f}")
print(f"CatBoost - F1 Score en Prueba: {catboost_test_f1:.2f}")
print(f"CatBoost - AUC en Entrenamiento: {catboost_train_auc:.2f}")
print(f"CatBoost - AUC en Prueba: {catboost_test_auc:.2f}")

0:	learn: 0.5634787	total: 28.7ms	remaining: 14.3s
100:	learn: 0.0957382	total: 2.39s	remaining: 9.44s
200:	learn: 0.0820141	total: 4.54s	remaining: 6.76s
300:	learn: 0.0754347	total: 6.63s	remaining: 4.38s
400:	learn: 0.0707602	total: 8.67s	remaining: 2.14s
499:	learn: 0.0668613	total: 10.8s	remaining: 0us
Exactitud del modelo en el conjunto de prueba: 0.96
CatBoost - Recall en Entrenamiento: 0.96
CatBoost - Recall en Prueba: 0.94
CatBoost - F1 Score en Entrenamiento: 0.97
CatBoost - F1 Score en Prueba: 0.96
CatBoost - AUC en Entrenamiento: 1.00
CatBoost - AUC en Prueba: 1.00
