In [3]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.metrics import recall_score, f1_score, roc_auc_score
import pandas as pd

df = pd.read_csv('airline_passenger_satisfaction_cleaned.csv')

X = df.drop('satisfaction', axis=1)

# Definir y (la columna objetivo)
y = df['satisfaction']
# Dividir los datos en conjunto de entrenamiento (80%) y prueba (20%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar el modelo RandomForestClassifier
model = RandomForestClassifier(n_estimators=500, max_depth=6, random_state=42)

# Entrenar el modelo
model.fit(X_train, y_train)

# Predecir en el conjunto de prueba
y_pred = model.predict(X_test)

# Evaluar el modelo
accuracy = accuracy_score(y_test, y_pred)
print(f"Exactitud del modelo Random Forest en el conjunto de prueba: {accuracy:.2f}")

rf_train_preds = model.predict(X_train)
rf_test_preds = model.predict(X_test)
rf_train_proba = model.predict_proba(X_train)[:, 1]
rf_test_proba = model.predict_proba(X_test)[:, 1]

rf_train_recall = recall_score(y_train, rf_train_preds)
rf_test_recall = recall_score(y_test, rf_test_preds)
rf_train_f1 = f1_score(y_train, rf_train_preds)
rf_test_f1 = f1_score(y_test, rf_test_preds)
rf_train_auc = roc_auc_score(y_train, rf_train_proba)
rf_test_auc = roc_auc_score(y_test, rf_test_proba)

print(f"RandomForest - Recall en Entrenamiento: {rf_train_recall:.2f}")
print(f"RandomForest - Recall en Prueba: {rf_test_recall:.2f}")
print(f"RandomForest - F1 Score en Entrenamiento: {rf_train_f1:.2f}")
print(f"RandomForest - F1 Score en Prueba: {rf_test_f1:.2f}")
print(f"RandomForest - AUC en Entrenamiento: {rf_train_auc:.2f}")
print(f"RandomForest - AUC en Prueba: {rf_test_auc:.2f}")

Exactitud del modelo Random Forest en el conjunto de prueba: 0.93
RandomForest - Recall en Entrenamiento: 0.91
RandomForest - Recall en Prueba: 0.91
RandomForest - F1 Score en Entrenamiento: 0.92
RandomForest - F1 Score en Prueba: 0.92
RandomForest - AUC en Entrenamiento: 0.98
RandomForest - AUC en Prueba: 0.98
