# Predicción de Abandono de Empleados (Attrition) - prediccion.ipynb

Este notebook realiza la predicción final del estado de abandono ("Attrition") sobre el conjunto de datos proporcionado para competición. Se utiliza el mejor modelo previamente entrenado (`modelo_final.pkl`), que fue un KNN optimizado mediante validación cruzada.


# 1. Importar librerías necesarias

In [None]:
import joblib
import pandas as pd

## 2. Cargar el modelo entrenado y las columnas utilizadas en el entrenamiento

In [None]:
# Cargar el modelo final
modelo_final = joblib.load("modelo_final.pkl")

# Cargar las columnas usadas durante el entrenamiento
columnas_entrenamiento = joblib.load("columnas_entrenamiento.pkl")

## 3. Cargar el archivo de datos para competición


In [None]:
# Leer el archivo comprimido .csv.gz con los datos de competición
df_comp = pd.read_csv("/content/attrition_competition_07.csv.gz", compression="gzip")

## 4. Codificar las variables categóricas (one-hot encoding)


In [None]:
# Obtener variables dummy
df_comp_encoded = pd.get_dummies(df_comp)

## 5. Alinear las columnas con las del modelo entrenado


In [None]:
# Rellenar columnas faltantes con 0
df_comp_encoded = df_comp_encoded.reindex(columns=columnas_entrenamiento, fill_value=0)

## 6. Hacer predicciones usando el modelo


In [None]:
predicciones = modelo_final.predict(df_comp_encoded)


## 7. Convertir las predicciones a texto: "Yes" y "No"


In [None]:
# Convertir booleanos o enteros a texto
predicciones_texto = pd.Series(predicciones).map({False: "No", True: "Yes"})
predicciones_texto.head()
