# Predicción de Abandono de Empleados (Attrition) - prediccion.ipynb

Este notebook realiza la predicción final del estado de abandono ("Attrition") sobre el conjunto de datos proporcionado para competición. Se utiliza el mejor modelo previamente entrenado (`modelo_final.pkl`), que fue un KNN optimizado mediante validación cruzada.


In [29]:
import joblib
# 1. Importar librerías necesarias
import pandas as pd

## 2. Cargar el modelo entrenado y las columnas utilizadas en el entrenamiento

In [30]:
# Cargar el modelo final
modelo_final = joblib.load("modelo_final.pkl")

# Cargar las columnas usadas durante el entrenamiento
columnas_entrenamiento = joblib.load("columnas_entrenamiento.pkl")

## 3. Cargar el archivo de datos para competición


In [31]:
# Leer el archivo comprimido .csv.gz con los datos de competición
df_comp = pd.read_csv("/content/attrition_competition_07.csv.gz", compression="gzip")

## 4. Codificar las variables categóricas (one-hot encoding)


In [32]:
# Obtener variables dummy
df_comp_encoded = pd.get_dummies(df_comp)

## 5. Alinear las columnas con las del modelo entrenado


In [34]:
# Rellenar columnas faltantes con 0
df_comp_encoded = df_comp_encoded.reindex(columns=columnas_entrenamiento, fill_value=0)

## 6. Hacer predicciones usando el modelo


In [35]:
predicciones = modelo_final.predict(df_comp_encoded)

## 7. Convertir las predicciones a texto: "Yes" y "No"


In [36]:
# Convertir booleanos o enteros a texto
predicciones_texto = pd.Series(predicciones).map({False: "No", True: "Yes"})
predicciones_texto.head()

Unnamed: 0,0
0,No
1,No
2,Yes
3,No
4,No


## 8. Guardar las predicciones en un archivo CSV

In [37]:
# Guardar en predicciones.csv sin índice ni cabecera
predicciones_texto.to_csv("predicciones.csv", index=False, header=False)
print("Archivo 'predicciones.csv' guardado correctamente con", len(predicciones_texto), "filas.")

Archivo 'predicciones.csv' guardado correctamente con 1470 filas.
