# 🧪 Preprocesamiento con Label Encoder
#### Variables categoricas ordinales

El LabelEncoder de scikit-learn se utiliza para transformar variables categóricas en valores numéricos. **Es particularmente útil cuando se trabaja con variables categóricas ordinales, donde existe un orden predefinido en las categorías**. El LabelEncoder asigna un número entero único a cada categoría, de manera que las categorías se representan de manera ordinal. Esto puede ser útil al entrenar algoritmos de aprendizaje automático que requieren datos numéricos como entrada, como modelos de regresión o clasificación.

**ATENCIÓN**: Los datos los asignará de 0 a n en el orden en el que están los diferentes valores (de la A a la Z o de menor a mayor)

In [1]:
import pandas as pd
from sklearn.preprocessing import LabelEncoder

In [2]:
# Crear un DataFrame de ejemplo con una columna categórica ordinal
data = {'Categoría': ['A','A','B1','B1','B2','B2','A']}
df = pd.DataFrame(data)

In [3]:
# Inicializar el LabelEncoder
encoder = LabelEncoder()

In [4]:
# Ajustar el encoder a los datos y transformar la columna 'Categoría' en valores numéricos
df['Categoría_codificada'] = encoder.fit_transform(df['Categoría'])

In [5]:
df.sort_values('Categoría_codificada', ascending = False)

Unnamed: 0,Categoría,Categoría_codificada
4,B2,2
5,B2,2
2,B1,1
3,B1,1
0,A,0
1,A,0
6,A,0


In [6]:
# Puedes revertir la codificación también
df['Categoría_decodificada'] = encoder.inverse_transform(df['Categoría_codificada'])
df

Unnamed: 0,Categoría,Categoría_codificada,Categoría_decodificada
0,A,0,A
1,A,0,A
2,B1,1,B1
3,B1,1,B1
4,B2,2,B2
5,B2,2,B2
6,A,0,A
