# Scales

## Categorías (Enumerados de toda la vida)
en pandas, el método astype('category') se utiliza para convertir una columna de un DataFrame a tipo categórico. Los tipos categóricos son útiles para representar variables que pueden tomar un número limitado de valores distintos (categorías). Utilizar tipos categóricos en lugar de tipos de texto (como 'object') generalmente mejora el rendimiento y reduce el uso de memoria, especialmente cuando se tiene un conjunto de datos grande con muchas repeticiones de las mismas categorías.

In [5]:
import pandas as pd
import numpy as np

# Crear un DataFrame con notas aleatorias para 50 estudiantes
np.random.seed(0)  # Para la reproducibilidad
notas = np.random.choice(['A+', 'A', 'A-', 'B+', 'B', 'B-', 'C+', 'C', 'C-', 'D+', 'D', 'D-'], size=50)
df = pd.DataFrame({
    'Estudiante': [f'Estudiante_{i+1}' for i in range(50)],
    'Nota': notas
})

print("DataFrame original:")
print(df.head())  # Mostrar las primeras 5 filas

# Convertir la columna 'Nota' a tipo categórico
df['Nota'] = df['Nota'].astype('category')
df.dtypes

mis_categorias = pd.CategoricalDtype(
    categories=['D-', 'D', 'D+', 'C-', 'C', 'C+', 'B-', 'B', 'B+', 'A-', 'A', 'A+'],
    ordered=True
)

df['Nota'] = df['Nota'].astype(mis_categorias)

DataFrame original:
     Estudiante Nota
0  Estudiante_1   B-
1  Estudiante_2   A+
2  Estudiante_3   B+
3  Estudiante_4   D-
4  Estudiante_5   B+


Importante notar que este orden puesto en la categoria de la columna luego nos servirá para hacer consultas de tipo, dame los alumnos que tenga 