# Lectura 24: DataFrame - GroupBy

In [None]:
import polars as pl

vuelos = pl.read_parquet('./data/', use_pyarrow=True)

display(vuelos)

### Iterar sobre los grupos luego de un `group_by`

Cuando agrupamos podemos iterar sobre los grupos generados. Cada grupo es representado por una tupla del tipo (nombre, datos).

In [None]:
for nombre, datos in vuelos.group_by('AIRLINE'):
    print(nombre)
    print(datos)

### Varias agregaciones

Para realizar agregaciones sobre un DataFrame primero debemos realizar un agrupado con la función `group_by` y luego utilizar la función `agg`.

In [None]:
from polars import col

vuelos.group_by('AIRLINE').agg(
    col('DEPARTURE_DELAY').sum().alias('sum_retrasos')
)

Calculemos varias agregaciones. Podemos usar `name.suffix` para agregar un sufijo e identificar las agregaciones.

In [None]:
vuelos.group_by('AIRLINE').agg(
    col('DEPARTURE_DELAY').sum().name.suffix('_SUM'),
    col('AIR_TIME').mean().name.suffix('_MEAN')
)

Podemos usar palabras claves para nombrar las agregaciones también.

In [None]:
vuelos.group_by('AIRLINE').agg(
    media_retrasos=col('DEPARTURE_DELAY').mean(),
    suma_tiempo_aire=pl.col('AIR_TIME').sum()
)

### Operaciones sobre grupos

#### Agregar los valores de los grupos en una Serie

In [None]:
vuelos.group_by('AIRLINE').all()

#### Conteo del número de valores de cada grupo

In [None]:
vuelos.group_by('AIRLINE').count()

#### Conteo del número de valores únicos de cada grupo

In [None]:
vuelos.group_by('AIRLINE').n_unique()

#### Obtener el primer y el último valor del grupo

In [None]:
vuelos.group_by('AIRLINE').first()

vuelos.group_by('AIRLINE').last()

#### Obtener las n primeras filas de cada grupo

In [None]:
vuelos.group_by('AIRLINE').head(2)

### Máximo, mínimo, suma, media y mediana de cada grupo

Las funciones `max`, `min`, `sum`, `mean` y `median` calculan el máximo, mínimo, suma, media y mediana respectivamente de cada grupo.

In [None]:
vuelos.group_by('AIRLINE').max()

vuelos.group_by('AIRLINE').sum()

vuelos.group_by('AIRLINE').mean()