In [1]:
# imports
import polars as pl

In [5]:
df = pl.DataFrame(
    {
        "patient": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
        "group": ["a", "a", "a", "a", "a", "b", "b", "b", "b", "b"],
        "score": [6.0, 7.0, 7.0, 3.0, 6.0, 7.0, 9.0, 10.0, 4.0, 8.0],
    }
)
print(df)

shape: (10, 3)
┌─────────┬───────┬───────┐
│ patient ┆ group ┆ score │
│ ---     ┆ ---   ┆ ---   │
│ i64     ┆ str   ┆ f64   │
╞═════════╪═══════╪═══════╡
│ 1       ┆ a     ┆ 6.0   │
│ 2       ┆ a     ┆ 7.0   │
│ 3       ┆ a     ┆ 7.0   │
│ 4       ┆ a     ┆ 3.0   │
│ …       ┆ …     ┆ …     │
│ 7       ┆ b     ┆ 9.0   │
│ 8       ┆ b     ┆ 10.0  │
│ 9       ┆ b     ┆ 4.0   │
│ 10      ┆ b     ┆ 8.0   │
└─────────┴───────┴───────┘


## Group by, summarise

In [9]:
df_grouped = (
    df.lazy()
    .group_by("group")
    .agg(
        pl.mean("score")
    )
    .collect()
)
print(df_grouped)

shape: (2, 2)
┌───────┬───────┐
│ group ┆ score │
│ ---   ┆ ---   │
│ str   ┆ f64   │
╞═══════╪═══════╡
│ b     ┆ 7.6   │
│ a     ┆ 5.8   │
└───────┴───────┘


## Filter

In [10]:
df_filtered = (
    df.lazy()
    .filter(pl.col("group") == "a")
    .collect()
)
print(df_filtered)

shape: (5, 3)
┌─────────┬───────┬───────┐
│ patient ┆ group ┆ score │
│ ---     ┆ ---   ┆ ---   │
│ i64     ┆ str   ┆ f64   │
╞═════════╪═══════╪═══════╡
│ 1       ┆ a     ┆ 6.0   │
│ 2       ┆ a     ┆ 7.0   │
│ 3       ┆ a     ┆ 7.0   │
│ 4       ┆ a     ┆ 3.0   │
│ 5       ┆ a     ┆ 6.0   │
└─────────┴───────┴───────┘


## Mutate

In [13]:
df_new_var = (
    df.lazy()
    .with_columns(
        (pl.col("score") + 0.5).alias("score_adjusted")
    )
    .collect()
)
print(df_new_var)

shape: (10, 4)
┌─────────┬───────┬───────┬────────────────┐
│ patient ┆ group ┆ score ┆ score_adjusted │
│ ---     ┆ ---   ┆ ---   ┆ ---            │
│ i64     ┆ str   ┆ f64   ┆ f64            │
╞═════════╪═══════╪═══════╪════════════════╡
│ 1       ┆ a     ┆ 6.0   ┆ 6.5            │
│ 2       ┆ a     ┆ 7.0   ┆ 7.5            │
│ 3       ┆ a     ┆ 7.0   ┆ 7.5            │
│ 4       ┆ a     ┆ 3.0   ┆ 3.5            │
│ …       ┆ …     ┆ …     ┆ …              │
│ 7       ┆ b     ┆ 9.0   ┆ 9.5            │
│ 8       ┆ b     ┆ 10.0  ┆ 10.5           │
│ 9       ┆ b     ┆ 4.0   ┆ 4.5            │
│ 10      ┆ b     ┆ 8.0   ┆ 8.5            │
└─────────┴───────┴───────┴────────────────┘


## Order

In [14]:
df_ordered = (
    df.lazy()
    .sort("score")
    .collect()
)
print(df_ordered)

shape: (10, 3)
┌─────────┬───────┬───────┐
│ patient ┆ group ┆ score │
│ ---     ┆ ---   ┆ ---   │
│ i64     ┆ str   ┆ f64   │
╞═════════╪═══════╪═══════╡
│ 4       ┆ a     ┆ 3.0   │
│ 9       ┆ b     ┆ 4.0   │
│ 1       ┆ a     ┆ 6.0   │
│ 5       ┆ a     ┆ 6.0   │
│ …       ┆ …     ┆ …     │
│ 6       ┆ b     ┆ 7.0   │
│ 10      ┆ b     ┆ 8.0   │
│ 7       ┆ b     ┆ 9.0   │
│ 8       ┆ b     ┆ 10.0  │
└─────────┴───────┴───────┘


## Rename

In [15]:
df_renamed = (
    df.lazy()
    .rename({"patient": "person_id"})
    .collect()
)
print(df_renamed)

shape: (10, 3)
┌───────────┬───────┬───────┐
│ person_id ┆ group ┆ score │
│ ---       ┆ ---   ┆ ---   │
│ i64       ┆ str   ┆ f64   │
╞═══════════╪═══════╪═══════╡
│ 1         ┆ a     ┆ 6.0   │
│ 2         ┆ a     ┆ 7.0   │
│ 3         ┆ a     ┆ 7.0   │
│ 4         ┆ a     ┆ 3.0   │
│ …         ┆ …     ┆ …     │
│ 7         ┆ b     ┆ 9.0   │
│ 8         ┆ b     ┆ 10.0  │
│ 9         ┆ b     ┆ 4.0   │
│ 10        ┆ b     ┆ 8.0   │
└───────────┴───────┴───────┘


## Join

In [20]:
df_group =pl.DataFrame(
    {
        "group": ["a", "b"],
        "group_name": ["alpha", "beta"]
    }
)
df_joined = (
    df.lazy()
    .join(df_group.lazy(), on="group", how="inner")
    .collect()
)
print(df_joined)

shape: (10, 4)
┌─────────┬───────┬───────┬────────────┐
│ patient ┆ group ┆ score ┆ group_name │
│ ---     ┆ ---   ┆ ---   ┆ ---        │
│ i64     ┆ str   ┆ f64   ┆ str        │
╞═════════╪═══════╪═══════╪════════════╡
│ 1       ┆ a     ┆ 6.0   ┆ alpha      │
│ 2       ┆ a     ┆ 7.0   ┆ alpha      │
│ 3       ┆ a     ┆ 7.0   ┆ alpha      │
│ 4       ┆ a     ┆ 3.0   ┆ alpha      │
│ …       ┆ …     ┆ …     ┆ …          │
│ 7       ┆ b     ┆ 9.0   ┆ beta       │
│ 8       ┆ b     ┆ 10.0  ┆ beta       │
│ 9       ┆ b     ┆ 4.0   ┆ beta       │
│ 10      ┆ b     ┆ 8.0   ┆ beta       │
└─────────┴───────┴───────┴────────────┘
